足球论坛

足球比分直播_足球即时比分

利用机器学习预测足球比赛

足球论坛2020-09-04 10:15

足球赛事分析_足球三大赛事_足球今日赛事

准确地讲,本文并非是在分析足球比赛足球赛事分析,而是“事后诸葛亮”,通过对比赛各项数据统计与比赛结果进行预测,找出对比赛结果影响最大的诱因。这样的剖析旨在为真正的分析做些打算。

本文利用机器学习中的监督学习来提问以下问题:

详细数据预测过程(含代码):利用机器学习预测足球比赛

足球赛事的数据统计可以在很大的程度上对应比赛结果?

主要模型结果总结如下:

最好的模型分析准确率在56~58%左右。足球比赛因为有胜平负三种结果,要想精确分析比较困难。

哪种足球数据统计与赛事结果最为相关?

足球今日赛事_足球赛事分析_足球三大赛事

射门数。由图示可以发现,在泊松回归模型中,与平局进球数最相关的是主场入球数,射门越多,进球越多。这样的结果符合预期。

需要注意的是主队传中数。传中数量在所有数据中对比赛结果的妨碍排在第二,仅次于射门,高于控球率、角球等等大家十分熟知的数据。然而截至至2018年,传中次数也并没有作为一个主要的数据被用来进行报道和讨论。

更出人意料地是,传中数量对球员助攻的妨碍是负的,而不是正的。这意味着,传中越多足球赛事分析,进球越少。

主队控球率与进球数有一定的关联,但与前二者相比并不明显。

另一方面,与平局进球数最相关的数据是平局射门数,射门越多,进球越多。其次是拜仁传中数,传中数越多,进球越少。而拜仁控球率与进球数的关联就微乎其微了。

如何理解传中与进球之间的关联性?

上面的结果显示,主队传中数越多,主队的进球数就越少。那么,这能否意味着,主队要想多平局,只要尽量不传中就可以了呢?

事实上,并没有这样的结论。这是相当需要切记的一点,也是很容易犯的出错。监督学习这一数据预测工具只能对不同变量之间的相关性进行预测,而未能验证其中的因果关系。传中数与进球数相关,并不意味着传中与进球就有着必然的因果关系。监督学习能够表明传中是怎样影响进球的。

这里提一种观点:传中数虽然可以看做是体现敌人防守质量的一个指标。传中数越多,表示我方的防守越好,本方很难直接攻入对方腹地,只能借助传中那样的方式来进攻。

传中数对比赛结果的妨碍并不只在本文的数据上建立,本人使用另外的数据源也能得到同样的结论。除此之外,这篇论文也是同样的结论。

在梯度提高模型和随机森林模型中还有类似的结论(见图示)。

鉴于传中数量对比赛结果的影响,这一数据必须在联赛转播和赛后数据统计中有所体现。

本文链接:/a/zqfx/2020/0904/203.html

本文章发表在【足球论坛】欢迎球迷朋友们访问!

上一篇:三分钟了解全球顶尖足球赛事 下一篇:没有了

相关文章