2022年卡塔尔世界杯决赛中,阿根廷队以1-0击败巴西队,梅西打入唯一进球,帮助阿根廷队自1986年以来首次夺得世界杯冠军。
整个世界杯,梅西7场比赛打进8球,获得金靴奖(进球最多)和金球奖(最佳球员)。巴西队和法国队分别获得亚军和季军。
FIFA 23预测结果丨图片来自官网
出色地?那是不对的!世界杯不是才刚刚开始吗?而阿根廷刚刚输了!
以上结果是用足球游戏《FIFA 23》模拟的。但是很多球迷都买账了。 FIFA游戏已经成功预测了过去三届世界杯的冠军。难怪它的制作方EA扬言大家不用看世界杯了,因为它已经被“宠坏”了。
你会发现,每次有世界杯这样的比赛,各种“预测”都变得复杂起来,比如AI、大型模型、高科技(也有低科技的,还记得章鱼保罗吗?)。 ..
为什么这些“先知”如此“自信”?
哪些因素决定预测结果?
近年来,包括足球在内的大多数体育比赛都使用传统的统计和机器学习方法来预测结果。预测机构将从球队过去的比赛中收集数据,并根据可能影响比赛的因素构建数据。结合博彩公司的盘口和赔率,利用机器学习算法进行建模,最后运行出结果。
常用的算法有“随机森林”,常用于营销、医疗保险等领域的计算。简单来说,这个系统需要建立一个“森林”,其中种植许多“树”(通过子样本集训练)。当新的输入样本进入时,每棵树都会被单独预测,给出自己的答案。然后通过“民主投票机制”(如平均等)得出结果。
另一种常用的方法是“泊松分布”,用于模拟连续时间内离散事件出现次数的概率分布。现实生活中,很多场景都与“泊松分布”有关,比如电子商务网站在一定时间内的点击率;放射性元素每秒衰变的粒子数;工厂机器人的故障频率等。应用于足球比赛中,可以根据历史数据得出各队的攻防实力来预测球队的得分概率。
机器学习是从现有数据中发现和学习潜在模式的过程丨图片来自Giphy
然而,复杂的机器学习模型将根据所包含的数据特征使用多种算法。
有国际研究团队看好阿根廷队今年世界杯的劲敌巴西队。首先,他们做了球队实力的统计模型,根据过去八年的国际比赛数据,利用泊松分布算法估算了球队目前的能力。但这并不是对过去“记录”的平均计算。越近的比赛结果就越重要。未来强度估算还包括 28 家国际博彩公司的赔率。结合更多的数据维度,球队市值、FIFA排名、球队结构代表的球队特征以及人口和人均GDP代表的国家特征,构建了随机森林模型。
这支球队给出的最终结果是巴西队以15%的胜率夺冠,其次是阿根廷队、荷兰队、德国队和法国队。
数据维度的选择很重要。数据量和数据维度可能会导致截然不同的预测结果。 FIFA排名等数据维度很容易理解。但为什么许多预测模型都包含社会经济因素呢?
英国投资银行Liberum Capital分析师约阿希姆·克莱门特(Joachim Klement)曾成功预测2014年和2018年世界杯冠军,他以“人均GDP”为例:一个国家不能太穷。想要培养足球人才,基础设施和足球场是必不可少的;但如果国家太富裕,孩子们除了足球之外就会有太多的运动选择。
“人口”因素只在足球为主导文化的地区发挥作用,例如拉丁美洲。 2018年世界杯亚军克罗地亚,总人口只有400万。它是欧洲的一个小国,但整个国家的足球系统都在青训方面投入巨资。
社会经济因素也会影响足球比赛的结果丨图片来自Giphy
(国家的)天气也是一个重要因素。太热或太冷都不算有利(看看东道主卡塔尔队就知道了),理想的气温是14°C,大致相当于南欧和南美洲大部分地区的年平均气温。这样看来,除了英格兰(1966年)和德国(1964年、1974年、1990年、2014年)之外,历届世界杯冠军都符合这一点。
最难衡量的是“主场优势”。这可能是一个更熟悉的场地,来自家乡的球迷欢呼,甚至是“主场哨声”。到目前为止,只有卡塔尔作为东道主输掉了揭幕战——这说明主场优势虽然难以解释,但其影响却是实实在在的。
机器学习是从现有数据中发现和学习潜在模式的过程。判断一场比赛结果的依据确实和历史表现有很大关系。
但所有预测模型都会添加提醒:“不能保证~”
科学还是形而上学?
足球比赛中,有太多意想不到的因素决定胜负。
由于卡塔尔夏季气温较高,世界杯不得不推迟到冬季举行。这一下子打乱了国足联赛的赛程,让球员们难以适应。 “各国家队备战时间较少,压缩了球员世界杯前的恢复时间,再加上卡塔尔的气候条件,增加了球员受伤的风险。”此前对巴西夺冠持乐观态度的研究机构表示。
大多数预测者都有类似的感觉。由于准备和磨合的时间较少,依靠配合取胜且球员均衡的球队,如西班牙、德国,优势较小。对于C罗、梅西这样个人能力突出的运动员来说,影响相对较小。但另一方面,对于他们的年龄来说,身体疲劳将成为影响比赛结果的重要变量。
梅西丨图片来自Giphy
体育数据提供商Opta看好巴西,给出的获胜概率为15.8%,高于阿根廷(12.6%)和法国(12.2%)。但就在今年6月,他们仍然坚称法国队是夺冠热门。他们给出的“改口”理由是,法国队的士气和团队合作经历了周期性下滑,这显然来自于最近的观察。因此,在预测这样的事情时,时间越接近,准确度就越高。
即使直到比赛开始,预测仍然在变化。大数据公司 FiveThirtyEight 有一个“SPI Index”(足球强度指数),可以对每场比赛进行提前预测。不过,比赛的实时动态也会被他们考虑在内,实时计算出两支球队在剩余时间内可能的比分——如果你平时关注一些时下的欧洲联赛,转播画面上会出现这样的情况:已经有了对比赛结果的实时预测。
他们举了一个例子。 2014年,巴西对阵克罗地亚。赛前,根据过去的SPI,模型给出巴西队获胜的几率为86%。比赛第11分钟,巴西后卫不幸打进乌龙球,将对方的射门踢进自家球门。巴西0-1落后。
随即,模型调整了比分预测,计算出巴西仍有机会翻盘获胜,概率为58%。根据以往的观察,他们得出了一个结论:一开始暂时落后的优秀球队往往能够激发出潜力,以更大的比分优势获胜。团队越好,“戏”就越大。
于是他们再次调整了现场比分预测,认为巴西队获胜的几率为66%。最终战绩是3-1,还是比较准的。
这种加入“实时计算”的模型比单纯的“AI发现模式”更加准确。但足球比赛真的可以“预测”吗?
AI依靠大数据构建机器学习模型,给出看似最有可能的结果,给人们一个“买单”的理由——让数据自己说话。
“即使使用最先进的统计技术,预测仍然高度不确定,因为足球是一项不可预测的运动。”这是高盛在撰写2018年世界杯预测报告时所说的。换句话说,分析师们绞尽脑汁算出的预测和赔率,乍一看,并不像“章鱼保罗”那么可靠。
一半科学,一半玄学丨图片来自Giphy
“保罗”预测胜负的方式是选择一个印有代表不同球队旗帜的玻璃缸,并取出玻璃缸中已放入的贝壳。 2010年南非世界杯,保罗猜对了8次,其中包括西班牙击败荷兰夺冠的决赛。相比之下,众所周知的“乌鸦嘴”足王贝利却屡战屡败。
章鱼保罗丨图片来自东方IC
科学还是形而上学?这毫无意义。
卡塔尔当地的一名猎鹰人用猎鹰预测了卡塔尔与厄瓜多尔之间的世界杯揭幕战。他将卡塔尔和厄瓜多尔的国旗绑在两架无人机上,然后将食物绑在旗帜上。然后让猎鹰飞翔,看看它会选择哪面旗帜。结果,看到猎鹰飞翔,但它越过了卡塔尔国旗,最终选择了厄瓜多尔国旗。
在高度随机性的体育赛事中,从来不存在“一定准确”的预测方法。当比赛结果与权威甚至大多数人的判断不一致时,我们只能愤慨地说:“这不科学!”
而这也是体育竞技的乐趣之一。
参考
[1]
[2]
[3]
[4]%2F20221122%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-日期=20221122T000000Z&X-Amz-过期=86400&X-Amz-签名=2b7c6dc7e88e4f154c44bf28c793857052dd114621ca332f5e72979eaf11db87&X-Amz-SignedHeaders=主机
[5]
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:http://zitiba.com/html/tiyuwenda/7147.html