(本文作者为 霞光 AI 实验室,钛媒体经授权发布)
文 | 霞光 AI 实验室,作者|朱峰琳,编辑|刘景丰
佛得角,一个人口不足 60 万、国土由十座火山岛屿组成的西非岛国。国家队球员分散在欧洲多国低级别联赛,每逢比赛日从各地赶回,在有限的硬件条件下完成集训,合练时间也被压缩到极限。
就是这样一支队伍,历史上首次闯入世界杯正赛。而他们在 16 日的小组赛中面对的,是拿过世界杯冠军、坐拥顶级球星、战术体系成熟的西班牙。
实力相差悬殊,几乎没有人相信佛得角能改变什么。
然而,终场哨响,所有人都愣在了原地—— 佛得角 40 岁门将沃齐尼亚,用七次精彩扑救守住球门,愣是把比分定格在 0:0 上,强悍的西班牙队,在 90 分钟内竟然没有进一球。
从纸面实力上看,西班牙赢球是板上钉钉的事,这样的共识,也反映在了由联想集团与咪咕视频联合发起的“ 世界杯预测人机大战” 中。赛前,DeepSeek、Kimi、文心一言、通义千问、中移九天等 12 家国内主流 AI 大模型均对这场比赛做出了预测——11 家押注西班牙,1 家押注佛得角。最终平局的结果,也意味着所有 AI 的预测全部落空。

西班牙 VS 佛得角,AI 预测结果
类似的情况在 14 日巴西 VS 摩洛哥、18 日葡萄牙 VS 刚果两场比赛中也同样上演。前一场,12 个 AI 集体预测巴西获胜,结果却是 1:1 摩洛哥顽强逼平巴西。后一场,AI 的预测结果与西班牙 VS 佛得角时相似,11 家模型看好拥有 C 罗的葡萄牙,1 家选择刚果,比赛同样以 1:1 的平局告终。

巴西 VS 摩洛哥、葡萄牙 VS 刚果,AI 预测结果
5 天时间,3 场爆冷,连续 3 次 AI 出现集体翻车。
5 天前,大模型预测世界杯还成为科技媒体的热门新闻。然而现实的结果,似乎有意给 AI 开一个大玩笑。
稳赚不赔的流量狂欢
世界杯还未开赛,场外的“ 世界杯预测人机大战” 就已拉开序幕。这场大战由联想旗下自研的天禧 AI 超级智能体作为总召集者,汇聚了国内 12 家主流大模型,共同组成了“AI 预测天团”,对本届世界杯全部 104 场比赛进行逐一预测。预测结果一出,围观者的兴致也被挑了起来。人们既好奇 AI 的预测准确率究竟有多高,也想亲自下场和 AI 比试一番。

只不过,大多数参与预测的模型只是抱着参与的态度走个过场。毕竟在世界杯预测这种纯娱乐场景下,AI 的容错率几乎是 100%。猜中了可以宣传技术强大,猜错了则是足球不可预测的魅力,也不会有人因为 AI 猜错了而苛责什么。对任何一家 AI 公司而言,这都是一次零风险、高曝光的好机会。只需要提交比分数据,就能把产品名字和世界杯绑定在一起,出现在各大媒体的报道中。至于预测本身准不准,反而没人真的在意。
不过,千问和 Kimi 似乎并不想只做那个走个过场的参与者,而是想要把这波流量吃透。在参与联想活动的同时,它们还各自在自家产品端加码推出了针对普通用户的互动玩法,将人机大战从专业预测的层面拉到了大众广泛参与的新高度。
背靠阿里的千问,显然在互联网营销方面更有经验一些,在主页直接上线了世界杯预测专区“ 美加墨”。并设置了真金白银的奖品诱惑,100 个万元现金红包、1000 个千问 AI 眼镜,还引入了积分机制,用于向贫困地区学校捐建足球场。

千问美加墨世界杯预测活动奖池
根据千问活动规则显示,用户每预测正确一场就会获得 100 积分,当所有用户参与预测的总积分每累积达到 5000 万分时,千问就会捐建一片足球场。截至 6 月 18 日早上,开赛仅仅 7 天,网友就已经通过参与预测成功解锁了 3 片场地,也就是说用户参与预测正确的场次高达 150 万场。
虽然现金奖池、实物奖品,以及随积分累积不断追加的公益捐建,都是一笔不可忽略的投入,但对于阿里而言,世界杯带来的品牌曝光和用户活跃度提升的价值,远远超这些成本。这场世界杯预测本质上和之前的“ 千问请客” 其实遵循的都是相同的商业逻辑—— 用足够有吸引力的激励换取用户的大规模参与和数据贡献,在短时间内快速提升产品的市场声量和用户规模。
与之相似的,是 Kimi 推出的预测世界杯冠军队、抢夺万亿 Token 新玩法。用户可选择一支队伍作为自己的应援主队,选定后不可修改。每当这支队伍赢得一场比赛胜利,用户就可以获得一次抽奖机会,每人最高可获得 10 亿 Token。这种押注机制将用户的“ 收益” 与球队战绩深度绑定,极大地刺激了用户的持续关注和反复登录。

此外,Kimi 还高调宣布将调度 300 个子 Agent 组成“Agent 集群”,对全部赛事进行逐轮预测和复盘。这 300 个 Agent 分工明确,分别负责分析球队实力、攻防数据、战术风格、球员伤病、赛程环境、赔率波动、舆情心理等不同维度,最后由中央调度器汇总并输出结果。这套听起来精密而专业的技术架构,也让 Kimi 向外界展示出了极强的技术形象。
然而,不管是通用大模型的结果直接输出,还是 Kimi Agent 集群的精密推演,都没能逃过在爆冷场次上集体翻车的结局。
其中的原因并不复杂。人类球迷预测比赛时,是能脑补出画面的,比如某个球员最近几场跑动明显懈怠,某支球队的防守硬度在密集赛程下已出现松动,这些具体的、带有时间感和空间感的判断,来自长期的观赛积累和直觉。
但 AI 的世界里没有球场,它只是一个处理文字的工具。有时预测出某支强队获胜,并不是因为它在后台构建了一个真实的球场进行了推断预测,而是因为在它学习过的海量文本里,可能识别到这支强队和获胜这两个词总是高频地同时出现,便基于文字共现的统计规律,判定该球队应该获胜。

AI 并不懂足球,它懂的只是文字规律和数据分析。而用文字规律去推测体育竞技的结果,本身就是一种错位。
这种错位在西班牙对阵佛得角的比赛中暴露得格外明显。赛前,千问给出了一个毫无保留的判断:结果没有悬念,悬念只在于赢几个,笃定地押注西班牙。而终场哨响,佛得角以 0:0 顽强逼平西班牙。

或许,这些 AI 公司真正在意的并不是预测结果的准确率,而是这四年一度的顶级赛事所裹挟的泼天流量—— 用可控的成本,完成一次覆盖全网的品牌曝光,让产品名称尽可能多地出现在公众视野里。
说到底,这场“ 人机大战” 的真正战场,从来就不在球场上,也不在算法的精度里,而在用户的手机屏幕和社交媒体的信息流中。谁的 AI 能在这一个月的时间里里占据更多用户的视线和时间,谁就是最大的赢家。
AI 算不出人的极限
由于国足没能进入世界杯正赛,在国内世界杯预测便成了全民娱乐的一种方式。没有主队可追,反而让人们可以更加纯粹地去琢磨比赛本身。但无论是老球迷,还是在手机屏幕前凑热闹的普通观众,大多数人在赛前的判断结果其实和 AI 差不多,很多时候也会更愿意相信强队。
不过人与 AI 的区别就在于,人的判断来自多年的观赛经验,同时也是情感投射的结果。一个球迷的预测里,掺杂着太多无法被数据解释的东西,比如对某支球队由来已久的偏爱,对一位迟暮老将圆满结局的深切期许,又或是期待顶级球星之间的正面较量。
就像最近人们热议的梅西与 C 罗能否在世界杯赛场上首次交锋,便是这种心态的典型写照。现如今,梅西已经快 39 岁,C 罗更是到了 41 岁,这很可能是他们最后一次踏上世界杯的舞台。人们所期盼的赛场相遇,也早已经超越了胜负本身。这些主观因素虽然不理性,却是人类决策中极其自然的一部分。竞技体育的魅力,某种程度上也恰恰源于这种非理性。
而 AI 的决策逻辑完全建立在数据和算法之上。它没有情感,没有立场,也不关心哪支球队的故事更打动人心。它所遵循的,是一种为追求低错误率而设计的概率逻辑。当系统被要求给出具体的比分预测时,它的计算模型会在庞大的历史数据中寻找一个最不可能出错的标准答案。
面对实力悬殊的比赛,AI 几乎不会押注弱队,因为从数学概率上看,强队获胜是最安全的选择。AI 没有主队,没有身份认同,甚至没有“ 爆冷” 这个概念。它只是把问题当作一道统计题来处理,在庞大的历史数据中寻找一个得分率最高的客观数字,然后把它填在答卷上。
AI 只会屈服于冷冰冰的概率,而人类则不然。人们对体育的狂热,往往是建立在那些打破常规、推翻概率的瞬间,本质上其实是渴望见证人类不断逼近身体与精神极限的过程。
足球场上 90 分钟的时间里,球员们在高温下完成十几公里的奔跑,在对抗中承受着巨大冲击,在体能接近透支时依然要保持清醒的头脑做出判断。当一支实力远逊于对手的球队咬牙撑到最后一刻,当一名老将在体能枯竭时依然全力回追,当一群不被看好的年轻人用整体协作去弥补个体能力的差距,这些瞬间之所以让人热血沸腾,正是因为球员们所呈现的是人类身体和精神所能抵达的边界,而这条边界正在被一次又一次“ 打破不可能” 中被拓宽。这种竞技体育所独有的特质,也恰恰是 AI 无法触及的空白地带。
AI 可以算出强队获胜的概率,却算不出弱队在绝境中迸发出的能量。每一次的爆冷,表面上看是 AI 概率预测的失灵,实际上是人类在挑战不可能时交出的答卷。
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App















