
道奇队的球迷苦苦等待了32年才见证这支队伍重新拿下世界大赛冠军。这32年之间,棒球运动无疑发生了巨大的变化。随着大量数据的涌现、先进的计算机与分析技术,如今基于数字的策略制定已经成为体育领域的核心力量。具体而言,AI(人工智能)正在主导其中的决策流程。
在本届棒球世界大赛第六场比赛上,这种决策影响力得到再一次证明。当时,坦帕湾光芒队经理Kevin Cash毅然换下了当时在场上表现完美的投手Blake Snell。
Cash的决定似乎确实来自数据,但他的判断并未奏效。最终,道奇队在这场比赛中以3-1战胜了光芒队。
从这个角度来看,数据分析带来的不只有惊喜,同时也有风险与挑战。
带着这个问题,采访了AI领域的几位顶尖人士,下面来看他们的回应:
Sheldon Fernandez, Darwin AI公司CEO:
只有马后炮才能百分之百命中,但Cash临时决定换下Snell的举动确实说明将分析结果凌驾于常识判断之上可能带来的问题。在人工智能领域,我们有时会讨论“混杂变量”。这类变量掩盖了影响因素之间的正确关系,导致由纯数据驱动的决策效果受到影响。以本场比赛为例,数据本身也许表明Snell的自责分(ERA)要比替补队员Anderson更高,但其中还有某些样本量或者其他趋势性因素未能得到充分考虑。
当然,“直觉”本身也有严重的弊端。Terry Collins也做出过不够明智的决定——在2015年世界大赛第5场第9局的比赛中坚持让Matt Harvey上场。大都会队的球迷后来为此抱怨了好几年,并认为正是这项错误决定导致他们将冠军拱手赠予堪萨斯城队。
再有,即使是单从分析的角度出发,这项决定也同样难以理解:Snell当时状态正佳,而替补投手在过去五场比赛中都表现不佳。事实上,Cash回到替补席后,道奇队的替补们明显都松了一口气。这不禁让我想起一句格言:“分析的意义在于指导决策,而不是替你做出决策。”
Kathy Brunner, Acumen Analytics公司创始人:
击球手Corey Seager在过去整个赛季对左利手球员保持着0.218的得分,如果单从数字来看,那他就是一位过去6局比赛中打出73个好球的神人。但单从之前两周来看,他又连续6击未能得分。这两项数据哪个更准确?其实都不准确,也可以说都准确。棒球比赛本身就充满变数,随着数据的持续积累,当前赛季的赛场表现将被逐渐冲淡。面对类似的情况,坦帕湾光芒队明显认为整个赛季的数据比以往几场比赛的数据更重要。事实证明他们判断有误,相信在新一年中他们会重新调整模型,努力做出更准确的预测。
Tim Baumgartner, Laughlin Constable公司分析副总裁:
魔球理论彻底改变了棒球运动。事实证明,精打细算的普通球队确实可以利用数据分析的力量充分发挥自身优势,利用科学的阵容与各大传统强队一较高下。
但棒球运动本身既是科学又是艺术。体育竞技不是冷冰冰的电子表格,坦帕湾队的数据策略告诉他们,首发投手在第三次面对对方击球手时往往表现不佳。整个棒球大联盟的数据支持这一结论,不少球队也将此作为不容置疑的真理。
但在第6场冠军争夺赛中,这支由数据驱动的球队无疑过分依赖这一策略。他们的固执与僵化,最终让自己的领先优势与冠军希望付诸东流。
要说教训,球队们应该反省如何以及何时将定性与定量两大方法结合使用。更重要的是,传统强队也在利用自己的丰富资源进行同样的分析,所以未来的对抗除了球员自身以外、也将体现在谁对数据趋势吃得更透方面。
Omri Orgad, Luminati Networks公司北美地区总经理:
就像是《回到未来》里的场景,我们只能在现实中看到一个结果。但必须承认,数据分析本身仍然只是一种统计工具。虽然某些决定看似能够增加光芒队的获胜几率,但其永远不会是100%的保障。我们不应粗暴忽略其他选择:(1)Snell留在场上,光芒队仍然落败;(2)Snell留在场上,光芒队获胜。
数据与分析是管理人员的工具,但如何使其发挥积极作用——包括将光芒队送上冠军宝座,则是一项严峻的挑战。毕竟最终赢下比赛的只能是球员,而不是这些数据。
Michael Berthold, KNIME公司联合创始人兼CEO:
本轮比赛带来的教训其实很简单:使用大量数据点得出的决策,并不适合用于预测独立事件的未来走向,特别是像棒球世界大赛这类要么赢、要么输的有限结果场景。这类预测指向的只是几率,而非确切结果。
Cash先生可能掌握着大量统计数据,所以他的决策能够提高球队的获胜几率,但也就仅此而已。很遗憾,事情的走向与他的预期不同,进展不太顺利。但如果继续关注数据,他整个职业生涯中赢下的比赛肯定比其他只靠直觉的人多。如果放眼于未来十年,相信他仍然是一位非常成功的职业经理人。
Saif Ahmed, Kinetica公司机器学习产品负责人:
随着我们将分析技术应用于更多现实场景,大家必须消除对于数据科学可预测性问题的普遍误解。与其他科学方法一样,数据分析也是通过可重复的实验检验自身假设,而后生成关于几率的统计信息。注意,只是几率而非统一结果。如果Kevin Cash单凭数据模型做出决策,即使影响因素与他的模型完全匹配,成功的几率也仍然只是个统计数字——换言之,就算高达99%,实际结果也很可能落入余下这1%。归根结底,大家之所以热爱体育竞技,就是喜欢其中那种不可预测的魅力。
数据科学在这方面起不到决定性作用,但这并不影响我们将其作为值得依赖的好伙伴。我们可以质疑任何单一决策模型,但只要模型中的特征合理且能够准确反映过往情况,就应该把它纳入置信范围。另外,模型的透明度是关键,我们应该有能力观察模型使用了哪些变量。如果单一模型做出的决策值得怀疑,那么我们应该把握机会,重新审视模型本身并引入更多变量以准确捕捉决定性因素。与其他科学实验一样,数据科学也应该是一个动态的迭代过程。
Joe DosSantos, Qlik公司首席数据官:
我们这个行业很难单纯依靠数据分析,而体育行业似乎在这条路上走得太远、太急了。Cash换下Blake Snell只是体育领域“神奇”决策的又一次例证。美国橄榄球联盟球队陷入“让分”魔咒,AWS发布商业广告的决策流程也几乎没人能够理解……这一切,都让数据分析逐渐沦为一种玄学。
魔球理论确实存在,但要在162场比赛这样庞大的样本空间内才能奏效。统计学很重要,但心理学也同样重要。粗暴换下Snell虽然在数字层面有其意义,但却给粉丝和球员们带来严重的心理打击。过度依赖数字,不仅可能丢掉比赛,更可能丢掉人们的理解与支持。
好文章,需要你的鼓励
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。
南洋理工大学与腾讯联合研究团队开发出Rolling Forcing技术,实现AI视频实时流式生成的重大突破。该技术通过滚动窗口联合去噪、注意力锚点机制和高效训练算法三项创新,解决了长视频生成中的错误累积问题,可在单GPU上以16fps速度生成多分钟高质量视频,延迟仅0.76秒,质量漂移指标从传统方法的1.66降至0.01,为交互式媒体和内容创作开辟新可能。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。