
1996年2月16日,IBM公司的计算机程序员在纽约阿蒙克IBM总部拍下“深蓝”与卡斯帕罗夫之间著名的国际象棋世纪之战
随着AI逐步进军策略游戏领域,人类玩家还有必要继续“负隅顽抗”吗?考虑到AI能够不断从错误中吸取教训、借助一场场比赛提升自身水平,答案恐怕是否定的。更恐怖的是,计算机的对战速度远远超过人类——玩得快、学得更快,这还比什么?
很多人要玩一辈子才能成为扑克高手,但AI没准一晚上就能傲视群雄。这样的基本现实,也给策略游戏世界带来种种变数。
作为一个不断发展的新兴领域,不少朋友对于AI并没有很直观的感受。非技术人员接触AI的一种常见方式就是在线扑克游戏,人类玩家会在其中与AI相对抗。这就引出了新问题:到什么时候,我们才分不清是在跟人玩、还是跟AI玩?
近年来,AI取得了长足进步,并在多款策略游戏中表现亮眼:国际象棋、拼字游戏、围棋以及扑克等等。其战线之辉煌,甚至让人类几乎提不起与之对抗的念头。
例如,微软最新发布的“Libratus”就在比赛中一举击败四位顶尖德州扑克高手,自己连汗都没出。
Libratus是由卡耐基梅隆大学开发的AI程序,在为期20天的匹兹堡Rivers Casino德州扑克比赛中力压四位人类高手。而这一结果,也开启了AI策略游戏探索之路的新方向。
在本文中,我们将探讨如何将AI应用于扑克游戏、AI又会表现出怎样的发展前景。
一项最新研究发现,最出色的电脑扑克选手跟人类一样很擅长虚张声势,Liberatus则用实际行动证明不是一样、而是更擅长。那么是不是在可预见的未来,计算机会在一切策略游戏中都压倒人类?
根据职业扑克选手Jeff Gross的说法,这种可能性确实存在。Gross曾在18年前以50美元作底,一路过关斩将拿下超过500万美元的职业锦标赛收入。Gross对各种赌注极高的游戏都很精通,最近又开始转向内容创作。他在自己的Twitch频道上向80000多名粉丝讲解扑克技巧,播客节目也已经制作了150多集。
作为最顶尖的扑克高手,Gross对这波来势汹汹的AI入侵也有点迷茫。他解释道:“我们可以从两个角度理解这个问题。如果AI能力可以持续增长,那么扑克游戏中最精妙的部分、也就是误导对手的能力,很可能被计算机所超越。但另一方面,由于骗倒机器特别困难,所以跟AI对抗反而非常有趣,甚至未来扑克游戏的对手就可以全都换成AI技术了。以后的巨额资金很可能被交给那些能击败AI的选手,我个人对人类的学习力和潜能充满信心。”
回顾AI技术在策略游戏中的发展历程,我们很容易理解Gross的复杂情绪。上世纪八十年代初,国际象棋世界冠军、也是有史以来最成功的棋手之一加里·卡斯帕罗夫曾经做出一个大胆的预测,即没有任何国际象棋程序能够打败他。加里在1989年两度击败了IBM的国际象棋AI“深思”(Deep Thought)。几年之后,卡斯帕罗夫又在多局赛中击败了深思的继任者深蓝。但很遗憾,他在与深蓝的复赛中创下另一项纪录——成为第一个被国际象棋AI击败的世界冠军。
图:Jeff Gross
从那时开始,AI逐渐在策略游戏中占据了主导地位。快进到2019年,当时的世界卫冕冠军Magnus Carlsen在与最强国际象棋程序的100场对弈中一场未胜。可以说从1946年的图灵到现在,人类终于创造出了接近完美、甚至可以说已臻完美的国际象棋AI。
而扑克游戏的攻克,代表这段旅程又前进了一步。自1984年以来,AI开发者一直高度关注德州扑克游戏。那一年,Mike Caro开发出一款名为Orac的基础扑克AI软件,并带着它参加了世界扑克大赛。
根据最近公布的信息图来看,从Caro的Orac到卡耐基梅隆大学的Liberatus,扑克AI实现了长足发展。Gross则对扑克AI的强劲发展势头毫不意外。
“AI能这么强并不奇怪。这些程序已经通过分析数百万甚至数万亿手牌识别出几百万种不同的策略。在与人类对手打牌时,AI可以轻松识别出对方的策略并建立起能够胜出的机制。双方都可以虚张声势、也都可以用梭哈震慑对手,但人类的诱导能力仍然有限,因为钱对我们来说有意义。但AI会对每个人都采取威压策略,并通过混合策略让对手更难摸清它的真实意图。”
而且事实上,AI并不懂得如何虚张声势、至少跟人类选手的虚张声势并不相同。AI只是在训练中逐渐意识到,即使自己手头的牌不怎么强、仍然可以通过持续跟注赚取回报。它会不断遇到类似的情况、持续加深自己的这种认识,这样的可能性也让AI在扑克游戏中占据了对人类的比较优势。于是,AI相对不易受到虚张声势的影响、而且并不害怕过度跟注。
Gross认为,未来的扑克游戏会迎来几条演变分支:跟AI国际象棋程序类似,未来的扑克游戏也会发展出AI对AI的比赛,人类选手则继续跟自己的同类对抗;或者,也可能出现某些混合赛事,由最高水平的人类在扑克等策略游戏中尝试挑战AI。
如今,Gross预测的第一部分已经在国际象棋领域成为现实。国际象棋已经发展出一套强大的AI储备池,其平均棋力等级已经远远超过人类选手。目前AI世界冠军Stockfish 9的棋力ELO评分为3438,远远高于人类世界冠军Magnus Carlsen的2845。
Gross也很能理解AI开发者为什么会对扑克及其他策略类游戏充满兴趣。用他的话说:“据我了解,AI的终极目标就是帮助人们解决日常生活中经常出现的问题。类似扑克游戏,我们能看到的只有一些不够全面的信息。AI需要解决的问题,都在扑克游戏中有所映射。所以从乐观的角度出发,扑克游戏正在训练AI、让它的智能水平持续提升。这也侧面证明了扑克游戏自身的精妙与复杂。”
Gross的观察完全正确,AI开发者确实希望达成这样的目标。策略游戏并不是目的,只是一种手段。世界冠军们也不必介意输给AI程序,毕竟只要这样能推进AI技术的发展,那么他们自己也能在手机上享受到AI带来的便利功能——例如帮他们快速试探出对方能接受的底价。
可以说,AI技术的志向要宏大得多。我们正迈进一个崭新的AI世界,为了让这个世界真正如想象般美好,每个人都需要忍耐路途上的一点颠簸。你说呢?
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。