CNET科技行者 2月13日 北京消息 YouTube播主Einfach nerdig启动了一套直播AI,并教导其如何玩《超级马里奥兄弟》。
这套名为MarI/O的AI由SethBling打造而成。他也是YouTube上的游戏视频作者,曾成功破解了SFC游戏《超级马里奥世界》,并将其成功的与《Flappy Bird》结合在一起,诞生了一款复古风的“飞翔的马里奥”。
虽然SethBling自己也一直在持续关注,但他并没有通过自己的频道进行AI训练直播。
作为《超级马里奥世界》通关世界纪录的保持者,SethBling此前曾通过为MarI/O提供自己进行此游戏的素材以训练其学会如何玩这款作品。正如他所解释的那样,他的神经网络在事先对游戏毫不知情的前提下开始学习。最终,通过一系列模拟(大部分看起来似乎没有任何作用),该AI学会了如何向右移动。而在二十四个小时之后,AI已经了解到充足的操作排列组合,并成功完成了一个关卡。
然而,观看AI不断重复游戏内容并尝试从中找到技巧则是另一种完全不同的体验——在屏幕前观看这一切会令人身陷一种奇妙的舒缓状态。
就目前来讲,该AI学习《超级马里奥兄弟》的过程其实有点可怕。我们看到该系统会一次又一次尝试同样的世界与同样的关卡,旨在顺利通过终点。而当其逐渐找到窍门时,AI终于有了点游戏玩家的意思——事实上,它可能在下一次玩游戏时学到一些新的技巧。但在绝大多数情况下,AI的智商感觉跟一袋石头基本相当。AI可能是在根据一定的条件来控制马里奥的跳跃高度与距离,因此当这位最著名的水管工遇到障碍物时,其很可能会被卡住。这时就需要进行手动重置,而后由AI再次进行尝试。
如果你知道要如何让马里奥跳过这个管道,那么恭喜——你比机器更聪明。
根据视频下方的计数器,该AI的《超级马里奥兄弟》游戏时长已经超过17天——其实很多游戏玩家在休假时也会这样全身心投入到游戏当中。但其中的主要区别在于:它不会消耗多乐滋与啤酒。
SethBling 可能并不是第一位用任天堂游戏来训练机器的人,但他却成为这波新浪潮中的重要组成部分——换言之,他将“机器学习算法”这种无聊的事同YouTube娱乐平台联系了起来。而且,即使大家完全不清楚什么是“深度学习”或者“神经网络”,视频的观看体验同样可以既有趣又带感。
又卡住了——跟Derek Zoolander(本·斯蒂勒,美国著名喜剧演员、导演、制片人)一样,这个AI也不知道要左转。
好文章,需要你的鼓励
现代大语言模型就像一栋拥有数百个房间的豪华大厦,每个房间(或称为"层")都执行特定的功能,共同协作完成复杂的语言理解和生成任务。然而,这些模型的规模已经变得如此庞大,以至于只有拥有高端计算资源的机构才能负担得起它们的运行成本。这就像一辆耗油量极大的豪华跑车,普通人负担不起它的燃料费用。
想象一下,当你在解答一道复杂的数学题时,你不仅需要给出答案,还需要详细解释每一步推导的理由,不能有任何逻辑跳跃或假设——这就是形式化数学推理的严格要求。
想象一下日常生活中我们使用的语音助手,比如Siri或ChatGPT。它们通常是这样工作的:你问一个问题,它回答,然后安静地等待你的下一个指令。这就像是一个只会被动回应的服务员,永远等待你的呼唤。而Voila团队认为,真正高级的AI助手应该更像一个时刻准备着的好朋友或队友,能够自然地融入你的生活节奏中。
想象一下,你正在参加一场料理比赛,有两位评委。第一位评委只给你一个分数,而第二位评委会详细解释你的菜品在口感、创意和技巧上的表现如何,然后才给出最终评价。显然,第二位评委的反馈对于你改进厨艺更有帮助。伊利诺伊大学研究团队正是秉持这一理念,开发了能像第二位评委那样工作的AI评估系统。