
CNET科技行者 2月13日 北京消息 YouTube播主Einfach nerdig启动了一套直播AI,并教导其如何玩《超级马里奥兄弟》。
这套名为MarI/O的AI由SethBling打造而成。他也是YouTube上的游戏视频作者,曾成功破解了SFC游戏《超级马里奥世界》,并将其成功的与《Flappy Bird》结合在一起,诞生了一款复古风的“飞翔的马里奥”。
虽然SethBling自己也一直在持续关注,但他并没有通过自己的频道进行AI训练直播。
作为《超级马里奥世界》通关世界纪录的保持者,SethBling此前曾通过为MarI/O提供自己进行此游戏的素材以训练其学会如何玩这款作品。正如他所解释的那样,他的神经网络在事先对游戏毫不知情的前提下开始学习。最终,通过一系列模拟(大部分看起来似乎没有任何作用),该AI学会了如何向右移动。而在二十四个小时之后,AI已经了解到充足的操作排列组合,并成功完成了一个关卡。
然而,观看AI不断重复游戏内容并尝试从中找到技巧则是另一种完全不同的体验——在屏幕前观看这一切会令人身陷一种奇妙的舒缓状态。
就目前来讲,该AI学习《超级马里奥兄弟》的过程其实有点可怕。我们看到该系统会一次又一次尝试同样的世界与同样的关卡,旨在顺利通过终点。而当其逐渐找到窍门时,AI终于有了点游戏玩家的意思——事实上,它可能在下一次玩游戏时学到一些新的技巧。但在绝大多数情况下,AI的智商感觉跟一袋石头基本相当。AI可能是在根据一定的条件来控制马里奥的跳跃高度与距离,因此当这位最著名的水管工遇到障碍物时,其很可能会被卡住。这时就需要进行手动重置,而后由AI再次进行尝试。
如果你知道要如何让马里奥跳过这个管道,那么恭喜——你比机器更聪明。
根据视频下方的计数器,该AI的《超级马里奥兄弟》游戏时长已经超过17天——其实很多游戏玩家在休假时也会这样全身心投入到游戏当中。但其中的主要区别在于:它不会消耗多乐滋与啤酒。
SethBling 可能并不是第一位用任天堂游戏来训练机器的人,但他却成为这波新浪潮中的重要组成部分——换言之,他将“机器学习算法”这种无聊的事同YouTube娱乐平台联系了起来。而且,即使大家完全不清楚什么是“深度学习”或者“神经网络”,视频的观看体验同样可以既有趣又带感。
又卡住了——跟Derek Zoolander(本·斯蒂勒,美国著名喜剧演员、导演、制片人)一样,这个AI也不知道要左转。
好文章,需要你的鼓励
谷歌DeepMind等顶级机构联合研究揭示,当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效,成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法,系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术,暴露了AI安全评估的根本缺陷。
西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术,能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式,可单独或组合使用。采用双分支架构和分阶段训练策略,在运动控制精度上比现有技术提升53%以上,为视频制作提供了前所未有的灵活性和精确度。
英国国王学院研究团队开发了潜在精炼解码(LRD)技术,解决了AI文本生成中的速度与准确性平衡难题。该方法通过两阶段设计模仿人类思考过程:先让AI在连续空间中"深思熟虑",保持多种可能性的混合状态,然后"果断行动",逐步确定答案。实验显示,LRD在编程和数学推理任务中准确性提升最高6.3个百分点,生成速度提升最高10.6倍,为AI并行文本生成开辟了新路径。
清华大学团队开发的ViSurf是一种创新的大型视觉语言模型训练方法,巧妙融合了督导式学习和强化学习的优势。该方法通过将标准答案整合到强化学习过程中,让AI既能从正确答案中学习又能保持自主推理能力。实验显示ViSurf在多个视觉任务上显著超越传统方法,特别是在处理模型知识盲区时表现突出,同时有效避免了灾难性遗忘问题,为AI训练提供了更高效稳定的新范式。