CNET科技行者 2月13日 北京消息 YouTube播主Einfach nerdig启动了一套直播AI,并教导其如何玩《超级马里奥兄弟》。
这套名为MarI/O的AI由SethBling打造而成。他也是YouTube上的游戏视频作者,曾成功破解了SFC游戏《超级马里奥世界》,并将其成功的与《Flappy Bird》结合在一起,诞生了一款复古风的“飞翔的马里奥”。
虽然SethBling自己也一直在持续关注,但他并没有通过自己的频道进行AI训练直播。
作为《超级马里奥世界》通关世界纪录的保持者,SethBling此前曾通过为MarI/O提供自己进行此游戏的素材以训练其学会如何玩这款作品。正如他所解释的那样,他的神经网络在事先对游戏毫不知情的前提下开始学习。最终,通过一系列模拟(大部分看起来似乎没有任何作用),该AI学会了如何向右移动。而在二十四个小时之后,AI已经了解到充足的操作排列组合,并成功完成了一个关卡。
然而,观看AI不断重复游戏内容并尝试从中找到技巧则是另一种完全不同的体验——在屏幕前观看这一切会令人身陷一种奇妙的舒缓状态。
就目前来讲,该AI学习《超级马里奥兄弟》的过程其实有点可怕。我们看到该系统会一次又一次尝试同样的世界与同样的关卡,旨在顺利通过终点。而当其逐渐找到窍门时,AI终于有了点游戏玩家的意思——事实上,它可能在下一次玩游戏时学到一些新的技巧。但在绝大多数情况下,AI的智商感觉跟一袋石头基本相当。AI可能是在根据一定的条件来控制马里奥的跳跃高度与距离,因此当这位最著名的水管工遇到障碍物时,其很可能会被卡住。这时就需要进行手动重置,而后由AI再次进行尝试。
如果你知道要如何让马里奥跳过这个管道,那么恭喜——你比机器更聪明。
根据视频下方的计数器,该AI的《超级马里奥兄弟》游戏时长已经超过17天——其实很多游戏玩家在休假时也会这样全身心投入到游戏当中。但其中的主要区别在于:它不会消耗多乐滋与啤酒。
SethBling 可能并不是第一位用任天堂游戏来训练机器的人,但他却成为这波新浪潮中的重要组成部分——换言之,他将“机器学习算法”这种无聊的事同YouTube娱乐平台联系了起来。而且,即使大家完全不清楚什么是“深度学习”或者“神经网络”,视频的观看体验同样可以既有趣又带感。
又卡住了——跟Derek Zoolander(本·斯蒂勒,美国著名喜剧演员、导演、制片人)一样,这个AI也不知道要左转。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。