微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

AI化身游戏主播玩转《超级马里奥兄弟》

人工智能马里奥

AI化身游戏主播玩转《超级马里奥兄弟》

作者：CNET科技行者

2018-02-13 12:04

分享至：

YouTube播主Einfach nerdig启动了一套直播AI，并教导其如何玩《超级马里奥兄弟》。这套名为MarI/O的AI由SethBling打造而成。他也是YouTube上的游戏视频作者，曾成功破解了SFC游戏《超级马里奥世界》...

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2018-02-13 12:04 • CNET科技行者

CNET科技行者 2月13日北京消息 YouTube播主Einfach nerdig启动了一套直播AI，并教导其如何玩《超级马里奥兄弟》。

这套名为MarI/O的AI由SethBling打造而成。他也是YouTube上的游戏视频作者，曾成功破解了SFC游戏《超级马里奥世界》，并将其成功的与《Flappy Bird》结合在一起，诞生了一款复古风的“飞翔的马里奥”。

虽然SethBling自己也一直在持续关注，但他并没有通过自己的频道进行AI训练直播。

作为《超级马里奥世界》通关世界纪录的保持者，SethBling此前曾通过为MarI/O提供自己进行此游戏的素材以训练其学会如何玩这款作品。正如他所解释的那样，他的神经网络在事先对游戏毫不知情的前提下开始学习。最终，通过一系列模拟(大部分看起来似乎没有任何作用)，该AI学会了如何向右移动。而在二十四个小时之后，AI已经了解到充足的操作排列组合，并成功完成了一个关卡。

然而，观看AI不断重复游戏内容并尝试从中找到技巧则是另一种完全不同的体验——在屏幕前观看这一切会令人身陷一种奇妙的舒缓状态。

就目前来讲，该AI学习《超级马里奥兄弟》的过程其实有点可怕。我们看到该系统会一次又一次尝试同样的世界与同样的关卡，旨在顺利通过终点。而当其逐渐找到窍门时，AI终于有了点游戏玩家的意思——事实上，它可能在下一次玩游戏时学到一些新的技巧。但在绝大多数情况下，AI的智商感觉跟一袋石头基本相当。AI可能是在根据一定的条件来控制马里奥的跳跃高度与距离，因此当这位最著名的水管工遇到障碍物时，其很可能会被卡住。这时就需要进行手动重置，而后由AI再次进行尝试。

如果你知道要如何让马里奥跳过这个管道，那么恭喜——你比机器更聪明。

根据视频下方的计数器，该AI的《超级马里奥兄弟》游戏时长已经超过17天——其实很多游戏玩家在休假时也会这样全身心投入到游戏当中。但其中的主要区别在于：它不会消耗多乐滋与啤酒。

SethBling 可能并不是第一位用任天堂游戏来训练机器的人，但他却成为这波新浪潮中的重要组成部分——换言之，他将“机器学习算法”这种无聊的事同YouTube娱乐平台联系了起来。而且，即使大家完全不清楚什么是“深度学习”或者“神经网络”，视频的观看体验同样可以既有趣又带感。

又卡住了——跟Derek Zoolander(本·斯蒂勒，美国著名喜剧演员、导演、制片人)一样，这个AI也不知道要左转。

人工智能马里奥

分享至

0赞

好文章，需要你的鼓励

推荐文章

人工智能
AI安全防护
自适应攻击

2025-11-19 16:15

谷歌DeepMind等顶级机构联合揭秘：为什么所有AI安全防护都是纸老虎？

谷歌DeepMind等顶级机构联合研究揭示，当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效，成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法，系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术，暴露了AI安全评估的根本缺陷。
视频生成
多模态控制
Diffusion Transformer

2025-11-19 16:15

西蒙弗雷泽大学和Adobe研究院联手打造视频制作新神器：让静态图片学会"按剧本演戏"

西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术，能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式，可单独或组合使用。采用双分支架构和分阶段训练策略，在运动控制精度上比现有技术提升53%以上，为视频制作提供了前所未有的灵活性和精确度。
人工智能
扩散语言模型
并行文本生成

2025-11-19 16:14

英国国王学院突破传统：让AI像人类思考一样"反复斟酌"，生成速度飞跃10倍

英国国王学院研究团队开发了潜在精炼解码（LRD）技术，解决了AI文本生成中的速度与准确性平衡难题。该方法通过两阶段设计模仿人类思考过程：先让AI在连续空间中"深思熟虑"，保持多种可能性的混合状态，然后"果断行动"，逐步确定答案。实验显示，LRD在编程和数学推理任务中准确性提升最高6.3个百分点，生成速度提升最高10.6倍，为AI并行文本生成开辟了新路径。
人工智能
强化学习
模型训练优化

2025-11-19 16:14

清华大学团队发布ViSurf：让AI视觉模型学习更聪明的新方法

清华大学团队开发的ViSurf是一种创新的大型视觉语言模型训练方法，巧妙融合了督导式学习和强化学习的优势。该方法通过将标准答案整合到强化学习过程中，让AI既能从正确答案中学习又能保持自主推理能力。实验显示ViSurf在多个视觉任务上显著超越传统方法，特别是在处理模型知识盲区时表现突出，同时有效避免了灾难性遗忘问题，为AI训练提供了更高效稳定的新范式。