CNET科技资讯网 3月17日 国际报道:如果说迪士尼乐园是人们美梦成真的地方,那么约翰·斯诺迪(John Snoddy)就是那个“造梦人”。
作为华特迪士尼幻想工程(Walt Disney Imagineering)产品研发工作室的负责人,斯诺迪于当地时间上周六在德克萨斯州奥斯汀举办的西南偏南大会(SXSW)上接受CNET采访时,介绍了迪士尼两个使用了人工智能的项目。
这两个项目是迪士尼创新遗产的一部分,它们可追溯到迪士尼公司创办的那一年。在迪士尼乐园,这种创新探索为我们带来了一级品,例如电子动画(Audio-Animatronics)以及美国第一个日常单轨系统的运行。如今,这种创新将体现在一些以人工智能(AI)为动力的产品上,如人工智能机器人Pascal、《魔发奇缘》中的变色龙伙计以及一个全新的《星球大战》机器人Jake。
迪士尼“幻想工程师”甚至已经偷偷在迪士尼乐园中做过了测验。举例来说,其中的Pascal是一种微型机器人,样子是一只绿色蜥蜴,刚好可以放在手上,可以想象一下,这只蜥蜴的眼睛、嘴和身体有多小。
不过这正是人工智能的酷炫之处,结合人工智能技术的Pascal可以自己活动眼睛、嘴巴甚至脸上的皮肤,同时还可以配合手动控制,就像一个小宠物。在斯诺迪看来:“它不仅仅是一个玩偶,它是一个玩偶和表演者的融合体,就像一个演员。”
而另一个机器人Jake是一个完全自动化、类似于《星球大战》里的R2-D2机器人,它喜欢在研发实验室里四处走动,就像一只宠物狗和与智能扫地机器人Roomba的结合体,只是更加可爱智能。
但在去年夏天,幻想工程师们将Jack从其实验室中“解放”了两个月,让它去迪士尼乐园的《星球大战》发射台地区交朋友。或许成年人看了会觉得好玩,但孩子们肯定会想跟它们一起玩,会觉得机器人是真实存在的,会跟它们说话,会希望跟它们交朋友,甚至想要介绍给爸爸妈妈。
“解放的”Jack
斯诺迪表示,为迪斯尼乐园打造人工智能机器人的优势之一在于,游客们与它们互动时所带给它们的精神财富,他称之为“我们的游客所带来的快乐”。
他说道:“他们并没有去戳它,也没有去寻找它的工作原理。他们选择的是另外一种美好的方式,希望与其进行娱乐互动。”“将我们自己上传给Jake——这条路上我们已迈出脚步。”
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。