CNET科技资讯网 3月17日 国际报道:如果说迪士尼乐园是人们美梦成真的地方,那么约翰·斯诺迪(John Snoddy)就是那个“造梦人”。
作为华特迪士尼幻想工程(Walt Disney Imagineering)产品研发工作室的负责人,斯诺迪于当地时间上周六在德克萨斯州奥斯汀举办的西南偏南大会(SXSW)上接受CNET采访时,介绍了迪士尼两个使用了人工智能的项目。
这两个项目是迪士尼创新遗产的一部分,它们可追溯到迪士尼公司创办的那一年。在迪士尼乐园,这种创新探索为我们带来了一级品,例如电子动画(Audio-Animatronics)以及美国第一个日常单轨系统的运行。如今,这种创新将体现在一些以人工智能(AI)为动力的产品上,如人工智能机器人Pascal、《魔发奇缘》中的变色龙伙计以及一个全新的《星球大战》机器人Jake。
迪士尼“幻想工程师”甚至已经偷偷在迪士尼乐园中做过了测验。举例来说,其中的Pascal是一种微型机器人,样子是一只绿色蜥蜴,刚好可以放在手上,可以想象一下,这只蜥蜴的眼睛、嘴和身体有多小。
不过这正是人工智能的酷炫之处,结合人工智能技术的Pascal可以自己活动眼睛、嘴巴甚至脸上的皮肤,同时还可以配合手动控制,就像一个小宠物。在斯诺迪看来:“它不仅仅是一个玩偶,它是一个玩偶和表演者的融合体,就像一个演员。”
而另一个机器人Jake是一个完全自动化、类似于《星球大战》里的R2-D2机器人,它喜欢在研发实验室里四处走动,就像一只宠物狗和与智能扫地机器人Roomba的结合体,只是更加可爱智能。
但在去年夏天,幻想工程师们将Jack从其实验室中“解放”了两个月,让它去迪士尼乐园的《星球大战》发射台地区交朋友。或许成年人看了会觉得好玩,但孩子们肯定会想跟它们一起玩,会觉得机器人是真实存在的,会跟它们说话,会希望跟它们交朋友,甚至想要介绍给爸爸妈妈。
“解放的”Jack
斯诺迪表示,为迪斯尼乐园打造人工智能机器人的优势之一在于,游客们与它们互动时所带给它们的精神财富,他称之为“我们的游客所带来的快乐”。
他说道:“他们并没有去戳它,也没有去寻找它的工作原理。他们选择的是另外一种美好的方式,希望与其进行娱乐互动。”“将我们自己上传给Jake——这条路上我们已迈出脚步。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。