据彭博社报道,微软增强现实(AR)设备HoloLens从发布一开始就受到了美国航天航空局(NASA)的青睐。双方更是从硬件和软件两方面展开合作,拟早日实现利用AR技术来辅助宇航员在太空中完成一些较复杂任务。
根据微软和NASA最新公布的消息,双方合作产品被命名为Sidekick,其主要功能包括如下两项:
Procedure Mode(步骤模式)可将动态全息影像投射到真实世界的任务中,如此宇航员就可以在电脑指导下按步骤完成一些操作,而不必依赖于与地面人员的通讯和口头沟通。
“这个功能可以减少未来培训人员所需的时间,更可能是人类深入太阳系中执行任务时不可或缺的无价技术,后种情况通常因为通信的延迟,会让很多问题变得更复杂。”
此外还有一个Expert Mode(专家模式),即地面操作人员可通过微软Skype看到宇航员的实时所见画面。如此一来,地面人员也就能提供实时的指导,并“利用同步到宇航员视野中的注释添加技术,辅助后者完成太空任务。”
NASA指出,截至目前,复杂的太空维修任务或实验,都是完全依赖于手写指导或口头指导完成的。
NASA周四特别放出了一段视频以呈现与微软合作的效果。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。