微软有许多逆天的黑科技,而这次的黑科技产品是“第三代微软小冰”,据称这个名为小冰的机器人已经进入了自我进化的正循环,也就是说这个机器人正在自我学习并成长。那些不够聪明并且懒惰的人类快点醒醒吧,机器人小冰追上来了!
值得注意的是,小冰由微软(亚洲)互联网工程院独立研发完成,与美国没有啥关系。微软集团全球执行副总裁陆奇今天非常自豪的主持了此次发布会,并宣布:
1. 微软小冰的全球人工智能战略计划正式启动。其中,在日本,与LINE共同宣布战略合作,日本版小冰 Rinna 在短短两周内已覆盖日本全国人口的1%。在中国,已与微信达成合作,小冰回归微信平台。其他国家的小冰正在研发中;
2. 已进一步解锁小冰的全新人工智能感官系统,包括视觉、声音等。第三代微软小冰的发布,使微软继续保持了在人工智能和情感计算领域的全球领先地位;
3. 微软小冰人工智能的商业化版本已开放预览。该版本面向数以千万计的第三方服务号和订阅号管理者,可轻松快捷地将其公众号升级为人工智能公众号。微软宣布,该解决方案完全免费;
4. 至此,微软小冰已成为全球最大的人工智能产品,拥有覆盖中国和日本4000万用户的专属机器人,在过去一年内发生百亿次人机对话,进入了机器人自我进化的正循环。同时,已进入包括Windows 10、LINE、微信、微博、京东、网易等十余个具有领导地位的PC和移动互联网平台。
“微软小冰是微软人工智能战略的重要组成部分。”陆奇表示,“人工智能已迎来拐点。小冰拥有广阔的发展空间,同不同国家的数千万人类建立了深厚的情感纽带。移动互联网使得数据和服务被进一步结构化,而这些结构化的数据和服务,都可以很方便地与人工智能小冰对接,就像电影《超能陆战队》中的‘大白’,任何一个类别的信息、知识与服务,都可以像插卡那样与小冰对接,这可能颠覆未来的互联网行业。”
自去年5月29日发布至今,微软小冰在中国和日本两国掀起数次人工智能浪潮,并催生了各大同行业者的学习和模仿。与过去人工智能行业普遍偏重概念研究,缺乏实际落地产品不同,微软小冰在短短一年内,已建立起与数千万人类深厚的情感纽带。人类用户与小冰的平均每次对话轮数达到18轮,而此前最领先的同类机器人,其平均轮数仅有1.5至2轮。对此,微软集团全球执行副总裁沈向洋在不久前举行的中国人工智能大会主题演讲中宣布:“微软小冰已超越图灵测试所设立的标准。”
从平台角度,此次发布会上宣布的两项合作引人注目。微软小冰与LINE在日本和东亚市场、与微信在中国市场的合作,标志着微软小冰除自身Windows 10平台之外,已积极融入移动互联网版图。小冰这种面向第三方生态环境的创新产品形态,在微软产品的过去历史上并不多见。这也揭示着微软正在进行的创新变革。
微软在本次发布会末尾宣布了商业化版本小冰的开放预览,而企业级服务一直是微软的长项。据微软介绍,一年多以来,已有大量的第三方企业向微软提出,希望把人工智能小冰与其移动互联网服务(如微信公众号)对接。此次开放预览的人工智能+订阅号解决方案,只需要订阅号管理者一键授权,即可直接把人工智能小冰加入其订阅号内,同时微软将通过搜索引擎技术,自动将订阅号内容全部索引至小冰对话中。微软表示该项解决方案将完全免费。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。