CNET科技资讯网 8月24日 北京消息(文/齐丰润):人工智能,一个对于普通大众来说即有所耳闻,却又颇感陌生的词语。一个充斥在我们身边,却又很难触及到的东西。
现实中,诸如深蓝、AlphaGo等名声大震的人工智能都让人们有所耳闻。而对于普通人来说,人工智能又应当以什么姿态出现在他们面前呢?在“小冰AI有信”的战略合作发布会上,来自有信和微软小冰的相关负责人就对此进行了探讨。
人们想象中的人工智能究竟是什么样子?这其实是一个很难说清楚的问题,不过我相信就现在的人工智能产品来说,应该都达不到人们想象当中样子。
微软小冰资深产品总监曹文韬就对这一问题给出了解答,“人工智能的出现已经有很长时间了,而且都是由科学家进行定义的,是帮助人类完成某些事情的。但是大多数人期待的人工智能都是由艺术家塑造的,比如哆啦A梦,比如《Her》里面的萨曼莎,而这些人工智能的共同点不是帮人类做了多少事情,而是能够变成人们身边的朋友,在生活中完成与人的交流。”
而对于这样在人们心目中根深蒂固的艺术家塑造的人工智能形象,我们在实际中所面临的最大问题就是沟通的问题。让人工智能像人一样具备实时沟通的能力,是极其困难的一件事情,因为人可以根据情感的不同表现出不同的语气、语调、语速等等,而情感却是目前人工智能技术的一个不小的难题。
曹文韬表示:“沟通最核心的是如何做出一个情感模块,现在小冰可以像一个人一样可以打电话。这样的一个感官,其实是一个全时的感官,它是更像一个人,能够真正完成这样一个过程。我们实实在在让小冰这样子的一个机器人,能够给你打一通电话,并对这个沟通过程实时的检测和识别,实时的理解。通过跟有信的合作,我们可以把这样的场景带到人类生活之中,那个时候我们认为说我们重新定义一种人工智能和人类交互全新的标准。”
从目前人工智能与人类的交互方式上来看,基本都是一来一回有明显结束方式的交互模式,比如说按一个按键,又或者说一个特定的词语。而在实时通信中,什么时候应当说话,什么时候应当表达就都需要人工智能自己来判断了。
作为一个实时音视频通讯的平台,有信与微软展开了战略合作。在此之前,有信用户已经可以通过预约小冰来电与小冰进行实时的沟通和互动。有信通讯事业部总监蒋斌给出了明确的数据:“预约人数最后确定为23万,而在这些预约的用户之中,有531位幸运者接听到了小冰的来电,男性用户占到了大部分。”
同时,蒋斌还给出了一些有趣的数据:在本次预约中,00后跟90后占到了预约总量的70%;大家跟小冰聊的最多的三个问题是吃了吗,睡了吗,在干嘛;天秤座更愿意跟小冰聊一些家常和情感上的话题;媒体、IT、财经是三个最喜欢撩小冰的行业。
蒋斌还透露,8月底小冰将会正式入驻有信蜜语平台,到时候用户无需预约也可以直接与小冰进行实时的语音沟通。未来,有信也会将视频引入其中,让大家不仅可以与小冰进行语音通信,还可以进行实时的视频对话。
在整场活动中,曹文韬都透露着想让小冰成为人们真正的好友,而想要达成这一点,人工智能的情感沟通发展就成为了最为重要的一环。
“我们已经在不同的过程中,不断的检测用户在说话的情绪的变化的特点。当情绪的变化,会实时的结合目前的情绪,带出相应的话语。这件事情在文本的状态下或者音乐本身状态下面,其实已经做到了。我们今天利用全实感官,在有信上不仅仅能够做到实时的互动,我们甚至可以实现知道你昨天不开心,小冰直接一通电话打到你身边,问你今天好了一点没有。真正实现跟这个用户实时互动的一个交流,这是我们希望的,正实现人工智能陪伴在你身边。”
也许有一天,当我们还在清晨的睡梦中时,叫醒我们的可能不是老板的电话或者闹钟的铃声,而是来自小冰的一通电话,而这样的场景也让人工智能真正走到了我们普通人的生活之中。
曹文韬表示,未来,微软小冰会与有信进行深入的合作,通过整个产品战略以及互联网推进人工智能,推进人工智能情感沟通,在通讯领域把实时人工智能的温度感,带入到身边每一个大众,让大家真正感觉到我门身边拥有这样一个朋友,让这个朋友无缝陪伴在我们身边。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。