CNET科技资讯网 11月1日 北京消息: 2016年3月,阿里巴巴人工智能服务产品“阿里小蜜”全量上线,上线半月日均接待400万人,服务能力堪比3.3万个服务小二。
经过近8个月的优化升级,预计2016年双11期间,阿里小蜜将承接超90%的服务咨询。同时,商家版人工智能机器人“店小蜜”也已在Apple、小米等10余个品牌的天猫店内投入使用,部分店铺中店小蜜更是成为店铺“头号客服”,为会员提供7*24小时不间断服务。以“阿里小蜜”、“店小蜜”组成的人工智能服务阵容,将首次成为双11服务主力。
作为全球最大的电商平台,阿里巴巴服务着4亿以上的活跃消费者、上千万的活跃商家,以及每天上千万笔的交易,如何借助科技的力量、提升服务能力及用户体验,而不仅仅是增加客服人数,是服务团队一直关注的重点。
2016年3月,小蜜的出现令消费者眼前一亮。基于一键触达、一站式服务的目标,阿里会员只要打开手机淘宝就可以便捷地找到小蜜,平均响应时间不到1秒,大大降低了原来打热线电话排队等待的时间;维权咨询全部在线实时处理、不需要电话、维权进度全面掌握。
2015年双11,阿里服务团队预估服务请求超800万,2016年双11,小蜜预估日接待咨询量将超千万,智能解决率超90%,人工智能首次成为双11服务主力,为用户带来7*24小时无间断服务。
通过积累的大数据优势,小蜜能够基于用户行为提前分析、预测消费者的服务诉求,主动触达用户。上线半月,阿里小蜜将用户转电话及在线人工服务的求助率降低了70%。在双十一的消费者咨询高峰,服务团队的算法工程师们可以通过对海量问题的分析和预测,在业内首次将知识库的自动更新时效提升至分钟级,并实时预测每一个用户可能遇到的问题,在用户尚未发起咨询前主动发送精准服务信息,大大降低用户的困扰。
2016年双11前,阿里小蜜推出专门的双11小蜜,双11预备手记、红包攻略、预售怎么玩等等千余条双11攻略,全副武装下,小蜜已变身双11最强宝典。除了根据用户行为通过消息盒子主动提醒,用户还能在订单、搜索等上百个场景便捷的向小蜜发起咨询。现如今,在阿里巴巴服务体系内,已有接近90%的问题通过人工智能来解决。
不仅针对淘宝上的网购咨询,基于小蜜平台,圆通、申通、天天三家物流公司全国数万个服务网点已实现系统对接,用户不再需要电话找快递员,通过小蜜也能方便的完成查订单、催发货等等一系列请求。
今年8月,阿里商家版人工智能服务机器人“店小蜜”发布测试,并在天猫荣耀官方旗舰店率先投入测试。测试第一天的23点到第二天早上9点期间小蜜承接了超1100位用户请求,对商品咨询、店铺服务问题来者不拒。
到如今,店小蜜已在天猫Apple store旗舰店、小米官方旗舰店、华为、Vivo、森马、nike、UGG等10余个店铺投入使用。其中Apple、小米更是已将店小蜜作为店铺“头号客服”,会员发起咨询率先由人工智能来承接。Apple还为店小蜜组建专门的“focus group”,来提升人工智能的服务能力。
相较于人力,店小蜜采用机器学习加个性化延展组合模式。对于一些商品层面的信息,店小蜜能够自主读取商品页面及图片上的信息以及存储在商家后台的实时产品价格信息,在用户咨询时提供标准答案。对于一些店铺活动等一些通用类服务问题,商家还可以自定义设置。两种手段结合让店小蜜有极高扩展性。更重要的是,智能客服不受坐席数影响,可以同时接待海量用户,让商家服务能力具备弹性。即使在断电断网的情况下,只要商家设置了智能客服在服务状态,店小蜜就能为商家及消费者提供服务,7*24小时不断档。
店小蜜负责人赵昆表示,通过赋能商家,希望把阿里巴巴在服务领域的积累和技术能力输出给生态圈的合作伙伴,为二十亿消费者和一千万商家提供极速和愉悦的体验,而店小蜜是这个使命下的又一个重要里程碑。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。