4月7日,阿里云公开“阿里版GPT”通义千问邀测入口,引发强烈关注。4月11日,阿里云再放大招。“所有软件都值得接入大模型升级改造”,阿里云智能CTO周靖人在北京云峰会现场宣布:“我们将开放通义千问的能力,帮助每家企业打造自己的专属大模型!”据悉,阿里所有产品未来将接入通义千问进行全面改造,钉钉、天猫精灵率先接入测试,将在评估认证后正式发布新功能。
“通义千问”将全面接入阿里办公、购物、语音助手等场景
根据钉钉当天预告的Demo演示,接入通义千问之后的钉钉可实现近10项新AI功能,全面激发创意和办公生产力。通过类似微软Copilot“副驾驶”的设定,用户可随时随地唤起AI,开启全新工作方式。在钉钉文档中,通义千问可以创作诗歌小说、撰写邮件、生成营销策划方案等,全面辅助办公。在钉钉会议中,通义千问可以随时生成会议记录并自动总结会议纪要、生成待办事项。通义千问还可以帮助自动总结未读群聊信息中的要点。最惊艳的是,钉钉展示了拍照生成小程序场景,上传一张功能草图,不用写一行代码,可立刻生成订餐轻应用。
根据天猫精灵官方预告的演示Demo,接入通义千问后,新天猫精灵变得更拟人更聪明,知识、情感、个性、记忆能力大幅跃升。它支持自由对话,可以随时打断、切换话题,能根据用户需求和场景随时生成内容。比如,用户可以在跑步时要求天猫精灵“合成1小时歌单,50%穿插摇滚风格的歌曲”,也可以和天猫精灵聊文化谈人生。新天猫精灵不仅能回答小朋友的各种刁钻问题,还可以一起创作“宇宙大爆炸”的新故事。
此外,通义千问还将陆续嵌入阿里电商、搜索、导航、文娱等场景。比如在网购场景,用户如果想开生日party,通义千问可以帮助生成生日活动方案和购物清单。
以云为基础设施帮助每个企业打造自己的GPT
“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每一家企业打造自己的专属GPT,欢迎所有人用阿里云开发自己的大模型。”周靖人表示,阿里云将提供完备的算力和大模型基础设施,让包括创业公司在内的所有企业和机构更好地实现创新,让中国整体的 AI 能力有全方位的提升。
周靖人介绍,未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
发布会当天,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
除了开放自研的通义千问大模型外,阿里云也在积极建设开源的AI社区生态。去年11月,阿里云正式提出“Model as a Service”理念,并推出国内首个AI模型社区“魔搭”,开发者可以在魔搭上下载各类开源AI模型,并直接调用阿里云的算力和一站式的AI大模型训练及推理平台。发布不到半年,“魔搭”社区总用户量已超100万,模型总下载量超1600万次,成为国内规模最大的AI模型社区。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。