4月11日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,让计算成为公共服务是阿里云始终不变的追求,未来核心要做好两件事情:第一,让算力更普惠,推动自研技术和规模化经营的正循环,持续释放技术红利;第二,让AI更普及,让每家企业的产品都能接入大模型升级改造,并有能力打造自己的专属大模型。
张勇回顾阿里云的发展历程,过去十年阿里云自研核心技术,全面服务数字化进程。中国移动互联网的发展基本在阿里云上发生,企业从买计算机到按需购买算力就能开始创业,带来了巨大的效率提升。随后更多企业觉醒,各行各业在云上对全生产要素的数字化,形成了风起云涌的数字化时代。
AI大模型加速了智能时代的到来,张勇认为,所有企业在智能化时代都将站在同一条起跑线上,互联网公司和非互联网公司不存在先进或者落后的区别,传统企业有弯道超车的机会。他认为,所有产品都值得用大模型重做一遍,未来将看到应用爆发、效率革命,AI将成为各行各业新型生产力。
未来十年,阿里云将全面拥抱智能化时代。张勇表示,智能化时代带来算力的爆发,同时也提出了更高的要求,阿里云将为AI时代提供好算力基础和大模型能力,全面服务智能化进程。为此,阿里云要做好核心两件事:让算力更普惠、让AI更普及。
首先,阿里云将进一步降价,释放技术红利。阿里云通过软硬一体技术的研发,扩大自研CPU倚天710、云数据中心处理器CIPU、自研数据中心网络等核心技术应用,推动技术创新、规模化运营和成本降低的正循环,不断降低客户用云成本。
过去十年,阿里云提供的算力成本下降了80%,存储成本下降了近9成。今年,阿里云将推出一款更接近云计算终极形态的算力产品,这款被命名为通用Universal实例的产品进一步屏蔽了传统IT的硬件参数,让数据中心真正成为一台超级计算机,为中小企业和开发者提供普惠的算力。通用Universal实例的价格有大幅降低,对比上一代主售实例最高可下降40%。
大幅降价和开放核心产品的免费试用,将推动产业进一步从传统IT向云计算转移。目前,中国IT市场的云计算渗透率不到15%,中国数据中心的CPU利用率仅为10%左右。云计算可以大幅提升计算资源的利用率,云数据中心内的CPU平均利用率,可以达到传统数据中心的5倍以上。
其次,阿里云将推动AI进一步普及。张勇宣布,阿里巴巴所有产品未来将接入大模型,全面升级。他表示,要建设全新的AI开放生态,需要从阿里内部开始,目前,钉钉、天猫精灵已经在测试接入大模型,钉钉能实现自动写工作方案、生成应用等功能,天猫精灵接入通义千问后显著提升了智能化水平。
阿里云将面向企业提供更普惠的AI基础设施和大模型能力。据介绍,未来每一个企业都可以通过阿里云调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
张勇表示,云计算是AI大规模普及的最佳方式,“未来,我们希望在阿里云上训练一个模型的成本,能够降低到现在的十分之一,甚至是百分之一。即使是中小企业,也能通过云平台获得AI大模型的能力和服务。”
据了解,OPPO、复旦大学、南方电网等企业机构已经开始使用阿里云的算力和AI能力进行全新的AI探索。在阿里云的大模型魔搭社区上,超过100万开发者累积下载了超过1600万次各类模型,并直接调用阿里云的算力和一站式的AI大模型训练及推理平台。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。