科技行者 3月21日 北京消息(文/孙封蕾): 很多的变化,都发生在今天。
今天,2019阿里云峰会·北京站召开,当走进位于国家会议中心的会场的时候,细心的人会发现,阿里云发生了很多变化。
云栖大会一直是阿里云的标志性会议,北京的峰会,叫做云栖大会·北京峰会,而今天这场会议的名称变成了“阿里云峰会·北京站”。
阿里云的logo,从原来的白色,变成了阿里巴巴集团的橙色,字体也加粗了一圈。
图:阿里云新logo
2019年,阿里云成立10周年了,阿里云峰会的主题定为“十年再出发”。
今天,是阿里云智能升级之后的首次亮相,也是张建锋就任阿里云智能总裁之后的首次跟大家见面。
图:阿里云智能总裁 张建锋
这些都是阿里云的小变化,张建锋给带来的还有阿里云的大变化。
张建锋的角色,除了阿里云智能总裁,还有一个title,就是阿里巴巴集团CTO。身为阿里巴巴集团的CTO,他透露,整个阿里巴巴今天大概有60~70%的流量是跑在公共云上。接下来一到两年的目标,是将阿里巴巴100%的业务跑在公共云上。
阿里云智能升级之后,会把阿里巴巴的技术跟阿里云的技术完全拉通,阿里巴巴用的技术跟阿里云上的产品是完全一样的,阿里云的用户将会跟阿里巴巴用的一模一样的底层。
也就是说,阿里巴巴集团的整个技术都变成一个云上的技术。所有的技术的输出,产品的输出,对to B的服务都会通过阿里云智能这个平台,这其中也包括支付宝、钉钉、新零售等核心技术和新产品。
新制造曾经是过去两年阿里云的战略性行业,但今天张建锋重新圈定了阿里云的战略性行业:新零售、新金融、数字政府。
张建锋解释,新零售是阿里巴巴一直在持续投入和探索的行业,有大量的产品可以输出,这也是阿里巴巴最有发言权的行业。
在金融行业,依托蚂蚁金服在互联网和金融行业结合的创新能力,把互联网和金融行业的融合创新发挥的淋漓尽致。
数字政府是阿里云智能提出的新领域。过去,依托城市大脑,浙江省实现了办事最多跑一次,这样的体验逐渐扩展到全国其他地方,开始利用互联网技术和智能,让老百姓得到了实惠。
在这其中,技术的力量发挥出了非常好的效果,从原来基于部门的系统到今天变成基于用户、基于数据的系统,理念发生了巨大的转变。
今天,北京市通州区发布了城市副中心数字生态城市建设的成果“城市大脑·生态环境”平台。通州区副区长苏国斌介绍,该平台在通州上岗以来,环境污染事件从人工发现到实时自动感知,从多部门多头处置到一网通办的本质提升。
今天,每个人访问手机淘宝,每个人看到的页面都不一样,每一次点击之后,还会根据点击实时生成后续页面。这里的实时,不是以分钟为单位来计算,而是用户完全没有体感的实时。
这就意味着,每秒钟,阿里巴巴都要处理这么多的数据,为每个人处理不同的数据,是一个非常关键的能力。
“算力是基础,更重要是智能化的算法。”张建锋说,“算法跟各行各业的业务有密切相关,所以阿里巴巴通过与各行各业合作,沉淀了一个完整的智能化平台。”
基础设施的云化、核心技术的互联网化以及在之上叠加数据+智能化的平台和能力,完整地组成了阿里云智能的整体能力框架。
阿里巴巴今天要运营如此规模大的经济体,运营人员只有几百人。因为阿里巴巴电商大量地用好了数据,用好了智能做出的决策。
当企业复杂到一定程度,任何一位CEO都很难做出科学客观的决策。但有了数据之后,任何一位员工都可以跟CEO一样做出正确的决策。
阿里巴巴的客服小二可以作出客观的决策,是因为客户打电话进来的那一刻,系统就在后台有一个数据上的智能分析,帮助他做出比较客观的评价,大幅度地提高决策的公平和效率。
阿里巴巴自身几乎所有的流程里面都有数据、智能的作用。这种能力,也将成为阿里云加持的能力。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。