“云计算与各类新型技术融合,从一个狭义的IT组成部分,到今天IT已经变成云的一部分。”这是阿里云智能总裁张建锋在2021云栖大会上,阐释的一个全新的云上世界。
图:阿里云智能总裁张建锋
今天,动辄百万计的计算规模已经成为一个互联网企业的计算规模,这在过去是根本不可能的事情,用廉价的电脑组成平台系统,成为今天的日常。张建锋指出,一个以云为核心的新型计算体系结构正在形成,随着云网端技术进一步融合,未来无论企业或个人,计算将进一步向云上迁移。
“倚天”直达基础设施底层
回顾科技发展的历程,张建锋表示,云计算与各类新型技术融合,从一个狭义的IT组成部分,到今天IT已经变成云的一部分。
这背后,云计算首先突破了云操作系统“飞天”这样的核心技术,让管理上百万台服务器成为可能。而后,“盘古”存储系统创新性的进行了存算分离,将所有硬盘资源池化,提升数据可靠性。
更进一步,云向下定义硬件。“神龙”架构是阿里云“软硬一体”技术的重要一步,通过对硬件moc芯片的重构,用硬件来做虚拟化,实现了虚拟化0损耗,与行业拉开了代际的领先优势。
最终,云对硬件的定义走到了最核心部件——芯片。在现场,张建锋展示了阿里第一颗为云而生的CPU芯片倚天710,这颗芯片采用业界最先进的5nm工艺,单芯片容纳高达600亿晶体管,是业界性能最强的ARM服务器芯片。
张建锋表示,倚天710是阿里云推进“一云多芯”策略的重要一步,正如云上用户不需关心服务器运维一样,他们也不再需要关心芯片。这是基于云的新型计算体系的一个重要特点,背后逻辑正是要强调基于云的特点来构建整套硬件的技术体系。
开源引领数字时代的创新
一个全新的体系正在三个层次演进:首先,在基础设施层,云向下定义硬件,自研芯片、服务器、操作系统等底层技术,建设云为核心的硬件体系;其次,核心软件基于云来重构,开源社区成为创新中心,并催生低代码等新的开发方式,让云更易用;最后在应用层,未来随着5G网络发展,计算和数据加速向云上迁移,催生云电脑、元宇宙、自动驾驶等新物种。
在云基础设施之上,云原生技术取代了传统IT软件,并在开源社区蓬勃发展。传统IT软件被云原生技术取代,张建锋认为,在传统IT时代,开源软件只是大型商业软件的补充,但云计算出现之后,开源变得标准化。近年来云原生技术的创新大多来自开源社区,例如容器改变了传统的应用架构,并成为行业标准。他表示,阿里巴巴是开源的受益者,也是贡献者,开源项目数超过2700个,是中国开源项目最多的企业。
在此之上,基于云的软件开发方式发生了根本变化。张建锋认为,大型软件向系统软件转变,应用软件让企业自己开发。大型商业软件不仅意味着高昂的成本、还面临漫长的咨询和实施周期,但低代码不一样,任何业务人员、哪怕不懂代码,也可以搭建自己的应用,加快创新速度。
基于钉钉的低代码开发是一种新的开源模式。钉钉上的低代码开发应用8个月增长了86万。如此“大爆发”正是因为打破了应用开发的封闭环境,让开发者从企业专业的IT人员逐步走向个人,开发成本不到原来的十分之一。
张建锋表示,就阿里巴巴自身而言,已经落地了全球最大规模的云原生实践。目前,阿里巴巴业务100%跑在公共云上,并且实现应用100%云原生化。
云上新世界:新物种大爆发
未来,随着5G等通信技术发展,计算和数据加速向云上迁移,从而催生更多云上新物种。张建锋表示,就像最早有了电,后来有了电网,这样的基础设施建设完成之后,出现了丰富的电器,改变了我们的生活和生产方式。
云经历了第一和第二阶段,类比就像出现了电和电网,传统IT被云取代,但真正的改变还没到来。他认为,未来将出现无数的云上新物种,这样的技术爆发已经有了很坚实的基础,我们完成了基础设施的建设,即将看到“电器”爆发一样的时代机遇。
他举例说,云、网、端的深度融合,已经催生出云电脑、元宇宙、自动驾驶等新物种。例如阿里巴巴发布的“无影”,它仅有名片大小,适配所有屏幕,连上阿里云就是一台超级电脑。工程师们已经在使用无影进行编程,因为数据都在云端,不在本地电脑存储,工程师不用再担心核心代码的泄露,也不用再购置高配硬件,就能随时随地使用无限算力,处理各种复杂计算需求。
张建锋认为,“未来所有数据都将在云上,不管你用什么样的设备、有多少设备,每个人、每个企业在云上有一个专属空间,所有的计算负载可能都在云上发生。未来,端的形态将变得更轻薄、更友好,以满足随时随地的创新。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。