作者|于玲
2022世界人工智能大会期间,亚信科技首席科学家叶晓舟在亚信科技和清华大学智能产业研究院主办的“智能算网与绿色计算”论坛上指出,新型算力将是数字经济时代新的生产力,是支撑千行百业数字经济发展的坚实基础。
叶晓舟以算力网络的第一个十年为题。他谈到,现代计算和通信系统已经逼近了摩尔定律和香农定理的极限。在计算方面,人们通过多核、众核的方式来突破摩尔定律与物理规律的相互作用;在单通道通信系统已经无线接近香农极限的条件下,人们通过多通道的方式来实现通信系统容量的倍增,甚至通过更高层次的语义通信来突破信息传输的桎梏。
叶晓舟指出,已经八十年的冯诺依曼体系结构推动了计算机的大发展,但在面向数据处理时存在瓶颈,新的存算一体技术在保障数据处理效率的同时也提高了计算效率;五十年的TCP/IP是以主机为中心,推动了互联网的浪潮,在数字时代,我们更期待一个以计算为中心的新网络协议出现。“我们认为在以人工智能、元宇宙等密集计算应用为代表的数字时代,计算机网络与通信将回归本质,由“信息的传递系统”进化为无处不在的“计算服务系统”。”
基于此,叶晓舟提出我们需要“新型算力”,新型算力由算力、运力、存力和原力构成。传统“算力”是指CPU通用算力、GPU智能算力、超算算力等,“运力”是指网络资源和网络质量和网络性能指标等所刻画网络传输能力,“存力”是指网络的存储规模、IO、效能等存储能力,“原力”是指大数据时代的AI、数字孪生、区块链、PaaS等基础支撑能力和原始驱动力。
2022年是算网的元年,整个产业界都在关注如何构建算力网络。叶晓舟表示,算力网络分为三大组成部分:
一、搭建算网的基础设施,要构建云边协同、布局合理、架构先进的算力基础设施,通过SRv6、确定性网络、新型协议等实现网络对算力的感知、承载与调度。
二、搭建算网大脑,算网大脑基于通信人工智能、数字孪生技术,实现对算网的统一感知、智能决策、编排、调度,是算力网络的核心。算网引擎则是算网大脑的决策中枢,要在算网全局图谱下,实现算网目标SLA与算网资源组合的联合最优解。
三、搭建算网运营交易中心,支撑算网业务管理、成本分析、竞价排名、算网通证和算力运营。这里的关键技术是要基于区块链的技术,实现算网交易撮合、全程溯源,吸纳和构建多方可信算网交易平台。
要搭建完善的算力网络,绝不是一蹴而就,需要长期耕耘。叶晓舟也提出了对算力网络演进的思考。他说,算力网络第一个十年的演进会经历三个阶段:
第一个阶段是算网协同阶段,到2022年底,可以通过算力和网络的分别调度及协同,实现两者的协同编排和调度管理。
第二个阶段是到2025年实现算力网络的统一调度和管理,这就需要算网的智能引擎,能够自动化实现算网的资源编排和调度。同时,我们在这个阶段要构建一个可信的交易平台来实现算和网的融合。
第三个阶段是到2030年,我们可预期实现算网的一体,真正实现算即是网、网即是算。在这个阶段,基于数字孪生可以实现算网自治,以及通过建立合理运营交易市场,可以实现整个异构的算力和异构的网络,接入到算网一体的体系中来。
在2022年之前,我们更多的是在进行算力网络的场景和需求的标准化工作,到2025年可以完成架构模块的定义、完成算网模块的接口和定义,到2030年实现算网一体的下一代标准体系的演进。
“算力网络作为6G关键核心技术,到2030年希望算力网络能够顺利实现6G的商用。”叶晓舟说,“在此期间,亚信科技非常愿意配合和支持运营商、合作伙伴、客户的算力网络建设,产学研用一体加速推动算力网络的商用落地。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。