“东数西算”和“算力网络”看上去很深奥的两个词汇,算力网络之于东数西算,是什么样的关系呢?
在“东数西算”发展研讨会暨《人类计算简史》新书发布上,国家信息中心信息化和产业发展部主任单志广一语道明,算力网络是东数西算的神经中枢,东数西算是中国自己的数字化发展的创新之路,但成本计算还需要精细化。
智能的算力网络,才能实现“东数西算”
东数西算非常依赖于算力网络,算力网络统筹调度和运行机制,这才是东数西算未来真正的神经中枢,没有算力网络集中化调度,东数西算无法实现。就像一般的网络调度有路由器和交换机,有任务分配器,是多目标优化控制的。灵活优化云网边需求,实现全网调度,实时调度,面向业务的调度,这种爆炸式的数据计算,是很难实时最优解的。
以目前的算力网络情况来看,单志广认为,算力网络调度机制短期内还要进一步完善,算力网络也在业界深入的探讨,理想状态下,所有的网络资源、带宽资源、云资源要进行统一调度。
图:国家信息中心信息化和产业发展部主任 单志广
算力网络与云网协同不同,云网协同可以理解成一云多网,算力网络是一网多云,所以算力网络要按照业务需求,在云网边之间按需分配,灵活调度。计算资源、存储资源、网络资源,这是非常有挑战性的。
总体上,单志广提出,算力网络的核心是复杂巨系统的多资源联合优化,复杂巨系统的多目标联合优化,需要确保全国范围内、实时的、全网的、面向任务调度的高QoS(Quality of Service,服务质量)保证的资源调度。
当下,随着5G、全光网、SDN等网络技术的发展,网络不再是瓶颈,能够按需将用户和资源池连接在一起,为更多的地方提供不受限制的高速网络接入,提供更多的网络连接的可能性。但是算力网络核心本质,是构建面向用户需求的网络,类似智慧城市的城市大脑,把全网当成一台计算机进行调度。
“理论上说得通,实践上难度很大,可能需要在整网最优难于获得的情况下,做系统分解、局部优化、近似优化,分而治之,综合集成。”
单志广强调,东数西算最核心的关键,就是要具备能够实现算力统筹和智能调度的算力网络。
中国国情下的创新
算力网络其实就是“算力”的网络,单志广指出,“算力网络”今天讲的还是一个概念,实现的技术路径需要落地、落实,要在全国范围内、在云、网、边之间,实现按需分配,灵活调度。
在这个网络里,算力网络就是要多资源流动化,目前设想的“算力网络”还需要进一步落地。单志广认为,全域、实时、动态的调度本身就是比较难的问题,无法及时的进行有效求解,所以只能走局部优化、降维的路径。东数西算在落地上的挑战,需要业界共同努力,实现有效的技术路径,有效的实施载体,这样东数西算才能有更好的发展。
全国一体化大数据中心和东数西算工程,需要按照中国的国情不断的创新,走出中国自己的数字化发展的创新之路。
细账不好算
数据中心把服务器移到西部,一本账摆在面前:根据华为云贵安数据中心统计,满负荷运行的情况下,数据中心能效指标(PUE)低至1.12,预计每年可节省电力10.1亿度,减少碳排放81万吨。根据国家电网公开电价显示,东、西部地区的电价差在0.2元/度电左右(如广东0.57元/度电,贵州0.37元/度电),以总耗能2000亿度电计算,节省资金400亿元。
从账目可以发现,东数西算很有价值。
可也要看到,数据中心不管建在哪儿,都是要耗电的。如果在西部建非再生能源发电站,东部建数据中心,就需要西电东输。数据中心建在西部,PUE值可能会稍微低一点。全国数据中心每年耗电2000亿度,即使全部数据中心都建在西部,全国每年顶多也就节省几百亿度电(不及全国电解铝耗电的十分之一,每年我国电解铝耗电5000亿度电)。如果每年要投资数千亿元建东数西算数据网络,把海量数据向西部传送,成本上是不是不合算?单纯从数据中心PUE值来看,“东数西算”的PUE节省空间难以抵消每年的建设成本。
再看电的传输成本,特高压直流单条线路建造成本约为250亿元,但一条长达1.2万公里的海底光缆约5亿美元,“东数西算”比“西电东送”成本低很多。
但是,事实上,特高压“西电东送”用于数据中心供电不足2.7%,而数据网络建设必须考虑通信中继站、维护站等其他费用。“东数西算”目前难以给出明确的经济数据,成本是否合算需要进一步精算。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。