微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 Arm 借助融合型 AI 数据中心 重塑计算格局

Arm 借助融合型 AI 数据中心 重塑计算格局

2025-12-12 19:33
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-12-12 19:33 科技行者

作者Arm AI 事业部产品解决方案副总裁 Dermot O’Driscoll

2025 年初,Arm 曾预测:Arm 架构将占据近半数 2025 年出货到头部云服务提供商的算力

根据今年前三个季度的实际出货数据,市场正向着这一预测目标稳步迈进。这些搭载 Arm 架构的服务器的意义远不止于一个统计数字,更重要的是它们构成了融合型人工智能 (AI) 数据中心这一新型基础设施的计算核心。从云原生服务到最具挑战性的 AI 工作负载,超大规模云服务提供商正逐步将基于 Arm 的定制化计算作为标准路径,以此实现性能、功耗与规模的平衡。

近期发布的 Amazon Graviton5 正是这一新模式的典范。作为该系列的第五代产品,Graviton5 凝结了 Arm 架构多年积累的能效优势,专为现代数据中心需求打造,适用于从高密度 AI 推理到横向扩展的云原生工作负载。Graviton 已连续三年在亚马逊云科技新增 CPU 算力部署中占比超半数;如今,在 Amazon EC2 排名前 1000 的客户中,已有 98% 在生产环境中采用 Graviton 系列处理器。

Graviton 也是亚马逊云科技自研芯片战略的关键一环,在全新推出的 Amazon Trainium3 UltraServers 中,亚马逊云科技三款定制芯片均部署于统一的计算底座中。在该架构设计中,基于 Arm 架构的 Amazon Graviton 和 Amazon Nitro 分别负责通用 CPU 计算及高性能网络处理任务,为 Amazon Trainium3 UltraServers 提供核心技术支撑。

随着 Arm 架构正逐步成为驱动 AI 时代核心平台的算力基石,Graviton5 的推出成为行业变革的又一例证。

· Google Axion:搭载 Arm Neoverse 计算核心的 Axion 家族处理器现已提供更多的云实例配置项,为云和 AI 工作负载带来前所未有的性能表现。

· Microsoft Cobalt 100 及全新发布的 Cobalt 200:这两款处理器专为 Microsoft Azure 的 AI 优化型数据中心的云原生工作负载打造,为微软内部服务及 Azure 客户提供算力支持。

· NVIDIA Grace Blackwell:将 Arm 架构的 CPU 与 NVIDIA 的 AI 加速器相结合,打造出迄今最先进的 AI 计算平台。

全球领先的超大规模云服务提供商、芯片制造商及系统集成商,早已跨越对定制化计算的探索期,正将其纳入自身基础设施战略核心。Arm 平台正是实现这一产业融合趋势的可靠技术基石。

融合型 AI 数据中心的崛起

综合来看,这些平台共同彰显了数据中心的快速演进。AI 正在打破基础设施内部的传统边界,将昔日由通用服务器与设备构成的松散架构,演变为一套高度整合、面向 AI 优化的环境,实现计算、加速、网络、内存、存储及软件的协同设计与一体化运行。

在融合型 AI 数据中心中,性能和能效的提升来源于全栈协同,而非某个单一组件。Arm 提供连接全栈各层的通用架构,使云服务提供商在保持灵活性与效率的同时,能够进行全局优化,以满足现代大规模工作负载的严苛要求。

系统各层级对 AI 性能的贡献各不相同,而 Arm 架构贯穿始终:

· CPU 为 AI 系统提供控制平面,包括协调调度、数据迁移、内存管理以及各类服务等,同时执行关键模型逻辑,将词元 (token) 转化为有效操作。

· 加速器可在模型运算最密集处提供高密度算力,助力训练与推理在数千个节点上实现高效规模化部署。

· 智能网卡 (SmartNIC)DPU 及智能网络存储系统可卸载包括安全防护、网络连接和数据访问在内的关键服务,并进行加速。不论是亚马逊云科技的 Nitro、NVIDIA 的 BlueField,还是英特尔的 IPU,均可看出这些平台正越来越多地采用Arm 架构芯片进行构建,确保数据在 AI 计算的每个环节之间安全高效地传输。

由此构建的基础设施全面提升了每瓦智能 (intelligence-per-watt)——单位能耗下能够输出的有效 AI 算力——在保持软件兼容性和生态系统一致性的前提下,进一步加速创新进程。得益于与亚马逊云科技、Google Cloud、Microsoft Azure 和NVIDIA 等合作伙伴的深度协作,基于 Arm 架构的定制化计算方案不仅势头渐劲,更进入了加速发展阶段。

Arm 借助融合型 AI 数据中心 重塑计算格局

亚马逊云科技公用计算高级副总裁 Peter DeSantis 出席 re:Invent 2025

Graviton5 与计算性能新拐点

Graviton5 配备 192 个核心,缓存容量较上一代提升五倍,针对亚马逊云科技客户的核心负载场景,可实现高达 25% 的性能跃升。这一提升既彰显了定制化设计的变革性成效,同时也重新定义了云计算的经济效益。当性能增速超过功耗和成本的增幅时,行业格局便会被改写,而 Arm 生态正引领这一关键转折点的到来。

这一发展势头早已突破了超大规模云服务的应用范畴。如今,企业端正在将同样的定制化设计原则应用于 AI 推理、自动驾驶、边缘计算、智能网络等多元化场景,而驱动这些应用场景的,正是同样支撑着云服务的 Arm 架构。

展望未来:打造普惠的计算基石

在 Arm 平台上共筑未来的,不止是全球企业巨头。借助 Arm 全面设计 (Arm Total Design)等生态项目,依托 Arm Neoverse 计算子系统 (CSS) 平台,Arm 正在赋能更广泛的生态合作伙伴,以媲美超大规模云服务提供商的效率和速度来打造定制化芯片。同时,Arm 云迁移等项目也在为各种规模的企业降低 Arm 架构计算平台的部署门槛,助力其充分释放性能和能效优势。

随着定制化计算逐步赢得市场认可,全行业正在积极拥抱这一趋势。而 Arm 作为这一变革的核心计算平台,正引领着未来的无限可能。

–结束–

分享至
0赞

好文章,需要你的鼓励

推荐文章
  • 南方科技大学等机构联手破解AI推理训练难题:让大模型"一次思考"就学会解题

    南方科技大学等机构联手破解AI推理训练难题:让大模型"一次思考"就学会解题

    本文介绍了由南方科技大学等机构于2026年4月发表的研究(arXiv:2604.08865),提出了名为SPPO的大模型推理训练新方法。该方法将推理任务重新建模为"序列级情境赌博机",用一个轻量级价值模型预测题目难度,以单次采样替代GRPO的多次采样,解决了标准PPO的"尾部效应"问题。实验显示,SPPO在数学基准测试上超越GRPO,训练速度提升约5.9倍,配合小尺寸价值模型还能显著降低显存占用。

  • 香港科技大学数学系研究者:扩散模型原来是一个"魔法恒等式"拆成了两半

    香港科技大学数学系研究者:扩散模型原来是一个"魔法恒等式"拆成了两半

    这项由香港科技大学数学系完成的研究(arXiv:2604.10465,2026年ICLR博客论文赛道)提出了一种从朗之万动力学视角理解扩散模型的统一框架。研究指出,扩散模型的前向加噪和逆向去噪过程,本质上是朗之万动力学这一"分布恒等操作"被拆成了两半。在这个视角下,VP、VE-Karras和Flow Matching等不同参数化的模型可被精确互译,SDE与ODE版本可被统一解释,扩散模型相对VAE的理论优势得以阐明,Flow Matching与得分匹配的等价性也得到了严格论证。

  • 中国人民大学研究团队打造的"AI科学家":让机器自主完成几十小时的科研工程,它是怎么做到的?

    中国人民大学研究团队打造的"AI科学家":让机器自主完成几十小时的科研工程,它是怎么做到的?

    中国人民大学高岭人工智能学院等机构联合开发了AiScientist系统,旨在让AI自主完成机器学习研究的完整工程流程,包括读论文、搭环境、写代码、跑实验和迭代调试,全程无需人工干预。系统核心设计是"薄控制、厚状态":由轻量指挥官协调专业代理团队,通过"文件即通道"机制将所有中间成果持久化存储,使每轮工作都能建立在前一轮积累的基础上。在PaperBench和MLE-Bench Lite两个基准上,系统表现显著优于现有最强对比系统,论文发布于2026年4月。

  • 字节跳动发布GRN:像人类画家一样"边画边改"的AI图像生成新范式

    字节跳动发布GRN:像人类画家一样"边画边改"的AI图像生成新范式

    这项由字节跳动发布的研究(arXiv:2604.13030)提出了生成式精化网络(GRN),一套模仿人类画家"边画边改"直觉的视觉生成新框架。其核心包括两项创新:层级二进制量化(HBQ)通过多轮二分逼近实现近乎无损的离散图像编码,以及全局精化机制允许模型在每一步对整张图像的所有位置重新预测并随时纠错,从根本上解决了自回归模型的误差积累问题。配合基于熵值的自适应步数调度,GRN在ImageNet图像重建(rFID 0.56)和生成(gFID 1.81)上均创下新纪录,并在文本生成图像和视频任务上以20亿参数达到同等规模方法的领先水平。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-