微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

2026-05-25 11:02
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2026-05-25 11:02 金旺

2026年,Agentic AI浪潮加速席卷全球,智能体从被动响应转向主动决策、工具调用与多代理协同执行,推动AI范式从对话式Chatbot向执行型任务跃迁。

与此同时,Token消耗激增、长上下文处理、毫秒级时延需求以及通算与智算的深度融合,成为算力基础设施面临的核心挑战。

5月22日,在鲲鹏昇腾开发者大会2026(KADC2026)上,我们看到了鲲鹏和昇腾构建的算力基础设施和算力生态最新进展。

昇腾方面,以超节点架构为核心,围绕CANN全面开源开放、兼容主流生态、Mind系列软件升级三大方向持续发力,全面升级开发者使能计划;

鲲鹏方面,以灵衢互联超节点架构为底座,面向Agentic AI重塑IT基础设施,推出高密度沙箱、通信加速、AI数据底座、机密Agent等系统性方案,并宣布BoostKit全面开源,同步推出全新开发者认证体系。

昇腾、鲲鹏两大生态的协同,正在为Agentic AI时代构筑起坚实、好用、易用的算力底座。

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

01 昇腾AI算力底座再升级

Agentic AI对AI基础设施的冲击是全方位的,一方面,模型调用频次暴涨50至100倍;另一方面,序列长度从ChatBot典型的4K跃升至接近1M,带来约250倍的膨胀。

KV Cache命中率突破95%的同时,Prefill成本大幅下降,而KVCache本身的成本却等比上升。MoE模型推理时延也被压缩至10毫秒、5毫秒乃至1毫秒级别,而EP的Dispatch-Combine通信成为制约时延的核心瓶颈。

面对这一系列挑战,华为公司Fellow、半导体首席科学家廖恒在大会上指出,EP通信本质上是All-to-All形式的极细粒度多对多通信,单数据包大小仅7KB至14KB,数据包交互频次随专家数量呈平方级增长,传统网络架构根本无法承载。

因此,EP通信必须在Scale Up域内完成,而昇腾950芯片凭借优异的互联能力,可构建出更高带宽、更低延时、覆盖范围更大的超节点,系统综合性能等同于超节点规模与单芯片性能规格的乘积。

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

针对KV Cache的挑战,华为创新设计了搭载UB端口的SSU单元,以直出接口接入UB网络,精简剔除传统存储系统和文件系统转换路径中的诸多障碍,使NPU可直接命中SSU的KVCache,并通过UB网络将数据传送至NPU片上内存,带宽提升至少一个数量级。

廖恒总结道,昇腾始终秉承从"芯片架构—系统架构—集群架构—软件架构"的深度协同,持续迭代硬件能力、优化CANN等基础软件,平衡生态兼容性与系统运行效率,为业界构筑坚实的算力底座。

在软件层面,CANN正在成为昇腾软件底座与生态核心,据悉,CANN已实现全面开源开放,目前已开放50余个源码仓、800余个算子,支持算子与通信库独立迭代升级,提供完整分层解耦的开发体系。

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

算子编程方面,昇腾也提供了全栈支持能力,包括面向追求极致性能的工程师,提供Ascend C和CATLASS模板库,支持对计算、访存、流水等关键环节的细粒度控制,面向注重快速创新的AI算法工程师,支持TileLang、Triton等主流Tile编程生态,并推出PyPTO,以Tensor抽象简化创新流程。

为进一步降低门槛,昇腾全面拥抱Python生态,推出PyAsc、Python版CATLASS模板库,让开发者以Python友好方式实现高性能算子开发。

昇腾还打造了CANNBot算子智能体,将微架构优化经验融入skill技能库,覆盖算子开发全流程。基于CANNBot,单个Vector算子生成仅需3小时,从生成到部署全流程可在1天内完成,相比传统人工开发效率提升5倍以上。

此外,昇腾还推出了专属算子数据集与评测集,覆盖22类典型算子、内置4000余个评测点,从功能、精度、性能多维度评估算子质量。

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

开源开放是昇腾生态的一个重要特性,基于这一特性,昇腾生态在算子编程层面,Triton和TileLang接口已实现100%兼容,性能可达Ascend C的0.6至0.9倍,开发周期缩短至一周,已支持超过600个Triton算子和300个TileLang算子。

昇腾开发者使能计划是此次昇腾生态一个重要更新,据悉,在经过此次升级后,昇腾社区可实现一键部署,2分钟跑通Demo,提供免费算力,华为还将数千名昇腾专家经验沉淀成skills,搭建Agent工作流,提供全新Agentic开发体验,开发者通过需求描述即可完成各类模型开发操作,大幅压缩开发周期。

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

此外,昇腾社区还设立了创新激励基金,投放10000卡算力,并颁发昇腾开源贡献奖,肯定开发者成果。

在会后媒体沟通会上,昇腾专家强调,今年重点是开源深化、生态兼容与Agentic开发体验提升,通过CANNBot、智能助手等工具,将算子开发效率提升5倍以上,而新一代950芯片原生支持MXFP8、FP4等格式,进一步降低了迁移门槛,与此同时,面向电信运营商、云厂商等,昇腾通过社区共治、生态孵化平台及淬火行动,助力行业AI落地。

02 算力范式跃迁,鲲鹏重塑IT基础设施

随着Agentic AI的爆发,Agent负载发生了根本性变化。

Agent控制流随任务复杂度爆炸式增长,工具调用天然运行于CPU、网络与存储之上,Tokenization、上下文拼接、记忆管理等操作持续发生,给系统带来高延迟、吞吐受限、能耗高的巨大挑战。

正因如此,华为鲲鹏计算产品部部长刘林超指出,当前最大的计算架构范式转变正是从"智算为中心"迈向"通算+智算协同"。

面对这一挑战,华为给出了以鲲鹏为底座的三层智能体架构系统解法:

底层由鲲鹏超节点提供硬核算力,灵衢互联打通数据通路,24TB统一内存池实现资源全面池化;

中间层依托openEuler异构融合操作系统,打破CPU与GPU的联接壁垒,构筑"通智网存"协同的Agent运行底座;

上层Agent Infra提供轻量沙箱、记忆服务、全链路安全等核心能力,并提出面向Agentic AI构建"新POSIX"标准的全新理念。

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

鲲鹏超节点以TB级互联带宽、百纳秒时延和全局内存统一编址为基础,重构大数据、数据库、推理等核心场景,是应对Agentic AI所要求的毫秒级沙箱、百万级上下文及10倍性能提升需求的系统级答案。

高密度沙箱基础设施方面,鲲鹏超节点依托多级缓存共享架构,结合增量快照共享与任意状态快速fork能力,回滚性能达十毫秒级,可支撑Agent任务成功率提升10%以上。强化学习训练场景中,上万个沙箱可基于共享快照和Remote fork技术实现快速并行拉起,在节约资源的同时大幅提升效率。

鲲鹏通信加速底座采用三项关键技术组合:灵衢SGL特性降低20%通信时延,透明UBSocket无需修改应用源码,时延进一步下降40%,共享TP技术多连接复用同一传输层连接,通信内存占用降低90%。

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

极致性价比AI数据底座方面,鲲鹏超节点借助共享内存实现Buffer Pool预热和快速加载,分布式全局图索引技术使多模态检索性能翻倍,通过上下文缓存减少重复注入,Agent业务Token开销降低50%,任务完成率提升20%。

与此同时,面向DeepSeek Engram"以查代算"带来的内存冗余与查表时延两大挑战,鲲鹏超节点通过节点间内存共享与软硬协同优化,以架构级创新有力支撑推理演进方向。

机密Agent安全方案方面,鲲鹏推出基于CCA架构的机密Agent方案,Agent运行于机密虚拟机中,结合eBPF技术实现容器级可信授权,防御内存dump攻击,并利用自研内生密码模块与openGauss回滚技术实现重要数据加密存储及秒级恢复。

在媒体沟通会上,鲲鹏专家告诉我们,Agentic AI推动CPU从辅助到核心调度,鲲鹏超节点契合高带宽、低时延、资源池化需求。通过AI For OS、内存池化(峰谷互补、细粒度共享、业务密度提升)等,支撑新Scaling范式。面向伙伴,将开展200+场培训、开放1500+台服务器,并将通过2026年鲲鹏展翅计划进一步进行生态激励。

回顾鲲鹏七年、昇腾数年的生态建设历程,华为始终坚守"硬件开放、软件开源、使能伙伴、发展人才"的战略主轴,以技术创新为引擎、以开源开放为土壤、以开发者生态为根基,一步一个脚印地构筑起中国算力产业的重要基石。

截至目前,鲲鹏已携手7000余家生态伙伴,联合孵化27000余个鲲鹏解决方案,积累415万名专业开发者;昇腾CANN开源社区月活开发者超过3000人,外部开发者贡献的PR数量占比已达44.5%,增速远超预期。

这些数字背后,是无数开发者用代码投出的信任票。

分享至
0赞

好文章,需要你的鼓励

金旺

Wille
关注智造、硬件、机器人。
推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-