微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 高通重新定义高通:我们不再只是芯片公司,而是全栈AI解决方案公司

高通重新定义高通:我们不再只是芯片公司,而是全栈AI解决方案公司

2026-06-25 21:52
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2026-06-25 21:52 高飞

是时候重估高通了。因为这家公司刚对自己做了一番AI时代的重新定义。

重估的分水岭则是今早的高通投资者日活动。

CEO安蒙(Cristiano Amon)在台上提到,6月底这个活动日期距离他正式就任CEO刚好五年,而他大约30年前以工程师的身份加入了这家公司。五年前的投资者日上,他提出了业务多元化转型目标。五年后的这场活动,是对那份答卷的一次完整更新。

这场活动说是投资者日,但也可以叫技术发布日。

安蒙宣布了高通正式进入数据中心市场,发布了服务器CPU、AI推理加速器和数据中心连接产品的完整路线图,并设定了2029财年150亿美元的数据中心收入目标。同日,微软 CEO Satya Nadella和Meta创始人Mark Zuckerberg分别通过视频确认,将在各自的下一代数据中心中部署高通的芯片。

高通重新定义高通:我们不再只是芯片公司,而是全栈AI解决方案公司

数据中心还只是高通在这场活动上展开的版图的一部分。加上已有的汽车、工业IoT和机器人业务,高通把2029财年非手机收入目标从18个月前设定的220亿美元直接翻倍到400亿。

华尔街有一条老经验:当一家公司同时做很多不相干的生意,投资者不会把每块业务的价值简单地做“加法”,反而会打折。因为管理层会精力分散,资源互相抢占,各业务之间没有协同。这叫“多元化折价”

这一次,市场却给出了积极的反应。活动结束后,高通盘后股价涨了超过15%。

原因何在?

其实,投资者在意的并不是表面的多元化,而是要看这些业务是否共享某种底层资产。如果做A的同时让B变得更强、更有优势,投资者是愿意给溢价的。因为这时候是在对业务做乘法。

安蒙说:“对高通来说永远不算晚。人们可能因为不同的事情不认同这家公司,但没有人会否认高通拥有扎实的技术能力。”

高通重新定义高通:我们不再只是芯片公司,而是全栈AI解决方案公司

显然,这一次华尔街认为高通所做的正是乘法。

第一个乘号:设计一次,部署四个市场

高通做端侧芯片40年,核心命题一直是三件事的平衡:性能、功耗、成本。性能要高,不然用户体验差;功耗要低,不然续航撑不住;成本要可控,消费电子追求的就是大众化。三者互相牵制,同时做好的难度很大。

同时覆盖手机、PC、汽车和数据中心四个市场,每个市场各做一套芯片,研发成本会自然要成倍增加。

高通的做法是:把芯片的核心组件设计成可复用的模块,同一个模块根据目标产品的功耗和性能需求,调整数量和配置。

具体来说,高通有两个关键的自研模块。一个是CPU核心Oryon,负责通用计算。Oryon最早用在PC芯片Snapdragon X系列上,随后部署到Snapdragon 8 Elite手机芯片和Snapdragon Ride/Cockpit Elite汽车平台,现在以250+核心的配置成为数据中心CPU的基础。

另一个是AI推理单元Hexagon NPU(神经网络处理器),专门处理AI计算。同一个NPU架构,手机里跑端侧大模型,汽车里跑ADAS(高级驾驶辅助)视觉处理,工业场景里跑机器视觉,数据中心里跑大规模推理。

核心设计只做一次,研发成本被分摊到手机的数十亿颗年出货、PC的百万级、汽车的千万级和刚起步的数据中心上。而一家只做服务器CPU的公司,同样的研发投入只能靠一个市场消化。

安蒙在台上提供了一组制造数据:高通每年完成超过75款芯片流片(tape out芯片设计定稿并送交制造),出货400亿个组件。75款流片背后不是75套独立设计,而是同一套核心模块在不同产品中的75种排列组合

第二个乘号:手机里练出来的方法论,在数据中心值钱了

模块复用解释了成本结构,但还没解释差异化。

在数据中心AI芯片领域,已有占主导地位的公司。英伟达有更成熟的GPU、更完整的软件栈、更深的客户关系。英伟达之外,玩家也依然不少,甚至OpenAI也参与联合研发了一款定制AI推理芯片。

所以,高通凭什么在这个市场有竞争力?

数据中心负责人Tony Pialis在台上给出了一种诠释。

Pialis是高通去年底收购的高速连接芯片公司Alphawave Semi的联合创始人,现在负责高通的整个数据中心业务。他发布了一个叫HBC(High Bandwidth Compute,高带宽计算)的新架构,并以此为基础推出了高通的数据中心品牌“飞龙”(Dragonfly)。

理解HBC需要先理解为什么内存对AI芯片这么重要。AI大模型在做推理时,需要不断从内存中读取数十亿甚至上千亿个参数,计算完再写回去。芯片算得再快,如果数据搬运跟不上,算力就空转。所以在推理场景下,内存带宽往往比计算能力更先碰到天花板。

当前的主流解法是这样的:在GPU旁边堆几堆HBM(高带宽内存),中间用一种叫silicon interposer的昂贵基板连接。数据在GPU和HBM之间反复搬运,本身就消耗大量电力,而HBM供不应求、interposer产能紧张,进一步推高了成本。

HBC走了一条不同的路:通过3D堆叠将计算单元直接贴在内存下方,不需要interposer,数据不用远距离搬运。而且,它用的内存不是HBM,而是LPDDR,一种功耗更低的内存规格。

LPDDR就是高通在手机上用了几十年的那种内存。

换句话说,HBC的设计思路,让计算靠近内存、减少数据搬运距离,和高通在手机SoC上做了几十年的事是同源的。手机电池容量有限,5瓦功耗预算里塞进CPU、GPU、NPU、基带和图像处理器,这迫使高通40年来持续优化、最大化每一瓦的计算产出。

这套能力过去在数据中心并不受重视,但当AI推理规模爆发、数据中心动辄需要几百兆瓦到吉瓦级电力时,“每瓦产出最多智能”成了数据中心采购清单上越来越重要的一项。

Pialis给出的数据是:HBC在高吞吐工作负载下,每瓦带宽是竞对HBM方案的6倍。搭载HBC Gen 1的AI250,单卡有效内存带宽设计指标为133 TB/s,较上一代AI200提升18倍。搭载HBC Gen 2的AI300,提升54倍。

他在台上还提了一个判断:“Tokens per watt replaces flops”过去数据中心芯片比的是flops,即每秒能完成多少次浮点运算,算力越大越好。Pialis认为新的标准应该是tokens per watt,即每消耗一瓦电能产出多少个AI推理结果(token)。

这组数字还需要产品交付后验证。但开篇提到的Nadella和Zuckerberg的视频站台,至少说明两家全球最大的AI基础设施买家已经在内部完成了技术评估,并愿意在产品量产之前就公开背书。

所以,乘法的第二个乘号,在设计方法论层:低功耗设计从手机端迁移到了数据中心。过去“功耗”是手机续航的事,现在成了数据中心总拥有成本的事。同一种能力,在新场景里兑现了新价值。

第三个乘号:软件层补上一环

前两个乘号高通早就有。

但芯片不是一种即插即用的东西,而是需要开发侧的软件支持。

如果手机上开发的AI应用不能直接跑在汽车或数据中心上,每个产品线有各自的SDK,开发者生态是断裂的。

而开发者生态恰恰是一条最深的护城河。以经营近20年的CUDA软件平台,全球数百万AI开发者的代码都写在这套体系上,换芯片就意味着重写代码。高通要进数据中心,光有硬件差异化不够,必须给开发者一条迁移路径。

投资者日当天,高通宣布以约39亿美元收购AI软件公司Modular。联合创始人兼CEO Chris Lattner在编程语言和编译器领域有很高的声誉。他创造了LLVM(全球主要手机平台和大量数据中心使用的编译器基础设施)和Apple的Swift编程语言,后来又在Google主导构建了TPU AI芯片的软件栈。

他对Modular的定位是:“这是首个从设计之初就为了统一边缘和数据中心而构建的软件平台。

高通重新定义高通:我们不再只是芯片公司,而是全栈AI解决方案公司

Modular的MAX推理引擎能让开发者写一次代码,从IoT芯片到飞龙数据中心服务器都能跑,不需要针对每种芯片重写。联合创始人兼总裁Tim Davis说,Modular在第三方硬件上执行AI推理工作负载时速度最高可提升50%。

Lattner做了一个类比:“今天感觉很像当年在Apple即将腾飞的时候。”所以:“Silicon no longer, now it's about solutions。

同一天宣布的还有与Hugging Face的战略合作。Hugging Face是全球最大的开源AI模型社区,拥有1600万名开发者和超过300万个开放模型。合作的安排是:Hugging Face的推理和存储服务将映射到高通全线产品,开发者可以通过自动化工具将开源模型直接部署到从手机到数据中心的所有高通平台,不需要针对每种硬件单独适配。Hugging Face联合创始人兼CEO Clem Delangue说,目标是让开放模型在任何地方运行,从手中的设备到数据中心的整机柜。

Modular提供的是运行时,让代码跨硬件跑通。Hugging Face提供的是生态入口,1600万开发者的模型库和部署工具链。双管齐下,软件层逐渐趋近完整。加上去年收购的开源硬件社区Arduino及其3300万活跃用户,高通在过去一年里沿着开发者生态不断落子,从硬件入口到运行时到模型库,逐层补齐。

如果Lattner说的成立,有了统一的软件层,手机和汽车的数十亿设备装机量反过来为数据中心产品提供开发者基础和客户关系,而不是每进一个新市场就从零开始搭建生态。

高通就真从一家按颗数卖芯片的公司变成按平台卖解决方案的公司了。

400亿背后的算术

高通首席财务官 Akash Palkhiwala把高通的历史概括为三次转型:从连接公司到计算公司,从手机公司到全边缘设备公司,现在从设备公司到“云+设备公司”。非手机业务从2025到2029年的年复合增长率要达到约40%,同期每股收益目标超过18美元(Non-GAAP),远高于分析师此前预期。

高通重新定义高通:我们不再只是芯片公司,而是全栈AI解决方案公司

安蒙用了一个概念来描述高通的版图:从毫瓦级到千瓦级的整个计算连续体。比如,2毫瓦是一颗IoT传感器的功耗,200千瓦是一个数据中心机柜的功耗。高通的赌注是,这个频谱上的每一个节点都能从同一套底层资产中获益。

安蒙把过去几年的做法称为“潜艇策略”。收购Alphawave、开发HBC、签约hyperscaler,这些动作过去几年逐一完成,但每一步单独拿出来都不够构成一个完整故事。只有拼到一起,真实的样子才浮出水面。这或许也解释了为什么华尔街此前的预期偏差这么大:能力不是从零发布的,而是选择了一个时间点集中释放。

另外,高通公司的再定义,在全球所有市场中叠加最密集的地方之一即是中国。

理由很多。比如其一:同一批合作伙伴在多条产品线上同时部署高通平台:荣耀既出搭载骁龙X系列的AI PC,也在手机上用骁龙8 Elite;零跑的旗舰车型D19搭载了双骁龙8797中央计算平台,是全球首款将座舱和驾驶融合在同一芯片组上的量产车;小米、Rokid在AI眼镜上部署骁龙AR1;骁龙数字底盘自2021年至今支撑了中国车企超过300款在售车型。中国产业链从新平台到量产的压缩周期,让模块复用策略在这里获得了最快的规模验证。

AI落地速度是其二。安蒙提供了一个判断,终端专为用户操作而设计;而现在,随着智能体的发展,它将主动接管设备的运行,并帮用户执行操作。这一趋势已开始显现,智能体体验的创新也正率先在中国落地。

高通重新定义高通:我们不再只是芯片公司,而是全栈AI解决方案公司

当然,乘法能不能算通,也要看具体的时间表。高通飞龙C1000要2028年才量产,HBC Gen 1要2027年中才交付。高通面对的挑战和它描述的机会一样具体。

但安蒙在台上引用了一个预测:2026到2030年全球token需求将增长约40倍,数据中心电力供应日益成为硬约束。如果趋势确立,那过去40年被手机电池倒逼而来的能力,在接下来的AI基础设施竞争中或许比过去任何时候都会奏效。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-