微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 AI的下半场,从存储开始:Solidigm和它的中国引擎

AI的下半场,从存储开始:Solidigm和它的中国引擎

2026-06-02 19:42
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2026-06-02 19:42 高飞

作者|高飞

采访Solidigm联席CEO郭炘,是在Solidigm上海办公室。位置很好找,进了园区就能看到一栋冠有Solidigm Logo的大楼。熟悉商业物业规则的人应该知道,为办公楼冠名需要一定程度的使用面积。所以,我们可以将其作为Solidigm在中国体量的注脚。一楼也正在装修,据说未来会规划成Solidigm的企业展示中心。

而在办公区,我发现整体设计风格,用了一种介于蓝与紫之间的色调。用过AI工具的人对这个色系应该不陌生,从Cursor到Claude Code,再到Codex,几乎所有主流AI产品的默认输出都选了这个色调。Solidigm同事告诉我,风格是公司成立之初就定下来的,比这一轮AI热潮早了好几年。

AI的下半场,从存储开始:Solidigm和它的中国引擎

Solidigm是一个新名字,但富有历史传承。

它脱胎于英特尔的闪存芯片业务,现在是SK海力士的全资子公司。这家公司自己造存储芯片,自己设计控制器,再把它们组装成企业级SSD(固态硬盘),服务云厂商和数据中心等客户。探访Solidigm后,我有一个感觉,Solidigm现在的核心业务,正和前边我们提到的两个细节有关,AI和中国市场:AI正在重写存储行业的规则;在中国,Solidigm则有非常值得讲的独特故事。

我们先讲AI和存储。

AI的下半场,从存储开始:Solidigm和它的中国引擎

01/存储,AI 算力的新入场券

过去几年行业的注意力几乎全部集中在算力端,更多的GPU、更大的集群、更高的算力密度,那是上半场的故事。下半场的分界线是Agentic AI,重构着AI基础设施架构,影响最大的就是存储。用郭炘的说法,存储的瓶颈不打通,GPU很可能就是在空转烧电。

原因在于Agent的运行模式和早期LLM的ChatBot非常不同。

Agent会自行拆解任务、反复查询数据库、在多轮推理中不断生成中间结果。这个过程中产生的大量上下文数据,以一种叫KV Cache的形式驻留在系统中,可以理解为AI在"思考"过程中生成的临时记忆。记忆自然是值得保存的,否则,每次新请求都意味着重新计算,既浪费GPU算力又拖慢响应速度。

问题是保存在哪里。AI算力中心的传统存储是分层的:最快的是GPU显存,往下是主机内存(DRAM,业内称为第3层),再往下是传统的网络存储(第4层)。第3层速度快但容量小且贵,第4层容量大但速度慢。如果要保存KV Cache并按需加载,需要一个介于GPU显存和传统存储之间的新层级,速度足够快、容量足够大、成本又不能像高带宽内存(HBM)那样达到每TB万美元的量级。过去的数据中心架构里并没有这样一个层级。

因此,NVIDIA在GTC 2026上发布了CMX(Context Memory Storage),上下文记忆存储。CMX做的事情,就是在第3层和第4层之间插入一个新的"3.5层",用闪存专门存放KV Cache这类需要快速存取的临时数据,速度接近内存,容量和成本又远优于内存。

而闪存,几乎是承接这个层级唯一可负担的规模化路径。Solidigm也正是NVIDIA CMX平台的合作伙伴。

郭炘解释,这股潮流,也是造成企业级SSD在2026年如此紧缺的重要原因,驱动力来自底层架构的整体换代,而非短期的需求波动。他打了一个比方:以前得先搜索、搜完自己想,现在只需要告诉Agent"我要研究这个课题",它自己去找论文自己分析,背后的数据调用量远超从前。以前增长取决于地球上有多少人在用互联网,现在取决于有多少算力支撑人机交互。存储的服务对象从人换成了机器,而机器是比人贪婪得多的数据消费者。

服务对象变了,客户评判存储的标准也跟着换了一套。

02/硬件趋同,但软件分野

一同接受采访的Solidigm亚太区销售副总裁倪锦峰观察到,AI起来之后不管是大客户还是小客户,关心的都不再仅仅是SSD的实验室跑分成绩。

AI的下半场,从存储开始:Solidigm和它的中国引擎

传统的测评方法是测四个指标:大文件连续读、大文件连续写、小文件随机读、小文件随机写,业内叫"四角跑分",谁的数字高谁就赢。

但现在客户在意的是另一件事:这块SSD装进整套方案之后,到底跑出什么样的实际结果。比如TTFT会怎么样?TTFT是首Token时间,也就是用户发出请求后AI吐出第一个字的等待时间。是非常重要的模型性能指标。

这个转变看起来微妙,实际上是根本性的,因为单盘跑分漂亮的产品到了集群环境里往往会暴露出意想不到的瓶颈。

郭炘举了一个例子:有些客户买了很多TLC闪存盘(每个存储单元存3比特数据,速度快但单位容量成本高),配置不当的话集群性能跑出来可能还不如QLC(存4比特,同样的芯片面积能装更多数据,所以容量大、单位成本低,但读写速度相对慢)。问题不在硬件本身,在于没有针对实际工作负载做系统级的优化。

要理解为什么优化空间如此之大,需要先纠正一个常见的误解:大多数人把SSD想成一个存数据的零件,插上就用。

但是"存储也是一种计算机",有自己的硬件,也有自己的软件。

郭炘说,一块SSD里有50多个元器件、15大类部件,控制器本身就是一颗SoC(片上系统)。这些零件全球的供应商都能采购到,硬件层面的趋同是大势所趋。

差距体现在产品的具体配置组合,和软件体系。用倪锦峰的话说:硬件是基础,Firmware是灵魂。

Firmware,中文叫固件,简单说就是SSD的OS,它就是刚才我们讲的软件。固件跑在控制器上指挥整块SSD怎么干活:数据往哪里写、按什么顺序读、同时来了一百个请求先响应谁。手机换一个操作系统体验天差地别,SSD自然也是一样,同样的硬件刷进不同的固件,跑出来的性能可以差出很远。所以,真正拉开产品差距的,除了硬件配置,更为关键的,是写在固件里的那些对工作负载的理解和针对性优化。

但最优的性能不是单靠固件写出来的,还取决于在真实场景中找到软件、固件和硬件配置的最佳组合。这就是Solidigm在加州Rancho Cordova投资建设AI中央实验室的动因。

这个实验室,配备了完整的GPU集群、网络环境和存储设备,向客户免费开放。存储厂商VAST Data和Solidigm的合作是一个典型案例:VAST的客户如果不确定该选哪种Box配置,可以到这个实验室跑自己的真实工作负载,找到最合适的硬件组合之后再回去采购。对VAST Data来说这降低了客户的决策门槛,对Solidigm来说则意味着各种真实应用场景下的工作负载数据源源不断地回流到产品研发端,而这些数据是坐在实验室里凭想象造不出来的。Solidigm也在参与ODCC(开放数据中心委员会)等行业组织的标准建设,把自己从实验室和客户端获得的认知贡献到更广泛的生态中去。

为了离工作负载更近,Solidigm甚至开始协助做SSD之外的应用软件。郭炘提到公司在做工业领域的AI视觉分析,和一家大型德国制造商合作,对方原来检测焊点缺陷需要派几个高级技工在全球不同地方逐张看照片,速度非常慢。Solidigm帮他们在工厂流水线上部署了本地AI(业内叫Edge AI,即不上云、在设备端直接运行的AI)先做一轮筛查,真正有问题的数据再上传到云端由技工和AI协同处理。这个逻辑和实验室是一样的,不管是建实验室还是写软件,最终都是为了离工作负载更近一步。而且这类本地AI加云处理的架构,两端的数据量都在大规模增长,最终还是回到对存储的需求上来。

倪锦峰把Solidigm的方法论概括为三句话:Platform connected,产品和平台深度关联;Workload centric,围绕真实工作负载做固件调优;Solution mindset,从研发到销售脑子里装的都是交钥匙方案。郭炘用一个常见的情况来解释:客户团队单看纸面数据觉得友商的指标比Solidigm高,但一跑上真实应用Solidigm的性能反而高出很多。纸面输实战赢,秘密藏在know-how里。

03/不只是本地化,而是另一套逻辑

固件优化是针对具体工作负载的,而具体到中国市场,由于应用场景和基础设施条件与海外不同,工作负载又多了一重差异。郭炘说,Solidigm的"双引擎"组织架构,就成了一种优势。

这里需要再具体交代一下这家公司的资产布局。Solidigm的闪存颗粒目前很大一部分在大连工厂制造,产品设计和全球市场运营在加州Rancho Cordova,上海则是亚太研发和销售中心,配备了完整的工程实验室和客户支持团队。

换句话,"双引擎"不是一个比喻,而是一个物理事实:这家公司的制造、研发和市场能力,本来就分布在国内外两端。这也意味着,当两个市场的工作负载出现差异时,中国客户有个性化需求时,Solidigm有条件在本地直接响应。

倪锦峰则对中国市场的具体特色,和国内外差异,做了进一步阐述,主要体现在三个方面。

先说成本。

中国的Token价格被压到了极低的水平,在有限预算里把推理落地本身就是高难度命题。DeepSeek是一个典型,对硬件价格的容忍度相对低但对性能优化的要求极高;而海外市场更多受制于能源和物理空间的硬约束,大容量QLC SSD的需求主要由"机房装不下、电费扛不住"来驱动。两种约束条件催生的存储方案诉求,从出发点就是不同的。

再看迭代节奏,差距更加明显。

中国有大量本土AI芯片厂商,合在一起差不多两三个月就迭代一次。SSD产品的传统迭代周期以前大约两年,现在已经也趋近于六个月,如果每个本土化需求还要回在加州排队审批,客户需求早已变化了。况且,中国有自己被广泛使用的本土GPU等算力产品,必须由本土团队在当地去做适配和优化。

成本结构不同、迭代节奏不同、AI算力生态不同,这些加起来远超"本地化"三个字能概括的范围。本地化的意思是同一个产品搬过来、配一个本地团队做支持;而Solidigm在中国面对的情况是,产品本身的逻辑就要不一样,给什么样的工作负载优化固件、围绕什么样的芯片做适配、按什么样的成本结构设计方案,起点就是不同的。

郭炘给出的应对是"在中国,为中国",跨国公司里这句话可能不算新鲜,但他后面跟了一个异常具体的刻度:力争90%的客户定制化诉求和问题都能在国内独立解决。

倪锦峰说这个数字已经接近达成,中国团队基本上是一个自成体系的Solidigm,研发、销售、客户支持、品管一应俱全,端到端的能力基本都有。

支撑这个数字的是可验证的具体能力:客户有新场景可以直接在中国的联合实验室里跑POC实验,跑完出定制方案;紧急情况下当天就能派工程师去现场;中国售卖的很多SSD都经过了针对本地客户的固件定制和优化。对比之下,很多跨国公司的流程是客户先写一个ticket给销售、销售再去协调其他国家的技术团队,Solidigm中国团队能把这个响应周期压缩到同一天。这个差距不是流程优化能弥补的,本质上是组织架构层面的选择。

落到国内市场的产品层面,北边的客户、中间的客户、南边的客户还各有不同的工作负载特征,产品能够围绕这些差异做多样化的固件调优。同一块硬件,写进了对不同市场、不同客户、不同应用场景的深度理解,在不同的土壤里各自跑出最优的性能曲线。这不是把一个产品翻译成中文版,而是从固件层重新写了一遍。

而且,这套逻辑并不只在国内能跑通,它和海外团队之间还存在一种持续的双向喂养可能。因为不同市场,也有不同的AI优先进度。
郭炘认为物理AI是中国走得非常快的一个方向,机器人、自动驾驶、工业视觉这些领域正在中国率先形成规模化的应用,意味着相应的存储工作负载特征可以先在中国被定义、被理解,然后才扩展到全球市场。

一个市场的经验在另一个市场被转化、被复用,反过来又催生出新的产品方向。这才是"双引擎"真正的含义,不是两个市场各做各的,而是两套不同约束条件下的认知在一个体系内循环流动。

04/创新"快与慢"

我们之前一直在说快,但是接下来要谈的,反而是慢。换言之,是长期主义。

2025年3月的GTC上,Solidigm就展示了业界首款冷板液冷企业级SSD的样品,同年9月,这款D7-PS1010 E1.S正式发布,适配Supermicro基于NVIDIA HGX B300的GPU服务器。

我问郭炘Solidigm怎么能率先做出这个产品,他开玩笑的说"有一部分是运气,但另一部分是实力"。

实力的部分是几年前团队就判断节能减排和提高能效是一个确定的长期趋势,于是开始研发液冷方案;运气的部分是NVIDIA恰好在推进下一代密集GPU架构时遇到了风冷散热的瓶颈,试了Solidigm的液冷方案之后认可了这个方向,就基于它定制了整套液冷规范。

而明明都认为液冷是趋势,为什么Solidigm能先做出来?郭炘的回答是:即使在短期业务有挑战的时候,Solidigm也没有关闭这些需要长期投入的项目,一直在推进,所以当窗口打开的时候他们是唯一准备好了的。

倪锦峰从另一个角度补充:很多公司把存储当做Commodity来经营,Solidigm从来不这样看,要做行业第一就必须坚持在平台和解决方案层面做长期积累。他把这个逻辑推到底:"存储是需要规模的,没有规模,创新的价值就很难完全体现。"

液冷的故事让我开始重新理解前面聊到的那些"快"。中国团队能六个月迭代一次、能当天派工程师到现场、能为不同区域的客户写不同的定制固件,这些敏捷能力看起来是组织和管理的胜利,但往深处追问就会发现,它们全都依赖一个前提:你得自己掌握从NAND闪存颗粒到专用控制芯片(ASIC)到整个模组设计的全部环节。

这一点在QLC产品上体现得尤为明显。Solidigm的122TB QLC SSD P5336是全球率先批量出货的超大容量QLC产品,市场上各家都宣布过类似规格,但真正在大规模出货的是他们。在一个吉瓦级AI工厂(单园区耗电量相当于一座百万人口城市)可能需要数十EB(1 EB等于10亿GB)闪存的时代,大容量QLC的规模化供应能力本身就构成壁垒。而2026年又恰恰是闪存产能极度紧张的年份。在SSD合约价格季度涨幅动辄超过50%、客户开始签五年长期供货协议的背景下,拥有完整自研能力和上游长期合作关系的公司,和依赖外购拼装的公司,面对的是完全不同的处境。

Solidigm的正在尽力提升供应韧性,但倪锦峰坦言需求远超整个行业的供应能力,有行业分析认为2027年可能比2026年更具挑战。在这种环境下,自研闪存颗粒、自研专用控制芯片、拥有完整模组设计和制造能力这件事的意义就变得格外突出。倪锦峰解释说产能扩张有两条路,一是技术迭代推进制程升级但需要时间、客户验证也需要时间,二是扩建工厂但设备周期很长,两条路都快不了。

倪锦峰提到,产品紧缺的时候上游供应商会优先保障有长期合作关系和大规模体量的客户。一块SSD涉及闪存颗粒、控制芯片、电路板、电容、电阻等几十种物料,能把这条供应链握在自己手里的玩家并不多,而在缺货周期里,这种掌控力的价值会被急剧放大。

所以Solidigm的"快"和"慢"其实是同一枚硬币的两面:十年为单位的技术和供应链积累,支撑着六个月为单位的产品迭代和客户响应。没有"双引擎",为中国客户写定制固件就是空中楼阁;没有几年前就开始的液冷预研,就等不到NVIDIA的这次合作。

1984年,以色列物理学家Goldratt在《目标》一书中提出了约束理论:任何系统的总产出永远受制于它最窄的那个环节,而当你打通了当前的瓶颈,它不会消失,只会迁移到系统中下一个最窄的地方。

这个框架原本是用来优化工厂流水线的,但四十年后回头看,它几乎精确地描述了计算产业每一次权力交接的底层逻辑。大型机时代瓶颈在处理器,IBM定义了整个行业;PC时代迁移到操作系统和指令集,微软和英特尔接管了制高点;云计算时代变成网络和虚拟化,AWS重写了规则;过去三年落在GPU上,NVIDIA的市值到了与之匹配的量级。

Goldratt还有一个不太被引用的推论:瓶颈一旦迁移,上一个环节的溢价迅速消退,新瓶颈的持有者将获得与整个系统产出挂钩的定价权。每一次看起来都是技术问题,本质上都是价值重新分配。

现在,这种迁移正在发生,方向是存储。Solidigm所在的位置。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-