
作者|周雅
3月23日,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏正式给出Token 的中文名——「词元」。
如果只把这件事理解为一次术语翻译,可能会低估它。更值得注意的是,刘烈宏同时给了「词元」一个更明确的产业定位。他说,词元不仅是智能时代的价值锚点,也是连接技术供给与商业需求的“结算单位”。
这意味着,Token这个原本主要流通于工程师、模型厂商和云服务定价体系中的概念,正在被放进更正式的产业语言里。
这一步看似小,实际并不轻。
过去几年,Token 一直是大模型行业里最基础、也最高频的单位。模型训练要消耗 Token,推理调用要消耗 Token,企业买 API 服务、买模型套餐,最后大多也落到按 Token 计费。它既是计算量的刻度,也是服务成本和收入确认的依据。现在,Token 有了官方中文名,也被明确表述为“结算单位”,含义就变了。
一个词一旦进入官方语境,一方面让传播更加便利。另一方面,更意味着它开始正式具备一个能被统计、被定价、被核算的资格。
从数据看,这种变化已经有现实基础。刘烈宏披露,2024年初,中国日均 Token 调用量为1000亿,到2025年底升至100万亿,今年3月已突破140万亿,两年增长超过千倍。与此同时,他还提到,自今年1月底以来,部分模型企业创下了20天收入超过2025年全年收入的纪录。
无论是调用量的跳升,还是收入增速的变化,都说明一件事,围绕 Token 的调用、分发和计费,一套商业逻辑已经快速成形。
这或许是「词元」被单独提出的背景。
在很多新技术产业里,真正推动商业化落地的,不一定是最响亮的概念,而是最先完成统一计量的单位。工业时代靠吨、千瓦时和标准件建立大规模协作,互联网时代靠 DAU、时长和转化率重构商业判断,到了大模型阶段,词元正在承担类似角色。它让模型能力第一次有了相对统一的刻度,也让调用行为第一次可以被系统性地对账、比较和结算。
换句话说,行业讨论的重心,正在从“模型能做什么”,逐渐转向“模型的能力如何被持续计量,进而变成稳定收入”。
从这个角度看,「词元」这两个字的意义,在于它把一个工程单位往产业单位推近了一步。
当然,这里也有一个很容易被忽略的问题。词元可以成为结算单位,但它并不天然等于价值本身。不同模型、不同任务、不同场景下,消耗同样数量的词元,所对应的结果质量、服务价值和用户支付意愿,可能完全不同。有人拿词元生成一段闲聊回复,也有人拿词元完成法律检索、代码生成、金融分析或客服自动化,这背后的价值密度并不一样。
这也是为什么,词元的中文命名虽然重要,但真正值得观察的,未必只是“词元总量”本身,而是谁在生产高价值词元,谁在分发高价值词元,谁又能把词元稳定地变成收入和利润。
这会是下一阶段行业竞争更实质的部分。
从今天的节点看,官方明确“词元”这一译法,至少释放了两个信号:
第一,Token 已经不再只是模型内部的技术消耗单位,而开始被视为连接供给侧和需求侧的产业尺度。第二,AI 产业的商业化讨论,正在进入更具体的单位计量阶段。
很多时候,一个行业真正成熟,不是先有宏大叙事,而是先有一套大家都承认的计量语言。
「词元」被正式写出来,像是这样一个开始。
好文章,需要你的鼓励
加州大学洛杉矶分校等机构联合推出的Unify-Agent突破了传统AI图像生成的知识局限,通过整合"思考-搜索-整理-绘制"四步工作流程,让AI画师具备主动查找资料的能力。该系统在FactIP基准测试中相关性指标提升61%,特别擅长处理需要准确世界知识的长尾内容和文化特色图像生成任务。
中科院团队开发的FlowPIE系统首次将动态文献探索与创意进化相结合,突破传统AI科学创意生成的同质化局限。该系统通过流引导蒙特卡洛树搜索实现文献检索与创意生成的紧密耦合,并采用类生物进化机制持续优化创意质量。实验显示,FlowPIE在新颖性、可行性等维度显著超越现有方法,展现出强大的跨领域泛化能力,为AI辅助科研开辟了新路径。
阿里巴巴DAMO研究院推出Lingshu-Cell虚拟细胞建模系统,采用掩码离散扩散模型技术,能够精确模拟和预测细胞在基因编辑、药物刺激等干预下的反应。该系统在国际虚拟细胞挑战赛中表现出色,为个性化医疗和药物开发开辟了全新路径,标志着数字生物学时代的到来。
上海AI实验室联合多所高校发布GEMS技术,通过智能团队协作机制让60亿参数的小模型在图像生成上超越顶级商业模型。该系统包含循环优化、记忆管理和技能库三大核心,采用多轮迭代和专业技能匹配,在主流测试中提升14分以上,为资源受限环境下的高质量AI应用提供新方案。