

作者 | 金旺
出品 | 科技行者
据IDC统计数据显示,2025年,火山引擎公有云大模型服务调用量位居国内第一,市场份额达到了49.2%。
这正是火山引擎总裁谭待在近日的原动力大会上豪言称“在中国公有云上,每产生两个tokens,就有一个是由火山引擎生产”的原因。
在这次大会上,火山引擎对外公布了一系列2025年最新业务数据:
火山引擎已经服务100万+企业和个人、覆盖100+行业,有100+家企业累计token使用量已经超过1万亿……
毫无疑问,火山引擎已经成长为国内又一朵无法忽视的AI云,谭待在这次大会上也一再强调,火山引擎的基础产品已经完成了从传统云基础设施到AI云原生基础设施的一次系统性升级。
在这样的技术升级过程中,火山引擎与产业生态开展了广泛合作。
值得一提的是,针对AI云基础设施,谭待在大会上从计算、存储、网络、数据库四个层面解读了火山引擎今年在基础设施层面的升级,我们在英特尔展台上看到了双方在相关领域的技术合作成果。

作为AI云基础设施的基础,火山引擎在计算层面发布了第四代本地SSD型实例、高性价比的Flex算力型实例,以及面向大模型训练、推理设计的大内存实例,这其中当然也包括基于英特尔至强6性能核处理器的火山引擎第四代通用计算型实例。
我们在大会现场的英特尔展台上,看到了基于英特尔至强6+火山引擎g4i的AI视频处理解决方案。
以视频高效解码抽帧这一应用场景为例,针对1500帧的1080p视频以100帧间隔进行抽帧时,英特尔技术专家特别提到了两项技术:
一项是,iVTAL视频解码加速软件库,基于这一软件可以将视频解码抽帧效率提升2.14倍;
另一项是,英特尔AMX加速技术,基于这一技术又可以将视频解码抽帧效率提升4.11倍。

正是在英特尔快速抽帧算法和AMX加速下,可以将这一示例中的视频OCR推理整体时间从33秒压缩到8秒左右,实现了4倍的端到端效率提升。
除了计算加速,AI计算的安全防护同样很重要。
谭待在大会上就特别发布了一项全新的服务——MaaS on AICC。
火山引擎的AICC机密计算技术是通过差分计算、同态加密、可信执行环境等方案,实现了用户数据的端到端加密,而通过MaaS on AICC,火山方舟上所有模型都可以直接运行在AICC加密计算环境中。
这其中,火山引擎Jeddak AICC机密计算平台就深入融合了英特尔TDX技术,基于开源Trusted MCP方案,利用AICC产品提供的端云互信能力,解决了原生MCP协议中服务身份不可信、数据篡改、流量劫持、隐私泄露等安全威胁,从而保证智能体之间的通信安全。

存储层面,火山引擎则是面向向量化数据升级了AI Native存储系统,包括弹性极速缓存EIC(新版本推理性能提升了87.5%、推理GPU算力消耗降低了20%)、AI Native文件系统、向量知识库存储、数据智能检索。
英特尔面向存储过程中的压缩、加密等任务有两项重要技术,数据保护与压缩加速技术QAT和数据流加速器DSA,这两项技术在开源软件中也得到了广泛应用,但火山引擎在经过调研后发现,市面上集成QAT、DSA的开源软件无法满足自身存储业务需求,于是,火山引擎与英特尔联合开发了veSAL这款开源软件。

据悉,veSAL基于英特尔至强6处理器内置的QAT及DSA,对存储系统中压缩/解压缩、加解密等高频高负载操作进行加速,已集成至高性能存储业务,并实现了性能提升与CPU资源节省双重目标。
这些技术能力的升级,加强了火山引擎面向AI的服务能力。
2025年被视为企业Agent元年,然而,据火山引擎的调研结果显示,能够做好Agent开发的企业并不多,能将Agent运营好并能大规模使用的,更是少之又少。
正因如此,我们看到,火山引擎面向Agent开发推出了一系列工具和产品,这其中就包括企业级一站式智能体工作站HiAgent。
据谭待在大会上透露,今年HiAgent已经服务了数百家企业。
在推动Agent普及应用过程中,火山引擎、英特尔、华胜天成、联想四方合作,共同面向产业推出了社区全能数字员工“华格格”一体化解决方案。
社区服务往往存在大量综合问题,一个Agent通常无法精准回答所有问题,在回答这样综合性问题时,就涉及到切换多个Agent来协同工作,如果直接进行硬切换,往往会导致上下文丢失,影响Agent工作效果,HiAgent提供的就是这样一个统一调度平台。
在“华格格”一体化解决方案中,通过HiAgent实现多智能体的跨域调度与画布式交互,显著提升了人机协同效率,与此同时,基于英特尔锐炫B60构建的一体机算力方案,不仅有效降低了部署成本,更以开箱即用的软硬一体模式,满足了快速交付与多场景灵活部署的需求。

也正是基于这样灵活的Agent解决方案,在过去一年里,企业Agent在使用广度和使用深度上得到了进一步跨越——企业平均投产的Agent数量从2024年50+个增长到了200+个,这些智能体也从轻量化试点场景扩展到了B端严肃生产场景。
而这样的技术迭代和应用爆发,仍在继续。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。