最近AI芯片领域的新闻层出不穷,借助今天文章为大家做一番简单的整理。篇幅有限,内容可能较为简短,后续也将在其他文章中做进一步补充。
先从几条大新闻开始。Amazon AWS于12月1日的年度AWS re: Invent大会上发布了两项重要的AI声明。首先,AWS掌门人Andy Jassy宣布将在其弹性云体系中提供英特尔的Gaudi训练芯片。AWS的实际部署,也让我们第一次对Gaudi给予确切关注。对于英特尔来说,在去年投入20亿美元收购Habana Labs并由此拿下Gaudi项目之后,这也代表着一个期待已久的好消息。
图一:Amazon AWS的全面部署,堪称Habana Gaudi训练芯片设计成果的首次公开亮相。
第二点,也是更令人惊讶的一点:Jassy宣布AWS将在2021年下半年推出其内部开发的训练专用芯片,即“Trainium”。AWS宣称Trainium将成为云端速度最快的AI芯片。对Trainium、Gaudi以及英伟达GPU的全面支持,也代表着AWS继续践行其为客户提供多种技术选项以满足特定需求的长期发展策略。从定位上看,Trainium似乎将成为Inferentia的完美搭档——后者由AWS于去年发布,而且已经成为实际部署的专用推理芯片。
高通公司在12月1日召开的年度骁龙峰会上发布了最新一代骁龙处理器,即骁龙888。新款移动芯片采用高通的第六代AI引擎,此引擎已经成为AI融合处理单元,在Int-8性能方面可达到26 TOPS。这套引擎还简化了此前的三域设备,可支持标量、张量与矢量运算。此外,该引擎还将片上内存提升达16倍,用以处理体量更大的模型。
接下来,让我们把目光投向初创企业。
• SimpleMachines公布用于低功耗推理的芯片。根据目前的规格数字来看,这家初创企业的芯片似乎颇具吸引力:仅需4瓦功率即可实现35 TOPS(8-bit)。该公司称这款芯片的核心优势在于其“可组合行为执行”技术,意味着芯片能够操纵并理解程序属性(例如数据大小与程序大小)并据此进行存储与执行优化。
• Mythic是一家位于得克萨斯州奥斯汀市的初创公司,其采用模拟处理路线进行推理。该公司最近宣布开始向部分选定客户提供芯片样品。Mythic宣称其计算密度可达数字式同类产品(我们姑且认为这里指的是T4芯片)的50倍,而成本仅为二十分之一。Mythic Analog Compute Engine则用于解决4-bit与8-bit推理作业的嵌入式及边缘推理应用。我们将持续关注相关消息,并为大家及时带来最新报道。
• Imagination是一家位于英国的中国企业,专门提供手机GPU及其他IP方案。该公司刚刚公布了其AI Series 4多核心NNA芯片IP。根据发言人的表述,其目标主要针对汽车智能这一尚未被科技巨头明确占领的市场。SoC设计人员可以获取许可,并将这套极为强大的高可扩展IP方案嵌入自家芯片。据我所知,其每瓦性能可达到30 TOPS,这也使其成为当前单位功率性能最高的DNN处理器。期待这一令人振奋的项目能够发布更多后续消息。
总结
AI领域的“寒武纪生物大爆炸”终于来临,知名芯片厂商、云服务供应商以及初创企业的新款芯片正全力冲击推理与训练等目标。但这还只是第二轮比拼,希望明年会发布更多相关消息。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。