最近AI芯片领域的新闻层出不穷,借助今天文章为大家做一番简单的整理。篇幅有限,内容可能较为简短,后续也将在其他文章中做进一步补充。
先从几条大新闻开始。Amazon AWS于12月1日的年度AWS re: Invent大会上发布了两项重要的AI声明。首先,AWS掌门人Andy Jassy宣布将在其弹性云体系中提供英特尔的Gaudi训练芯片。AWS的实际部署,也让我们第一次对Gaudi给予确切关注。对于英特尔来说,在去年投入20亿美元收购Habana Labs并由此拿下Gaudi项目之后,这也代表着一个期待已久的好消息。
图一:Amazon AWS的全面部署,堪称Habana Gaudi训练芯片设计成果的首次公开亮相。
第二点,也是更令人惊讶的一点:Jassy宣布AWS将在2021年下半年推出其内部开发的训练专用芯片,即“Trainium”。AWS宣称Trainium将成为云端速度最快的AI芯片。对Trainium、Gaudi以及英伟达GPU的全面支持,也代表着AWS继续践行其为客户提供多种技术选项以满足特定需求的长期发展策略。从定位上看,Trainium似乎将成为Inferentia的完美搭档——后者由AWS于去年发布,而且已经成为实际部署的专用推理芯片。
高通公司在12月1日召开的年度骁龙峰会上发布了最新一代骁龙处理器,即骁龙888。新款移动芯片采用高通的第六代AI引擎,此引擎已经成为AI融合处理单元,在Int-8性能方面可达到26 TOPS。这套引擎还简化了此前的三域设备,可支持标量、张量与矢量运算。此外,该引擎还将片上内存提升达16倍,用以处理体量更大的模型。
接下来,让我们把目光投向初创企业。
• SimpleMachines公布用于低功耗推理的芯片。根据目前的规格数字来看,这家初创企业的芯片似乎颇具吸引力:仅需4瓦功率即可实现35 TOPS(8-bit)。该公司称这款芯片的核心优势在于其“可组合行为执行”技术,意味着芯片能够操纵并理解程序属性(例如数据大小与程序大小)并据此进行存储与执行优化。
• Mythic是一家位于得克萨斯州奥斯汀市的初创公司,其采用模拟处理路线进行推理。该公司最近宣布开始向部分选定客户提供芯片样品。Mythic宣称其计算密度可达数字式同类产品(我们姑且认为这里指的是T4芯片)的50倍,而成本仅为二十分之一。Mythic Analog Compute Engine则用于解决4-bit与8-bit推理作业的嵌入式及边缘推理应用。我们将持续关注相关消息,并为大家及时带来最新报道。
• Imagination是一家位于英国的中国企业,专门提供手机GPU及其他IP方案。该公司刚刚公布了其AI Series 4多核心NNA芯片IP。根据发言人的表述,其目标主要针对汽车智能这一尚未被科技巨头明确占领的市场。SoC设计人员可以获取许可,并将这套极为强大的高可扩展IP方案嵌入自家芯片。据我所知,其每瓦性能可达到30 TOPS,这也使其成为当前单位功率性能最高的DNN处理器。期待这一令人振奋的项目能够发布更多后续消息。
总结
AI领域的“寒武纪生物大爆炸”终于来临,知名芯片厂商、云服务供应商以及初创企业的新款芯片正全力冲击推理与训练等目标。但这还只是第二轮比拼,希望明年会发布更多相关消息。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。