
过去几年,AI芯片初创企业如雨后春笋般涌现。如今,一批早期参与的企业已经开始走向成熟,并通过增加模块及芯片卡等方案扩展其产品范围,同时凭借出色的芯片设计与全球分销渠道建立起自己的市场竞争优势。
Hailo模块
来自以色列的AI芯片初创企业Hailo已经推出两款基于其Hailo-8 AI加速器芯片的AI加速器模块,主要面向边缘应用场景。这些模块采用标准的M.2与mini-PCIe格式,适用于智慧城市、智能零售、智能家居以及工业4.0应用场景中的无风扇“边缘设备”。这些边缘设备主要用于执行多视频流分析等任务,旨在以边缘部署方式减少延迟并避免数据集中引发的隐私问题。
Hailo-8的“结构定义数据流”架构使其能够以3 TOPS/瓦的性能获得26 TOPS处理通性。其拥有车载级应用许可,适用于ASIL-B应用并获得了AEC-Q100 Grade 2认证。
Hailo公司最近还公布了新数据,表示其模块在各类性能基准(包括针对谷歌Edge TPU进行了优化的EfficientNet-EdgeTPU)测试中全面击败了英特尔Myriad-X与谷歌Edge TPU(Coral M.2)模块。考虑到Hailo-8拥有高达26 TOPS的性能,而另外两位对手的峰值性能仅为可怜的4 TOPS,这样的结果丝毫不令人意外。但让人惊讶的是,Hailo的内部测试发现,谷歌Edge TPU模块的平均性能可达参数看似相近的英特尔Myriad-X模块的2倍。
Hailo芯片与两大市场领导者正面对垒,图中柱状所示为各种模块的每秒处理帧数。
Hailo-8已经在富士康的边缘设备BOXiedge中使用,该边缘设备主要用于在边缘位置上处理视频。这款无风扇设备配备有Socionext提供的SynQuacer SCA11并行处理器外加Hailo-8,可用于加速深度学习推理过程。
这家位于特拉维夫的初创企业成立于2017年,目前拥有100多名员工。迄今为止,他们已经从NEC及ABB等战略投资机构手中筹集到超过8800万美元资金。
Groq卡
Groq目前正以服务器节点的形式出售其张量流处理器(TSP)芯片,该芯片将8张PCIe卡集成于一体,借此在数据中心内快速执行AI推理。Groq的TSP达到1 POPS(1000 TOPS),这使其成为业界功能最强大的TSP之一。根据Groq公布的数据,其在ResNet-50 v2数据集上批次大小为1的测试中,可以达到18900 IPS(每秒推理次数),这无疑是目前速度最快的商用AI加速器芯片。
Groq的处理器具有极为精简的硬件设计,且执行规划任务在软件层面进行。Groq的编译器负责协调所有数据流及时序,确保计算不会发生停顿,借此让延迟及性能具有更好的可预测性。
该公司最近宣布已获得新的资金注入,但拒绝透露具体资金筹措数额。此外,Groq还暗示正在扩大受众市场,包括汽车行业。
Groq节点是一台包含8块TPU芯片的5U设备,可提供高达6 POPS的AI推理性能。
新的Groq节点整合有8块Groq卡(8个TPU芯片),可提供6 POPS性能,尺寸为5U且功率为3.3千瓦。Groq方面解释称,这种性能与功耗的完美结合,将使该产品在优化数据中心总体拥有成本(TCO)方面拥有显著优势。
Graphcore分销网络
来自英国的AI加速器初创企业Graphcore宣布已经正式建立起全球渠道合作伙伴网络。
该公司是2018年率先推出芯片产品的厂商之一,并于今年夏季公布了第二代芯片。Colossus Mark 2的推出,承载着Graphcore与市场领先者英伟达正面竞争的野心,其可在数据中心内带来高达约250 TFLOPS的AI训练性能。Graphcore的系统级解决方案IPU设备是一款1U服务器刀片,其中包含4块Colossus Mark 2芯片,可提供FP16精度的Petaflop级AI计算能力。其同时提供IPU-POD,可保证16台IPU设备串连或并行运作。
Graphcore的IPU-POD内装有16台面向HPC类应用的IPU设备(共64块IPU芯片)。
Graphcore方面表示,其IPU已经在金融服务、医疗保健、消费级互联网、学术研究等众多领域得到实际应用。
Graphcore的“精英合作伙伴计划”意在建立一套IPU设备分销商及转售商网络。合作方包括服务器制造商戴尔、浪潮、2CRSI以及科学超级计算机制造商Atos,欧洲分销商Boston Limited,系统集成商BSI,中国分销商Digital China,科学计算分销商Lambda,总部位于香港的Macnica Cytech,面向美国联邦政府客户的Meadowgate Technologies,韩国分销商Megazone,英国HPC技术分销商OCF,HPC服务器制造商Penguin Computing,分销商Tech Data Europe与US,外加关键任务/美国政府专业供应商Wildflower International等。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。