笔者在过去两年的1月里都会公布自己对未来一年里新的人工智能(AI)芯片的预测。和天气预报员一样,我也搞错过一些细节,但我的预测还是相当准的,至少在方向上是准的。那么我们现在又来看看2021年可能的发展及失败。我这些预测不是基于内部或保密协议的信息,只是我的观点。
▲ 2021年数据中心的AI主流处理器是英伟达A100 GPU(图:英伟达)
2021年人工智能硬件十大预测:
1. 英伟达继续保持在数据中心AI领域的主导地位。英伟达除了占据了接近100%的训练市场外,还将凭借旗下全新的多实例GPU在云推理处理领域呈现良好发展势头。其中,英伟达A100的MIG(英文Multi-Instance GPU多实例GPU缩写)功能为云解决方案供应商提供了更大的灵活性,而且还可以降低硬件配置成本。此外,英伟达的汽车业务也在今年下半年将开始出现增长。
2. 英伟达成功收购Arm,并将利用其授权商业模式将Jensen Huang不屑于产品化的技术进行货币化。
3. 即便笔者上述收购Arm的预测错了,英伟达也将宣布推出一款基于Arm的服务器实现CPU和GPU的紧密耦合。(该服务器可能要到2022年才能发货)。
4. 自家芯片设计的诱惑将促使大多数"七强"超大规模数据中心推出专有的AI推理处理器。这些专有芯片针对特定用例和业务需求进行定制,主要影响到英特尔Xeon,并将构成对初创公司的巨大阻力。
5. 尽管存在上述的趋势,高通AI100平台的性能和功耗效率仍将确保至少一个超大规模数据中心的胜利。假若这个未能实现,高通可能会关闭旗下的数据中心。
6. 谷歌将推出TPU4。谷歌曾在去年7月份发布了有关消息并公布了mlPerf基准测试,结果比之前的设计结果提高了一倍多。谷歌还将宣布推出第二代边缘TPU,边缘计算意义重大,谷歌决不会错过。
7. 英特尔借去年12月宣布的AWS胜利将为Habana Gaudi争到至少一个重大设计胜利。如果事成,就大可以说Gaudi赢得了与英伟达竞争的杆位。
8. 英特尔或将发布Habana Goya推理芯片更新,或悄悄“掐死”Goya而专注于Xeon处理器。笔者打赌是后者。
9. Graphcore将宣布取得至少一个重要的设计成果,也许是微软。其他看起来很有希望的公司包括Tenstorrent、Blaize、SambaNova和Groq。而2021年对许多初创公司来说是决定性的一年。
10.最后一个很简单:收购和被收购。说真的,手里攥着有前途技术的初创公司(如Cerebras、SambaNova、Tenstorrent、Blaize和Graphcore)可能看起来很贵,但价值也不菲。诸如AMD、英伟达、Facebook和谷歌这样的公司有能力掏钱买一个有可能代表持久突破的平台。
结论
人工智能寒武纪大爆发在2020年里从设计草图进入了数据中心和边缘设备。笔者预计2021年将迎来几十款新的AI加速芯片,有些来自初创企业,有些来自大型半导体厂商。
边缘人工智能格局的形成取决于那么几十家公司,这些公司拥有量身定制的平台,可以处理特定的模型、在不同的性能水平,功率包络和成本完成。
而相比之下,数据中心仍将是大型半导体商的天下,英伟达居龙头地位,其他一些公司紧跟其后。到2021年12月我再来读一下这份预测清单,看看我的表现如何。
各位系好安全带了,2021年看起来会是一次非常棒的旅程!
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。