笔者在过去两年的1月里都会公布自己对未来一年里新的人工智能(AI)芯片的预测。和天气预报员一样,我也搞错过一些细节,但我的预测还是相当准的,至少在方向上是准的。那么我们现在又来看看2021年可能的发展及失败。我这些预测不是基于内部或保密协议的信息,只是我的观点。
▲ 2021年数据中心的AI主流处理器是英伟达A100 GPU(图:英伟达)
2021年人工智能硬件十大预测:
1. 英伟达继续保持在数据中心AI领域的主导地位。英伟达除了占据了接近100%的训练市场外,还将凭借旗下全新的多实例GPU在云推理处理领域呈现良好发展势头。其中,英伟达A100的MIG(英文Multi-Instance GPU多实例GPU缩写)功能为云解决方案供应商提供了更大的灵活性,而且还可以降低硬件配置成本。此外,英伟达的汽车业务也在今年下半年将开始出现增长。
2. 英伟达成功收购Arm,并将利用其授权商业模式将Jensen Huang不屑于产品化的技术进行货币化。
3. 即便笔者上述收购Arm的预测错了,英伟达也将宣布推出一款基于Arm的服务器实现CPU和GPU的紧密耦合。(该服务器可能要到2022年才能发货)。
4. 自家芯片设计的诱惑将促使大多数"七强"超大规模数据中心推出专有的AI推理处理器。这些专有芯片针对特定用例和业务需求进行定制,主要影响到英特尔Xeon,并将构成对初创公司的巨大阻力。
5. 尽管存在上述的趋势,高通AI100平台的性能和功耗效率仍将确保至少一个超大规模数据中心的胜利。假若这个未能实现,高通可能会关闭旗下的数据中心。
6. 谷歌将推出TPU4。谷歌曾在去年7月份发布了有关消息并公布了mlPerf基准测试,结果比之前的设计结果提高了一倍多。谷歌还将宣布推出第二代边缘TPU,边缘计算意义重大,谷歌决不会错过。
7. 英特尔借去年12月宣布的AWS胜利将为Habana Gaudi争到至少一个重大设计胜利。如果事成,就大可以说Gaudi赢得了与英伟达竞争的杆位。
8. 英特尔或将发布Habana Goya推理芯片更新,或悄悄“掐死”Goya而专注于Xeon处理器。笔者打赌是后者。
9. Graphcore将宣布取得至少一个重要的设计成果,也许是微软。其他看起来很有希望的公司包括Tenstorrent、Blaize、SambaNova和Groq。而2021年对许多初创公司来说是决定性的一年。
10.最后一个很简单:收购和被收购。说真的,手里攥着有前途技术的初创公司(如Cerebras、SambaNova、Tenstorrent、Blaize和Graphcore)可能看起来很贵,但价值也不菲。诸如AMD、英伟达、Facebook和谷歌这样的公司有能力掏钱买一个有可能代表持久突破的平台。
结论
人工智能寒武纪大爆发在2020年里从设计草图进入了数据中心和边缘设备。笔者预计2021年将迎来几十款新的AI加速芯片,有些来自初创企业,有些来自大型半导体厂商。
边缘人工智能格局的形成取决于那么几十家公司,这些公司拥有量身定制的平台,可以处理特定的模型、在不同的性能水平,功率包络和成本完成。
而相比之下,数据中心仍将是大型半导体商的天下,英伟达居龙头地位,其他一些公司紧跟其后。到2021年12月我再来读一下这份预测清单,看看我的表现如何。
各位系好安全带了,2021年看起来会是一次非常棒的旅程!
好文章,需要你的鼓励
现代大语言模型就像一栋拥有数百个房间的豪华大厦,每个房间(或称为"层")都执行特定的功能,共同协作完成复杂的语言理解和生成任务。然而,这些模型的规模已经变得如此庞大,以至于只有拥有高端计算资源的机构才能负担得起它们的运行成本。这就像一辆耗油量极大的豪华跑车,普通人负担不起它的燃料费用。
想象一下,当你在解答一道复杂的数学题时,你不仅需要给出答案,还需要详细解释每一步推导的理由,不能有任何逻辑跳跃或假设——这就是形式化数学推理的严格要求。
想象一下日常生活中我们使用的语音助手,比如Siri或ChatGPT。它们通常是这样工作的:你问一个问题,它回答,然后安静地等待你的下一个指令。这就像是一个只会被动回应的服务员,永远等待你的呼唤。而Voila团队认为,真正高级的AI助手应该更像一个时刻准备着的好朋友或队友,能够自然地融入你的生活节奏中。
想象一下,你正在参加一场料理比赛,有两位评委。第一位评委只给你一个分数,而第二位评委会详细解释你的菜品在口感、创意和技巧上的表现如何,然后才给出最终评价。显然,第二位评委的反馈对于你改进厨艺更有帮助。伊利诺伊大学研究团队正是秉持这一理念,开发了能像第二位评委那样工作的AI评估系统。