微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

解决AI大难题：如何降低AI运行对能源的消耗？

AI能源消耗游戏娱乐

解决AI大难题：如何降低AI运行对能源的消耗？

作者：科技行者

2021-03-18 16:03

分享至：

缩小模型体量、提升模型效率已经成为深度学习的未来发展方向。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2021-03-18 16:03 • 科技行者

就当下来看，AI领域实现突破性进展的深度学习模型，其规模越大，能耗和成本也随之增加。自然语言处理模型GPT-3就是个典型的例子，为了能够在准确性与速度方面与人类相匹敌，该模型包含1750亿个参数、占用350 GB内存并产生高达1200万美元的模型训练成本。而且单从成本来看，大家应该就能体会到它所消耗的海量能源。

UMass Amherst的研究人员们发现，训练大型AI模型所需要的算力往往对应超过60万英磅二氧化碳排放量，相当于五台家用汽车在整个使用周期内的全部排放！

更要命的是，这些模型在实际生产环境中（即推理阶段）还需要耗费更多能源以不断产出分析结论。根据英伟达的估算，神经网络模型运行所产生的成本有80%至90%来自推理阶段、而非训练阶段。

因此有观点认为，要保持AI技术的快速进步，我们必须想办法找到一条具备环境可持续性的道路。但事实证明，我们完全可以将大规模模型缩减为能够运行在日常工作站或服务器上的大小，且几乎不影响准确性与速度。

下面，我们先来聊聊为什么机器学习模型总是这么庞大臃肿。

当前，计算能力每3到4个月即翻一番

十多年前，斯坦福大学的研究人员发现，用于为视频游戏中的复杂图形提供处理支持的处理器（GPU）能够在深度学习模型中提供极高的计算效率。这一发现掀起一轮“军备竞赛”，各厂商争相为深度学习应用程序开发出越来越强大的专用硬件。与之对应，数据科学家们创建的模型也越来越庞大，希望借此带来更准确的处理结果。两股力量相互缠绕，也就形成了如今的态势。

来自OpenAI的研究证明，目前整体行业都处于这样的升级循环当中。2012年至2018年期间，深度学习模型的计算能力每3到4个月就翻一番。这意味着六年时间内，AI计算能力增长达惊人的30万倍。如前所述，这些算力不仅可用于训练算法，同时也能在生产环境中更快带来分析结果。但MIT的最终研究则表明，我们达到计算能力极限的时间可能远远早于大家的想象。

更重要的是，资源层面的限制导致深度学习算法开始成为极少数组织的专属。我们当然希望使用深度学习从医学影像中检测癌细胞变化、或者在社交媒体上自动清除仇恨言论，但我们也确实无法承受体量更大、耗电量更高的深度学习模型。

未来：少即是多

幸运的是，研究人员们发现了多种新方法，能够使用更智能的算法缩小深度学习模型，并重新调整训练数据集的使用方式。如此一来，大型模型也能够在配置较低的小规模生产环境内运行，并继续根据用例提供必要的结果。

这些技术有望推动机器学习大众化，帮助那些没有充足金钱或资源的组织也能训练算法并将成果投入生产。这一点对于无法容纳专用AI硬件的“边缘”用例显得尤其重要，包括摄像机、汽车仪表板以及智能手机等小型设备。

研究人员们一直尝试删除神经网络内的某些非必要连接，或降低某些数学运算的复杂性等方式缩小模型体积。这些更小、更快的模型能够在任意位置以类似于大型模型的准确度与性能保持运行。如此一来，我们不再需要疯狂追求极致算力，也就有望缓解对环境的重大破坏。事实上，缩小模型体量、提升模型效率已经成为深度学习的未来发展方向。

另一个重要问题，则体现在针对不同用例在新数据集上反复训练大型模型方面。迁移学习技术有望消除此类问题——这项技术以预训练完成的模型作为起点，能够使用有限的数据集将模型知识“迁移”至新任务当中，因此我们不必从零开始重新训练初始模型。这既是降低模型训练所需算力的重要手段，也将极大缓解AI发展给自然环境带来的能源压力。

底线在哪？

只要有可能，模型应当、也必须寻求“瘦身”以降低算力需求。

另外，模型得到的知识应该可以回收并再次利用，而不必每次都从零开始执行深度学习训练过程。最终，一切有望降低模型规模、削减算力消耗（而不会影响性能或准确性）的方法都将成为解放深度学习能量的重要新机遇。

如此一来，任何人都能够以较低的成本在生产环境中运行这些应用程序，同时极大减轻对自然环境造成的压力。当“大AI”开始变小时，其中必将蕴藏无数新的可能。对于这样的前景，我们充满期待。

AI能源消耗游戏娱乐

分享至

0赞

好文章，需要你的鼓励

推荐文章

自对弈训练
推理能力提升
零和游戏学习

2025-07-02 14:26

AI玩游戏能让推理变聪明？新加坡国立大学发现自对弈训练的神奇效果

新加坡国立大学研究团队开发了SPIRAL框架，通过让AI与自己对弈零和游戏来提升推理能力。实验显示，仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%，通用推理提升8.4%，且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中，为AI训练提供了新思路。
计算机视觉
图像降噪
3D相机技术

2025-07-02 14:26

同济大学突破性研究：让3D相机告别"噪点困扰"的智能降噪新技术

同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息，创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系，结合深度学习和数学优化方法，在合成数据集上实现37.9%的精度提升，并在真实设备上展现出色泛化能力，为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。
人工智能
视觉语言模型
强化学习

2025-07-02 14:26

AI视觉推理模型的"顿悟时刻"真的存在吗？伊利诺伊大学研究揭示令人意外的真相

伊利诺伊大学研究团队通过对比实验发现，经过强化学习训练的视觉语言模型虽然表现出"顿悟时刻"现象，但这些自我纠错行为并不能实际提升推理准确率。研究揭示了AI模型存在"生成-验证差距"，即生成答案的能力强于验证答案质量的能力，且模型在自我验证时无法有效利用视觉信息，为AI多模态推理发展提供了重要启示。
大语言模型
稀疏性训练
计算效率优化

2025-07-02 14:25

MIT团队发明"智能减肥法"让AI训练快1.6倍：只需要一半的算力就能教会大模型新技能

MIT等顶尖机构联合提出SparseLoRA技术，通过动态稀疏性实现大语言模型训练加速1.6倍，计算成本降低2.2倍。该方法使用SVD稀疏性估计器智能选择重要计算部分，在保持模型性能的同时显著提升训练效率，已在多个任务上验证有效性。

AI玩游戏能让推理变聪明？新加坡国立大学发现自对弈训练的神奇效果

AI玩游戏能让推理变聪明？新加坡国立大学发现自对弈训练的神奇效果

2025-07-02 14:26

同济大学突破性研究：让3D相机告别"噪点困扰"的智能降噪新技术

同济大学突破性研究：让3D相机告别"噪点困扰"的智能降噪新技术

2025-07-02 14:26

AI视觉推理模型的"顿悟时刻"真的存在吗？伊利诺伊大学研究揭示令人意外的真相

AI视觉推理模型的"顿悟时刻"真的存在吗？伊利诺伊大学研究揭示令人意外的真相

2025-07-02 14:26

MIT团队发明"智能减肥法"让AI训练快1.6倍：只需要一半的算力就能教会大模型新技能

MIT团队发明"智能减肥法"让AI训练快1.6倍：只需要一半的算力就能教会大模型新技能

2025-07-02 14:25

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情链接

京ICP证15039648号京ICP备15039648号-9 京公网安备 11010802021500号

北京第二十六维信息技术有限公司（至顶网）版权所有。 | 联络我们

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱: jubao@zhiding.cn 　网上有害信息举报专区：https://www.12377.cn