“解好电力行业的关键问题,有可能会引领下一波AI浪潮。”中国工程院院士、阿里云创始人王坚2月17日在南方电网总部参加第四届电力调度AI应用大赛时表示。该大赛由南方电网、中国电机工程学会电力系统自动化专委会主办,阿里云承办、阿里达摩院协办。

图:中国工程院院士、阿里云创始人 王坚
王坚认为,纵观AI的发展历程,从Alpha Go、ImageNet到Alpha Fold、ChatGPT,都是通过对某一个问题的攻克,从而带动了人工智能的巨大进步。相信电力行业、工业领域也能找到这样一个问题,这将对社会发展、人类生活带来更大、更切实的影响。
王坚介绍,在1950年代,人类可以想象AI最了不起的事情就是“下棋”。直到深蓝、AlphaGo的出现,AI打败了国际象棋大师,人工智能技术有了很大进步。
几年后,针对“图像识别”这一问题,在AI界又出现了基于深度学习的ImageNet,使得机器对人脸的识别率超过了人类。这又将人工智能带到了新的高度。
近年来出现的Alpha fold,在发现蛋白质结构方面的能力已经超过了一流的科学家,挑战着他们毕生的专业经验。ChatGPT则通过聊天这一场景,为自然语言处理带来了全新的变革。
“人工智能的每次跨越,都是围绕着对某一个问题的攻坚,”王坚说,问题定义得好,可以反过来带动人工智能学科的发展。
王坚指出,工业是用新技术最好的地方。在电力行业、工业领域,我们可以找到比“下棋”更有高度的问题,引领下一波AI浪潮。如果能找到、解好这样一个问题,对推动社会经济发展、人类生活变化,会产生更巨大、更积极的影响。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。