“解好电力行业的关键问题,有可能会引领下一波AI浪潮。”中国工程院院士、阿里云创始人王坚2月17日在南方电网总部参加第四届电力调度AI应用大赛时表示。该大赛由南方电网、中国电机工程学会电力系统自动化专委会主办,阿里云承办、阿里达摩院协办。

图:中国工程院院士、阿里云创始人 王坚
王坚认为,纵观AI的发展历程,从Alpha Go、ImageNet到Alpha Fold、ChatGPT,都是通过对某一个问题的攻克,从而带动了人工智能的巨大进步。相信电力行业、工业领域也能找到这样一个问题,这将对社会发展、人类生活带来更大、更切实的影响。
王坚介绍,在1950年代,人类可以想象AI最了不起的事情就是“下棋”。直到深蓝、AlphaGo的出现,AI打败了国际象棋大师,人工智能技术有了很大进步。
几年后,针对“图像识别”这一问题,在AI界又出现了基于深度学习的ImageNet,使得机器对人脸的识别率超过了人类。这又将人工智能带到了新的高度。
近年来出现的Alpha fold,在发现蛋白质结构方面的能力已经超过了一流的科学家,挑战着他们毕生的专业经验。ChatGPT则通过聊天这一场景,为自然语言处理带来了全新的变革。
“人工智能的每次跨越,都是围绕着对某一个问题的攻坚,”王坚说,问题定义得好,可以反过来带动人工智能学科的发展。
王坚指出,工业是用新技术最好的地方。在电力行业、工业领域,我们可以找到比“下棋”更有高度的问题,引领下一波AI浪潮。如果能找到、解好这样一个问题,对推动社会经济发展、人类生活变化,会产生更巨大、更积极的影响。
好文章,需要你的鼓励
亚马逊FAR部门研究团队通过创新的"掩码比特建模"技术,突破了图像生成领域的传统认知。研究发现离散方法劣势源于信息容量不足而非技术路线缺陷,提出的BAR框架通过渐进式比特预测解决大词汇表计算难题,在ImageNet-256上创下0.99 gFID新纪录,同时实现数十倍的速度提升,为AI图像生成开启质量与效率并举的新时代。
北京大学与美团联合研究团队提出轮廓引导路径探索(OPE)方法,解决AI并行推理中的"互信息饱和"问题。通过先生成多样化策略轮廓再执行具体推理,避免多条思路重复收敛的困境。在数学推理测试中,该方法显著提升了复杂问题的解决成功率,为AI推理能力的可靠性提升提供了新的技术路径。
南洋理工大学研究团队开发了Dr. MAS训练方法,专门解决多智能体大语言模型系统的训练不稳定问题。该方法通过为每个AI智能体使用个性化的评价标准,避免了传统全局标准化导致的梯度爆炸问题。在数学推理和多轮搜索任务中,Dr. MAS显著提升了系统性能和训练稳定性,为构建更强大的AI协作系统提供了重要技术支撑。
腾讯AI实验室开发的Covo-Audio是首个真正实现端到端语音对话的7B参数大模型,能直接处理语音输入并生成自然回应。该系统突破了传统流水线式处理的局限,实现了智能与声音分离、全双工交互等创新功能,在多项基准测试中表现优异,特别是在情感理解和自然对话方面达到了新的水准,为语音交互技术的实用化和个性化应用开辟了新路径。