“解好电力行业的关键问题,有可能会引领下一波AI浪潮。”中国工程院院士、阿里云创始人王坚2月17日在南方电网总部参加第四届电力调度AI应用大赛时表示。该大赛由南方电网、中国电机工程学会电力系统自动化专委会主办,阿里云承办、阿里达摩院协办。
图:中国工程院院士、阿里云创始人 王坚
王坚认为,纵观AI的发展历程,从Alpha Go、ImageNet到Alpha Fold、ChatGPT,都是通过对某一个问题的攻克,从而带动了人工智能的巨大进步。相信电力行业、工业领域也能找到这样一个问题,这将对社会发展、人类生活带来更大、更切实的影响。
王坚介绍,在1950年代,人类可以想象AI最了不起的事情就是“下棋”。直到深蓝、AlphaGo的出现,AI打败了国际象棋大师,人工智能技术有了很大进步。
几年后,针对“图像识别”这一问题,在AI界又出现了基于深度学习的ImageNet,使得机器对人脸的识别率超过了人类。这又将人工智能带到了新的高度。
近年来出现的Alpha fold,在发现蛋白质结构方面的能力已经超过了一流的科学家,挑战着他们毕生的专业经验。ChatGPT则通过聊天这一场景,为自然语言处理带来了全新的变革。
“人工智能的每次跨越,都是围绕着对某一个问题的攻坚,”王坚说,问题定义得好,可以反过来带动人工智能学科的发展。
王坚指出,工业是用新技术最好的地方。在电力行业、工业领域,我们可以找到比“下棋”更有高度的问题,引领下一波AI浪潮。如果能找到、解好这样一个问题,对推动社会经济发展、人类生活变化,会产生更巨大、更积极的影响。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。