科技行者 3月28日 北京消息:今日,在华为开发者大会2020(Cloud)第二天,华为全面分享在计算视觉领域的基础研究成果,全球开发者可通过公开发表的论文及开源代码,进一步开展AI的研究、开发和部署。同时,华为发布计算视觉研究计划(以下简称视觉计划),并邀请全球AI专家参与研究。基于华为昇腾AI处理器的Atlas人工智能计算平台将为该计划提供强大算力支撑,研究成果将在华为全场景AI计算框架MindSpore实现并开源给业界,让全球AI开发者以此为基础持续创新、不断突破边界、共同打造无所不及的智能。
开放华为计算视觉基础研究成果
投资基础研究是华为AI战略的重要部分,华为致力于在计算视觉、自然语言处理、决策推理等领域构筑数据高效、能耗高效、安全可信、自动自治的机器学习基础能力。
面向全球开发者,华为诺亚方舟实验室计算视觉首席科学家、IEEE Fellow田奇教授分享了计算视觉领域的最新研究进展:“华为在计算视觉领域围绕数据、知识和模型三大方向,大力投入基础研究,过去两年已在AI顶会CVPR、ICCV、NeurIPS、ICLR等发表80余篇论文,并取得多项业界领先的成果,这些研究成果已通过学术论文和算法代码开源等形式公开给业界,我们欢迎全球AI开发者基于华为已有的研究成果,进一步开展AI的研究、开发和部署”。
发布华为计算视觉研究计划、助力每一位AI开发者
华为计算视觉研究计划
在当前研究基础上,田奇教授发布了华为计算视觉计划,“华为将继续加大投入计算视觉的基础研究,不断挑战计算视觉领域三大问题,包括如何从海量数据中高效挖掘有用的信息、设计高效的万物识别视觉模型,以及表达并存储知识以迈向通用智能“。华为视觉计划围绕三大方向,共有六大子计划,包括:
同时,田奇教授表示,“我们欢迎全球AI研究者加入华为视觉计划,共同创新、探索未来。华为Atlas人工智能计算平台的超强算力将全面加速视觉计划开展,研究成果将在华为全场景AI计算框架MindSpore上充分实现并开源给业界,助力每一位AI开发者“。
华为在2018年华为全联接大会上首次发布AI战略,重点投资AI基础研究,并协同全球科研机构和开发者共同构建AI生态。本次开发者大会上,华为系统展示计算视觉领域基础研究成果并发布视觉计划,以AI基础研究和开放创新全面支持全球开发者探索未来,不断突破边界,共同打造无所不及的智能。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了SPIRAL框架,通过让AI与自己对弈零和游戏来提升推理能力。实验显示,仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%,通用推理提升8.4%,且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中,为AI训练提供了新思路。
同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息,创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系,结合深度学习和数学优化方法,在合成数据集上实现37.9%的精度提升,并在真实设备上展现出色泛化能力,为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。
伊利诺伊大学研究团队通过对比实验发现,经过强化学习训练的视觉语言模型虽然表现出"顿悟时刻"现象,但这些自我纠错行为并不能实际提升推理准确率。研究揭示了AI模型存在"生成-验证差距",即生成答案的能力强于验证答案质量的能力,且模型在自我验证时无法有效利用视觉信息,为AI多模态推理发展提供了重要启示。
MIT等顶尖机构联合提出SparseLoRA技术,通过动态稀疏性实现大语言模型训练加速1.6倍,计算成本降低2.2倍。该方法使用SVD稀疏性估计器智能选择重要计算部分,在保持模型性能的同时显著提升训练效率,已在多个任务上验证有效性。