科技行者 3月28日 北京消息:今日,在华为开发者大会2020(Cloud)第二天,华为全面分享在计算视觉领域的基础研究成果,全球开发者可通过公开发表的论文及开源代码,进一步开展AI的研究、开发和部署。同时,华为发布计算视觉研究计划(以下简称视觉计划),并邀请全球AI专家参与研究。基于华为昇腾AI处理器的Atlas人工智能计算平台将为该计划提供强大算力支撑,研究成果将在华为全场景AI计算框架MindSpore实现并开源给业界,让全球AI开发者以此为基础持续创新、不断突破边界、共同打造无所不及的智能。
开放华为计算视觉基础研究成果
投资基础研究是华为AI战略的重要部分,华为致力于在计算视觉、自然语言处理、决策推理等领域构筑数据高效、能耗高效、安全可信、自动自治的机器学习基础能力。
面向全球开发者,华为诺亚方舟实验室计算视觉首席科学家、IEEE Fellow田奇教授分享了计算视觉领域的最新研究进展:“华为在计算视觉领域围绕数据、知识和模型三大方向,大力投入基础研究,过去两年已在AI顶会CVPR、ICCV、NeurIPS、ICLR等发表80余篇论文,并取得多项业界领先的成果,这些研究成果已通过学术论文和算法代码开源等形式公开给业界,我们欢迎全球AI开发者基于华为已有的研究成果,进一步开展AI的研究、开发和部署”。
发布华为计算视觉研究计划、助力每一位AI开发者

华为计算视觉研究计划
在当前研究基础上,田奇教授发布了华为计算视觉计划,“华为将继续加大投入计算视觉的基础研究,不断挑战计算视觉领域三大问题,包括如何从海量数据中高效挖掘有用的信息、设计高效的万物识别视觉模型,以及表达并存储知识以迈向通用智能“。华为视觉计划围绕三大方向,共有六大子计划,包括:
同时,田奇教授表示,“我们欢迎全球AI研究者加入华为视觉计划,共同创新、探索未来。华为Atlas人工智能计算平台的超强算力将全面加速视觉计划开展,研究成果将在华为全场景AI计算框架MindSpore上充分实现并开源给业界,助力每一位AI开发者“。
华为在2018年华为全联接大会上首次发布AI战略,重点投资AI基础研究,并协同全球科研机构和开发者共同构建AI生态。本次开发者大会上,华为系统展示计算视觉领域基础研究成果并发布视觉计划,以AI基础研究和开放创新全面支持全球开发者探索未来,不断突破边界,共同打造无所不及的智能。
好文章,需要你的鼓励
这项由IIT马德拉斯与BITS Pilani联合发布的研究(arXiv:2604.21523,2026年4月)构建了FOCUS元评估基准,系统检验了评审型视觉语言大模型的可靠性。通过向超过4000个图文和图像样本中注入40种受控错误,研究发现顶尖评审AI的检测失败率在某些条件下超过50%,物理合理性和视觉细节类错误尤为难以被发现,两两比较是最可靠的评审范式。
这篇由Sylph.AI发布的技术报告提出了一套两层自动化框架,核心思想是让AI自动优化自身的运行脚手架,再进一步让AI学会如何更高效地做这种优化。内层的脚手架进化循环通过工人代理、评估代理和进化代理的协作,自动迭代改进单个任务的运行配置;外层的元进化循环则在多个任务上训练,学习一套能快速适应任何新场景的通用进化蓝图,从而彻底消除人工脚手架工程的需求。
这篇由英伟达等顶尖机构联合发表的论文提出了一种名为Voyager的新型智能体。研究团队以《我的世界》为实验平台,通过引入自动课程规划、技能库存储以及迭代反馈机制,成功让大语言模型主导的AI在完全无人类干预的情况下,实现了在复杂开放世界中的自主探索与终身学习。实验数据表明,Voyager在物品收集、探索范围及技能解锁速度上均呈现出远超传统方法的压倒性优势,为未来开发能够自主解决真实物理世界复杂任务的通用人工智能奠定了关键的理论与实践基础。
这项由伊利诺伊大学、斯坦福大学、英伟达和麻省理工学院联合发布的研究(arXiv:2604.25917,2026年4月)提出了RecursiveMAS框架,让多个异构AI模型通过轻量级模块RecursiveLink在内部信号层面直接传递"潜在思想",形成循环协作,彻底绕开了传统多AI系统依靠文字传话的低效方式。配合两阶段内外循环训练策略,整个系统只需优化极少量参数,就能在数学、科学、代码生成和搜索问答等9个基准测试上取得平均8.3%的精度提升,同时实现最高2.4倍推理加速和75.6%的token用量削减。