微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

华为发布计算视觉计划，持续挑战视觉模型等三大问题

华为开发者华为开发者大会2020

华为发布计算视觉计划，持续挑战视觉模型等三大问题

作者：科技行者

2020-03-28 20:16

分享至：

在华为开发者大会2020（Cloud）第二天，华为全面分享在计算视觉领域的基础研究成果，全球开发者可通过公开发表的论文及开源代码，进一步开展AI的研究、开发和部署。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2020-03-28 20:16 • 科技行者

科技行者 3月28日北京消息：今日，在华为开发者大会2020（Cloud）第二天，华为全面分享在计算视觉领域的基础研究成果，全球开发者可通过公开发表的论文及开源代码，进一步开展AI的研究、开发和部署。同时，华为发布计算视觉研究计划（以下简称视觉计划），并邀请全球AI专家参与研究。基于华为昇腾AI处理器的Atlas人工智能计算平台将为该计划提供强大算力支撑，研究成果将在华为全场景AI计算框架MindSpore实现并开源给业界，让全球AI开发者以此为基础持续创新、不断突破边界、共同打造无所不及的智能。

开放华为计算视觉基础研究成果

投资基础研究是华为AI战略的重要部分，华为致力于在计算视觉、自然语言处理、决策推理等领域构筑数据高效、能耗高效、安全可信、自动自治的机器学习基础能力。

面向全球开发者，华为诺亚方舟实验室计算视觉首席科学家、IEEE Fellow田奇教授分享了计算视觉领域的最新研究进展：“华为在计算视觉领域围绕数据、知识和模型三大方向，大力投入基础研究，过去两年已在AI顶会CVPR、ICCV、NeurIPS、ICLR等发表80余篇论文，并取得多项业界领先的成果，这些研究成果已通过学术论文和算法代码开源等形式公开给业界，我们欢迎全球AI开发者基于华为已有的研究成果，进一步开展AI的研究、开发和部署”。

发布华为计算视觉研究计划、助力每一位AI开发者

华为计算视觉研究计划

在当前研究基础上，田奇教授发布了华为计算视觉计划，“华为将继续加大投入计算视觉的基础研究，不断挑战计算视觉领域三大问题，包括如何从海量数据中高效挖掘有用的信息、设计高效的万物识别视觉模型，以及表达并存储知识以迈向通用智能“。华为视觉计划围绕三大方向，共有六大子计划，包括：

数据冰山计划：以极少量标注数据撬动海量无标注数据，支撑小样本场景下模型训练
数据魔方计划：利用多种模态相互辅助、增强模型在实际场景的学习能力
模型摸高计划：构建云侧大模型，刷新各类视觉任务性能上限
模型瘦身计划：打造端侧高效的计算模型，助力各种芯片完成复杂推理
万物预视计划：设计视觉预训练任务，打造视觉通用模型
虚实合一计划：在虚拟与现实的结合中，将计算视觉引向真正的人工智能

同时，田奇教授表示，“我们欢迎全球AI研究者加入华为视觉计划，共同创新、探索未来。华为Atlas人工智能计算平台的超强算力将全面加速视觉计划开展，研究成果将在华为全场景AI计算框架MindSpore上充分实现并开源给业界，助力每一位AI开发者“。

华为在2018年华为全联接大会上首次发布AI战略，重点投资AI基础研究，并协同全球科研机构和开发者共同构建AI生态。本次开发者大会上，华为系统展示计算视觉领域基础研究成果并发布视觉计划，以AI基础研究和开放创新全面支持全球开发者探索未来，不断突破边界，共同打造无所不及的智能。

华为开发者华为开发者大会2020

分享至

0赞

好文章，需要你的鼓励

推荐文章

英特尔
大模型

2025-09-30 15:33

数据中心的智算挑战，英特尔要如何应对？

阿里云第九代企业级ECS实例g9i不到150天服务超2万家客户，现在已有接近3万用户。
软件工程
智能体编程
人机协作

2025-09-30 14:59

Queen's大学重磅研究：程序员的角色即将彻底改变，从码农到智能体指挥官

Queen's大学研究团队提出结构化智能体软件工程框架SASE，重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者，建立双向咨询机制和标准化文档系统，解决AI编程中的质量控制难题，为软件工程向智能化协作时代转型提供系统性解决方案。
医疗人工智能
视觉语言模型
超声影像诊断

2025-09-30 14:59

医疗AI的"显微镜革命"：西北工业大学团队发布首个超声影像专用智能助手EchoVLM

西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM，通过收集15家医院20万病例和147万超声图像，采用专家混合架构，实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题，为医生提供智能辅助，推动医疗AI向专业化发展。
自回归图像生成
自监督学习
视觉理解优化

2025-09-30 14:59

上海AI实验室突破自回归图像生成瓶颈：ST-AR让AI"先理解再创造"

上海AI实验室团队发现自回归图像生成模型存在局部依赖、语义不一致和空间不变性缺失三大问题，提出ST-AR训练方法。该方法通过掩码注意力、跨步骤对比学习和跨视角对比学习，让AI"先理解再生成"。实验显示，ST-AR将LlamaGen模型的图像理解准确率提升一倍以上，图像生成质量提升42-49%，为构建更智能的多模态AI系统开辟新路径。