科技行者 3月28日 北京消息:今日,在华为开发者大会2020(Cloud)第二天,华为全面分享在计算视觉领域的基础研究成果,全球开发者可通过公开发表的论文及开源代码,进一步开展AI的研究、开发和部署。同时,华为发布计算视觉研究计划(以下简称视觉计划),并邀请全球AI专家参与研究。基于华为昇腾AI处理器的Atlas人工智能计算平台将为该计划提供强大算力支撑,研究成果将在华为全场景AI计算框架MindSpore实现并开源给业界,让全球AI开发者以此为基础持续创新、不断突破边界、共同打造无所不及的智能。
开放华为计算视觉基础研究成果
投资基础研究是华为AI战略的重要部分,华为致力于在计算视觉、自然语言处理、决策推理等领域构筑数据高效、能耗高效、安全可信、自动自治的机器学习基础能力。
面向全球开发者,华为诺亚方舟实验室计算视觉首席科学家、IEEE Fellow田奇教授分享了计算视觉领域的最新研究进展:“华为在计算视觉领域围绕数据、知识和模型三大方向,大力投入基础研究,过去两年已在AI顶会CVPR、ICCV、NeurIPS、ICLR等发表80余篇论文,并取得多项业界领先的成果,这些研究成果已通过学术论文和算法代码开源等形式公开给业界,我们欢迎全球AI开发者基于华为已有的研究成果,进一步开展AI的研究、开发和部署”。
发布华为计算视觉研究计划、助力每一位AI开发者
华为计算视觉研究计划
在当前研究基础上,田奇教授发布了华为计算视觉计划,“华为将继续加大投入计算视觉的基础研究,不断挑战计算视觉领域三大问题,包括如何从海量数据中高效挖掘有用的信息、设计高效的万物识别视觉模型,以及表达并存储知识以迈向通用智能“。华为视觉计划围绕三大方向,共有六大子计划,包括:
同时,田奇教授表示,“我们欢迎全球AI研究者加入华为视觉计划,共同创新、探索未来。华为Atlas人工智能计算平台的超强算力将全面加速视觉计划开展,研究成果将在华为全场景AI计算框架MindSpore上充分实现并开源给业界,助力每一位AI开发者“。
华为在2018年华为全联接大会上首次发布AI战略,重点投资AI基础研究,并协同全球科研机构和开发者共同构建AI生态。本次开发者大会上,华为系统展示计算视觉领域基础研究成果并发布视觉计划,以AI基础研究和开放创新全面支持全球开发者探索未来,不断突破边界,共同打造无所不及的智能。
好文章,需要你的鼓励
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。
上海AI实验室团队发现自回归图像生成模型存在局部依赖、语义不一致和空间不变性缺失三大问题,提出ST-AR训练方法。该方法通过掩码注意力、跨步骤对比学习和跨视角对比学习,让AI"先理解再生成"。实验显示,ST-AR将LlamaGen模型的图像理解准确率提升一倍以上,图像生成质量提升42-49%,为构建更智能的多模态AI系统开辟新路径。