9月1日,2022世界人工智能大会在上海开幕。峰会期间,上海白玉兰开源开放研究院发布《中国人工智能软件基础设施高质量发展报告》(以下简称《报告》)。参与调研的单位包括上海交通大学人工智能研究院、木兰开源社区、OpenVINO中文社区、飞桨社区、英特尔、阿里云、亚马逊云科技、腾源会、微软Reactor、昇思MindSpore社区、FATE社区、BigDL社区、MagicHub社区、Ray中文社区、ModelArts社区、OpenMLDB社区、语音之家、希尔贝壳、Zilliz、思贤科技、CSDN、InfoQ、思否、稀土掘金、亿欧咨询、示说、GDG上海、极术社区、SeaTunnel社区、DolphinScheduler社区、Juicedata社区、开放群岛开源社区(排名不分先后)等30余家人工智能技术社区、数据社区及垂直媒体。
“十四五”规划和2035远景目标提出要以高质量发展为主题,要求人工智能技术进一步加快作用于国民经济活动。通过完善数字化技术和支持能力,在此之上构建智能化商业模式是数字化转型的核心目标,人工智能软件基础设施建设对于完成这一目标起到重要作用。然而在人工智能技术落地的问题上,存在着诸多障碍,技术价值贬值和可行性困难在具体市场和应用场景中时有发生。针对这一现实困境,《报告》对当前人工智能软件基础设施建设的现状与问题进行了系统梳理,进一步提出要从人工智能人才、基础软件框架、数据治理、工程落地、基础软件社区生态等不同维度协同共进的发展思路。
《报告》近五万字,分五个章节从人才、数据、算力、工程和运营等五个维度进行阐述。人才层面,展现我国人工智能开发者分布现状及提出人才培养的可行方式。数据层面,数据治理涉及的技术路线、法律法规、企业战略选择,以及产业生态演变趋势。算力层面,异构计算及其应用场景特别是大算力场景逐渐清晰,算力与软件算法协同优化将是未来发展重点。工程层面,在异构计算范式要求下,人工智能开发涉及的软硬件环境愈加复杂,借由人工智能开发平台和软件框架降低开发运维成本将是可行方向。运营层面,在复杂的商业化环境中,软件基础设施类型项目的推广依赖有效的开发者关系运营加持。
对于《报告》的发布,中国科学院院士梅宏表示,人工智能无疑是这个时代驱动数字化转型的重要技术,对数字经济发展将发挥重大而深远的影响。建设并最大化人工智能基础设施的开放创新赋能作用是一项系统工程,需要从人才、数据、算力、工程和运营等多维度多环节协同发力、同步推进,充分发挥各利益相关方的积极性和主观能动性。其中,弘扬开源精神,打造有利于人工智能创新发展的开源生态,是人工智能基础设施建设的重要抓手和必由之路。
好文章,需要你的鼓励
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。
南洋理工大学与腾讯联合研究团队开发出Rolling Forcing技术,实现AI视频实时流式生成的重大突破。该技术通过滚动窗口联合去噪、注意力锚点机制和高效训练算法三项创新,解决了长视频生成中的错误累积问题,可在单GPU上以16fps速度生成多分钟高质量视频,延迟仅0.76秒,质量漂移指标从传统方法的1.66降至0.01,为交互式媒体和内容创作开辟新可能。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。