9月1日,2022世界人工智能大会在上海开幕。峰会期间,上海白玉兰开源开放研究院发布《中国人工智能软件基础设施高质量发展报告》(以下简称《报告》)。参与调研的单位包括上海交通大学人工智能研究院、木兰开源社区、OpenVINO中文社区、飞桨社区、英特尔、阿里云、亚马逊云科技、腾源会、微软Reactor、昇思MindSpore社区、FATE社区、BigDL社区、MagicHub社区、Ray中文社区、ModelArts社区、OpenMLDB社区、语音之家、希尔贝壳、Zilliz、思贤科技、CSDN、InfoQ、思否、稀土掘金、亿欧咨询、示说、GDG上海、极术社区、SeaTunnel社区、DolphinScheduler社区、Juicedata社区、开放群岛开源社区(排名不分先后)等30余家人工智能技术社区、数据社区及垂直媒体。
“十四五”规划和2035远景目标提出要以高质量发展为主题,要求人工智能技术进一步加快作用于国民经济活动。通过完善数字化技术和支持能力,在此之上构建智能化商业模式是数字化转型的核心目标,人工智能软件基础设施建设对于完成这一目标起到重要作用。然而在人工智能技术落地的问题上,存在着诸多障碍,技术价值贬值和可行性困难在具体市场和应用场景中时有发生。针对这一现实困境,《报告》对当前人工智能软件基础设施建设的现状与问题进行了系统梳理,进一步提出要从人工智能人才、基础软件框架、数据治理、工程落地、基础软件社区生态等不同维度协同共进的发展思路。
《报告》近五万字,分五个章节从人才、数据、算力、工程和运营等五个维度进行阐述。人才层面,展现我国人工智能开发者分布现状及提出人才培养的可行方式。数据层面,数据治理涉及的技术路线、法律法规、企业战略选择,以及产业生态演变趋势。算力层面,异构计算及其应用场景特别是大算力场景逐渐清晰,算力与软件算法协同优化将是未来发展重点。工程层面,在异构计算范式要求下,人工智能开发涉及的软硬件环境愈加复杂,借由人工智能开发平台和软件框架降低开发运维成本将是可行方向。运营层面,在复杂的商业化环境中,软件基础设施类型项目的推广依赖有效的开发者关系运营加持。
对于《报告》的发布,中国科学院院士梅宏表示,人工智能无疑是这个时代驱动数字化转型的重要技术,对数字经济发展将发挥重大而深远的影响。建设并最大化人工智能基础设施的开放创新赋能作用是一项系统工程,需要从人才、数据、算力、工程和运营等多维度多环节协同发力、同步推进,充分发挥各利益相关方的积极性和主观能动性。其中,弘扬开源精神,打造有利于人工智能创新发展的开源生态,是人工智能基础设施建设的重要抓手和必由之路。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。