9月1日,2022世界人工智能大会在上海开幕。峰会期间,上海白玉兰开源开放研究院发布《中国人工智能软件基础设施高质量发展报告》(以下简称《报告》)。参与调研的单位包括上海交通大学人工智能研究院、木兰开源社区、OpenVINO中文社区、飞桨社区、英特尔、阿里云、亚马逊云科技、腾源会、微软Reactor、昇思MindSpore社区、FATE社区、BigDL社区、MagicHub社区、Ray中文社区、ModelArts社区、OpenMLDB社区、语音之家、希尔贝壳、Zilliz、思贤科技、CSDN、InfoQ、思否、稀土掘金、亿欧咨询、示说、GDG上海、极术社区、SeaTunnel社区、DolphinScheduler社区、Juicedata社区、开放群岛开源社区(排名不分先后)等30余家人工智能技术社区、数据社区及垂直媒体。
“十四五”规划和2035远景目标提出要以高质量发展为主题,要求人工智能技术进一步加快作用于国民经济活动。通过完善数字化技术和支持能力,在此之上构建智能化商业模式是数字化转型的核心目标,人工智能软件基础设施建设对于完成这一目标起到重要作用。然而在人工智能技术落地的问题上,存在着诸多障碍,技术价值贬值和可行性困难在具体市场和应用场景中时有发生。针对这一现实困境,《报告》对当前人工智能软件基础设施建设的现状与问题进行了系统梳理,进一步提出要从人工智能人才、基础软件框架、数据治理、工程落地、基础软件社区生态等不同维度协同共进的发展思路。
《报告》近五万字,分五个章节从人才、数据、算力、工程和运营等五个维度进行阐述。人才层面,展现我国人工智能开发者分布现状及提出人才培养的可行方式。数据层面,数据治理涉及的技术路线、法律法规、企业战略选择,以及产业生态演变趋势。算力层面,异构计算及其应用场景特别是大算力场景逐渐清晰,算力与软件算法协同优化将是未来发展重点。工程层面,在异构计算范式要求下,人工智能开发涉及的软硬件环境愈加复杂,借由人工智能开发平台和软件框架降低开发运维成本将是可行方向。运营层面,在复杂的商业化环境中,软件基础设施类型项目的推广依赖有效的开发者关系运营加持。
对于《报告》的发布,中国科学院院士梅宏表示,人工智能无疑是这个时代驱动数字化转型的重要技术,对数字经济发展将发挥重大而深远的影响。建设并最大化人工智能基础设施的开放创新赋能作用是一项系统工程,需要从人才、数据、算力、工程和运营等多维度多环节协同发力、同步推进,充分发挥各利益相关方的积极性和主观能动性。其中,弘扬开源精神,打造有利于人工智能创新发展的开源生态,是人工智能基础设施建设的重要抓手和必由之路。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。