产业智能化快速深入推进,人工智能基础设施的建设不可或缺。5月20日,由深度学习技术及应用国家工程实验室与百度联合主办的“Wave Summit 2020”深度学习开发者峰会在线上召开。百度CTO王海峰在致辞中表示,时代契机为飞桨的发展提供了最好的机遇,作为中国首个开源开放、功能完备的产业级深度学习平台,飞桨将与产业紧密融合,与开发者并肩前行。
王海峰公布了飞桨一连串的喜人数据:累计开发者数量194万,服务企业数量8.4万家,基于飞桨平台产生了23.3万模型,覆盖通信、电力、城市管理、民生、工业、农业、林业、公益等众多行业和领域。疫情期间,飞桨和开发者一起战斗,推出了口罩检测和人脸识别、社区疫情防控系统、疫情问答机器人、基于CT影像的肺炎筛查等等一系列产品和服务,依托飞桨平台和生态为疫情防控贡献科技力量。
王海峰认为,这些由开发者和飞桨共同努力创造的成果,得益于技术的成熟、平台的强大和生态的欣欣向荣,也跟社会的需求和时代的契机密切相关。
首先,算法、算力及数据的持续共同进步,使得技术的边界不断被拓展。飞桨深度学习平台高速发展,易用性不断提升,模型库日益丰富,工具组件愈发完备,部署更加便捷。进而,围绕深度学习平台的技术和产业生态日渐繁荣,推动人工智能进入工业大生产阶段,加速各行各业智能化升级,并不断催生新的应用、新的产业。
另一方面,疫情带来线上经济增长。远程办公、云课堂等复工复产新模式,公共安全、应急管理、城市治理等国计民生相关产业迫在眉睫的智能化需求,以及澎湃而来的新基建大潮,为技术创新创造了良好的机遇。以飞桨为代表的深度学习平台是新型基础设施的重要一环,与云计算、5G、物联网、数据中心等互相融合促进,加速产业智能化进程。
时代契机下,飞桨聚焦于满足旺盛的产业智能化需求和快速增长的AI生产规模,全新升级,包含飞桨开源深度学习平台和飞桨企业版。飞桨开源深度学习平台包括核心框架、基础模型库、端到端开发套件与工具组件,将始终保持开源,不断提升核心能力,为产业、学术、科研创新提供基础支撑。同时,随着企业应用的需求越来越丰富和强烈,首次推出飞桨企业版,助力各个企业拥有自己的AI中台,加速企业智能化升级的进程。
满足AI工业大生产需求之外,飞桨作为技术领先的深度学习平台,积极布局前瞻技术方向,发布量子机器学习,这使得它成为国内首个支持量子机器学习的深度学习平台。
在刚刚举办的ABC Summit 2020百度夏季云智峰会上,百度智能云“以云计算为基础,以人工智能为抓手,聚焦重要赛道”的新战略首次亮相。百度智能云融合了云计算、大数据、百度大脑等百度的核心技术,把人工智能输送到千行万业,促进各行各业的智能化升级,成为加速AI工业化大生产的关键力量,而飞桨则是其中的核心基础底座。
正如王海峰所说,“在产业智能化浪潮兴起、人工智能基础设施建设快速推进之际,飞桨以更敏捷的脚步,秉承开源开放理念,坚持技术创新,与开发者共同成长和进步,一起发展深度学习和人工智能技术及产业生态,加速产业智能化进程。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。