科技行者 7月3日 北京消息(文/孙封蕾): 今天,百度AI开发者大会召开,这已经是百度第三年举办针对开发者的大会,作为每年一度“秀肌肉”大会,百度AI开发者大会已经成为百度公司的重大会议之一,虽然在会议现场,百度创始人、董事长兼CEO李彦宏在演讲中被一名突然上台的男子泼了一身冷水,但是,这一年百度在AI上的成绩单仍然可圈可点。
人工智能在经历了几年的市场培育期之后,李彦宏提出,人工智能正在唤醒万物,催生万千产业智能化。人工智能与各行各业的融会贯通,将掀起产业智能化新浪潮。
图:百度创始人、董事长兼CEO 李彦宏
产业智能化大发展的背后,是AI技术的不断演进和突破。作为全球AI领域最具实力的技术平台之一,百度大脑迎来了史上最重磅的5.0版本升级,一举跃升为赋能产业智能化、软硬件一体的AI大生产平台。它不仅包含核心算法层的技术突破,还首次公布了端到端适配的AI计算架构,实现了AI算法、计算架构与应用场景的融合创新。
算法层面,视觉、语音、语言和知识等核心算法全面升级;算力层面,百度还全新发布了一款极低功耗、高性能,专为远场语音交互 打造的芯片“鸿鹄 ”, 可以适配车载语音交互与智能家居等场景。更值得关注的是,百度飞桨与华为麒麟芯片宣布将深度对接。
李彦宏号召开发者迎接产业智能化浪潮, 技术是百度的信仰,“用科技让复杂的世界更简单”是百度的使命。百度人在技术创新的同时,也在积极用技术去解决多种社会问题,用科技让世界变得更美好。 Do Better,科技为更好,这也是科技存在的意义。
在今天的会议现场,百度也展示了百度与众多产业合作的成果。
百度与吉利汽车达成战略合作,吉利控股集团董事长李书福亲临现场与李彦宏进行了互动。通过小度车载系统,身在会场的李彦宏与车内的李书福做了一次现场连线,为大家演示了车机互动的种种功能。
图:李书福和李彦宏
李书福介绍,吉利的博越PRO是一款云智能SUV,和百度AI能力的结合,让它的智商和情商都得到了更大的提升,它不仅能学习思考,自我进化,还越来越聪明和善解人意。
从吉利博越PRO开始,吉利汽车将开始全面搭载融合小度车载交互系统的GKUI19系统。百度是中国AI技术的领头雁、龙头企业,更是推动产业智能化的先锋。相信双方通过战略合作和资源协同,能够占领行业技术制高点,共同构建引领未来的智能出行生态,为用户创造全新价值体验。
李彦宏表示,吉利是中国智能汽车产业的核心力量,也是使用先进技术的弄潮儿。百度和吉利已经在智能网联、智能驾驶、智能家居、电子商务等领域达成战略合作,努力让全民智能汽车时代早日到来。
在金融领域,中国首个银行领域虚拟员工“金融数字人”亮相,它是“浦发与百度深度学习联合实验室”共同打造的创新成果。
图:潘卫东和李彦宏
浦发银行副行长潘卫东介绍,2018年,浦发和百度成立了深度学习联合实验室,在智能客服、深度学习等领域取得了非常好的联创成绩。2019年4月,浦发银行正式宣布启动“数字人”计划,在和百度短短数月的联合技术攻坚中,已初步形成了一套概念原型。浦发也在加快业务场景的落地,预计“数字人小浦”这种新型的服务模式在年内与大家正式见面。在小浦学成之后,将成为浦发首位数字员工。她将具备开朗、自信、阳光、率真的个性,还具备精准洞悉用户需求的高情商。
李彦宏表示:未来,在旅游咨询、医疗健康、移动通讯等领域,数字人都将大显身手;对每个用户来说,数字人都是私人订制、终身服务的。她不会忘记任何事情,只会越来越聪明。未来,每个人都会有一个甚至多个专属的数字人为你服务。相信这个时代很快就会到来。
此外,百度飞桨(PaddlePaddle)与华为麒麟芯片宣告合作,自研AI操作系统与自研芯片的强强联合让中国的AI底层架构更加牢固。
图:王海峰与华为消费者BG软件总裁王成录
王海峰与华为消费者BG软件总裁王成录博士联合宣布,百度飞桨与华为麒麟芯片达成深度合作。中国人自己的深度学习平台将运行在中国人自研的全球领先的芯片上,两大国货之光将充分发挥各自在软、硬件方面的优势,共同探索智能之路。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。