昔日失之轻应用的百度,如今携智能小程序重来。今天在2018百度AI开发者大会智能小程序分论坛上,百度正式发布智能小程序,全面接入了百度大脑3.0的AI能力,将在12月份全面开源。
智能小程序是百度AI落地和重构移动生态的重要产品,百度官方称将给开发者一个重新找回流量、服务用户的新途径。
一直以来,流量都是开发者最关注,也是他们最头疼的问题之一。对于开发者而言,能从一个平台获取多大流量,直接决定了他们做小程序的决心。
据百度方面介绍,与目前市面上的其他小程序不同,百度的智能小程序将为开发者提供包括搜索、信息流、百度地图、手机助手、百度贴吧等在内的千亿优质流量。
具体而言,智能小程序是主动、持续的分发,不仅会在信息流中进行分发,也会在内容相近的百家号文章中、文章的底部等处进行挂接分发,同时自然搜索结果和阿拉丁也都是智能小程序的入口。
可分发、可沉淀、可经营优势,将帮助开发者获得超越同业的流量支持,所有的优质智能小程序都可以平等地脱颖而出。
百度副总裁沈抖强调,智能小程序是开放的生态,不仅可以运行于百度的平台,更可以运行于外部App上,开发者一次开发就可以实现多端运行。这和微信小程的封闭生态有着本质的区别。
另外,智能小程序未来将不仅仅在百度系列APP上运行,也可以在浏览器、合作App、Dueros、Apollo等多端运行,开发者完全有机会在更大范围内获取这些生态合作伙伴的流量。
“移动互联网时代,用户的需求在不断延展,从简单的阅读需求向更加多元化的需求转变。”百度推荐技术平台部总监赵世奇表示,智能小程序作为百度战略级产品,通过百度信息流分发,与之发生奇妙的化学反应——百度信息流用户在阅读内容的同时,可进一步实现更多元的交互,百度信息流的使用体验,也将因此焕然一新,成为一个综合推荐的信息平台。
百度智能小程序在百度信息流中通过“主动分发+个性化推荐”触达用户。这也意味着,信息流会通过对用户兴趣点的探索、数据的分析等,把用户最感兴趣、最需要的智能小程序个性化、场景化地推送给用户。
这样一来,不同类型用户刷新信息流时,可以看到不同类型的智能小程序被主动推荐,这样的分发不仅更高效,也更精准。
比如,爱奇艺最新的自制剧会通过智能小程序的形式,分发给喜爱追剧的用户,用户可直接点击观看;或者,捆绑了车辆信息的车主可以在信息流中看到车辆的违章信息提示,点击后可直接进入相应智能小程序,缴纳违章罚款。
百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍,目前智能小程序已经支持4个大类,20项AI能力,包括文字识别、语音合成、内容审核以及图像识别方向的技术。极大降低了开发者的开发门槛和开发成本,实现了更自然的人机沟通。
以语音合成为例,基于业界领先的深度神经网络技术,百度提供的流畅自然的语音合成服务,可以让开发者开发的智能小程序开口说话。
吴中勤同时表示,为了满足各类开发者的不同需求,智能小程序未来会全面接入百度大脑,并为开发者带来便利。
首先,开发效率更高。在开发过程中,开发者不用考虑如何收集数据、训练模型,也不需要考虑编写对应的底层算法。只需要考虑怎么去更好的将AI在智能小程序里加以应用。
第二,接入成本更低。百度AI在小程序的应用中支持云端的API调用,依赖百度APP的离线SDK调用,以及更多场景化的工具和能力。同时,百度AI平台开放了非常多的免费能力,可以有效降低接入成本。
更重要的是,智能小程序+AI,将助力更多行业发展。“浩瀚的小程序市场,开发者面向的是不同领域,需求也各有不同。AI赋能也理应是因地制宜、量身打造的。如泛娱乐的小程序可能更需要语音合成技术,电商需要做商品智能推荐,工具类小程序则需要卡证识别等计算机视觉技术,而对于旅游行业来说,应用将更加丰富,人脸识别、增强现实、智能导航。”
他以“长隆AR动物园”智能小程序举例说,AR动物科普、AR步行导航等在内的AI体验实现了服务智能化、数据智能化和互动智能化,完全颠覆了过去在游览动物园过程中的体验方式。“智能小程序如同每个人的智能”小管家”,他能提供更高效的服务,更智能的体验。”吴中勤说。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。