昔日失之轻应用的百度,如今携智能小程序重来。今天在2018百度AI开发者大会智能小程序分论坛上,百度正式发布智能小程序,全面接入了百度大脑3.0的AI能力,将在12月份全面开源。
智能小程序是百度AI落地和重构移动生态的重要产品,百度官方称将给开发者一个重新找回流量、服务用户的新途径。
一直以来,流量都是开发者最关注,也是他们最头疼的问题之一。对于开发者而言,能从一个平台获取多大流量,直接决定了他们做小程序的决心。
据百度方面介绍,与目前市面上的其他小程序不同,百度的智能小程序将为开发者提供包括搜索、信息流、百度地图、手机助手、百度贴吧等在内的千亿优质流量。
具体而言,智能小程序是主动、持续的分发,不仅会在信息流中进行分发,也会在内容相近的百家号文章中、文章的底部等处进行挂接分发,同时自然搜索结果和阿拉丁也都是智能小程序的入口。
可分发、可沉淀、可经营优势,将帮助开发者获得超越同业的流量支持,所有的优质智能小程序都可以平等地脱颖而出。
百度副总裁沈抖强调,智能小程序是开放的生态,不仅可以运行于百度的平台,更可以运行于外部App上,开发者一次开发就可以实现多端运行。这和微信小程的封闭生态有着本质的区别。
另外,智能小程序未来将不仅仅在百度系列APP上运行,也可以在浏览器、合作App、Dueros、Apollo等多端运行,开发者完全有机会在更大范围内获取这些生态合作伙伴的流量。
“移动互联网时代,用户的需求在不断延展,从简单的阅读需求向更加多元化的需求转变。”百度推荐技术平台部总监赵世奇表示,智能小程序作为百度战略级产品,通过百度信息流分发,与之发生奇妙的化学反应——百度信息流用户在阅读内容的同时,可进一步实现更多元的交互,百度信息流的使用体验,也将因此焕然一新,成为一个综合推荐的信息平台。
百度智能小程序在百度信息流中通过“主动分发+个性化推荐”触达用户。这也意味着,信息流会通过对用户兴趣点的探索、数据的分析等,把用户最感兴趣、最需要的智能小程序个性化、场景化地推送给用户。
这样一来,不同类型用户刷新信息流时,可以看到不同类型的智能小程序被主动推荐,这样的分发不仅更高效,也更精准。
比如,爱奇艺最新的自制剧会通过智能小程序的形式,分发给喜爱追剧的用户,用户可直接点击观看;或者,捆绑了车辆信息的车主可以在信息流中看到车辆的违章信息提示,点击后可直接进入相应智能小程序,缴纳违章罚款。
百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍,目前智能小程序已经支持4个大类,20项AI能力,包括文字识别、语音合成、内容审核以及图像识别方向的技术。极大降低了开发者的开发门槛和开发成本,实现了更自然的人机沟通。
以语音合成为例,基于业界领先的深度神经网络技术,百度提供的流畅自然的语音合成服务,可以让开发者开发的智能小程序开口说话。
吴中勤同时表示,为了满足各类开发者的不同需求,智能小程序未来会全面接入百度大脑,并为开发者带来便利。
首先,开发效率更高。在开发过程中,开发者不用考虑如何收集数据、训练模型,也不需要考虑编写对应的底层算法。只需要考虑怎么去更好的将AI在智能小程序里加以应用。
第二,接入成本更低。百度AI在小程序的应用中支持云端的API调用,依赖百度APP的离线SDK调用,以及更多场景化的工具和能力。同时,百度AI平台开放了非常多的免费能力,可以有效降低接入成本。
更重要的是,智能小程序+AI,将助力更多行业发展。“浩瀚的小程序市场,开发者面向的是不同领域,需求也各有不同。AI赋能也理应是因地制宜、量身打造的。如泛娱乐的小程序可能更需要语音合成技术,电商需要做商品智能推荐,工具类小程序则需要卡证识别等计算机视觉技术,而对于旅游行业来说,应用将更加丰富,人脸识别、增强现实、智能导航。”
他以“长隆AR动物园”智能小程序举例说,AR动物科普、AR步行导航等在内的AI体验实现了服务智能化、数据智能化和互动智能化,完全颠覆了过去在游览动物园过程中的体验方式。“智能小程序如同每个人的智能”小管家”,他能提供更高效的服务,更智能的体验。”吴中勤说。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。