科技行者 9月19日 北京消息: 9月19日,百度地图在“‘音’为有你,更有‘AI’”发布会上正式发布“语音定制功能”,内部代号“百雀灵”。它是全球首个地图语音定制产品。用户只需在百度地图App上录制20句话,20分钟左右即可生成个人完整语音包,为即将到来的国庆出行带来前所未有的新鲜体验。
“百度地图的工程师们内部叫它‘百雀灵’,百雀是大自然中各种鸟儿的总称,它们有各种美妙好听的声音,‘百雀灵’寓意着千千万万的用户,都能在百度地图录制自己的语音包,用自己独特的声音,向所爱的人表达关心与陪伴。”百度地图事业部总经理李莹表示:“语音定制功能是AI赋能百度地图的又一力作,我们希望这一次语音技术与百度地图的融合,能够释放科技力量,让每个人都感受到科技进步带来的改变和情怀。”
(百度地图事业部总经理李莹)
定制专属语音包的流程十分简单,只需打开百度地图App,唤醒“小度小度”后说“录制我的语音”,或点击百度地图首页的“出行助手”后进入“语音定制”,便可开启语音定制之旅。在安静的环境中,只要跟着百度地图的指引,念出卡通和影视台词等充满趣味性的录制文本,等待20分钟左右,就能拥有一个自己专属的语音包,并在百度地图的景区智能语音导览、智能语音交互、导航等全部场景使用,大家可免费使用自己或家人的语音包畅游景区听播报。此外,录制的个人语音包还可以分享给亲朋好友,无论是思念游子的父母、还是异地的恋人都能通过地图语音包与亲人更“近”一步。用户的“人气”语音包还有机会获得百度地图官方推荐,成为地图“好声音”。
(喊“小度小度”开启语音包录制)
过去,制作地图语音包需要在专业录音棚录制大量语料,再经过长达数月的制作才能生成,流程复杂、耗时长,让地图语音包只是“明星专属”。现在,有了百度地图的语音定制功能,人人都可以是“大明星”。
随着语音定制功能的上线,百度地图“银河计划”也正式启动,首期邀请到华晨宇、秦岚等当红艺人参与个人语音包录制,成为百度地图“明星导航员”,让用户的每一次出行新鲜感十足。“银河计划”的发布意味着明星语音包录制的门槛被大大降低,并且人人都可录制明星品质的语音包,浩如星瀚,给人无限遐想。
百度地图语音定制功能背后,是百度大脑语音技术的赋能。AI技术的加持让地图语音包生产实现了从月级别到分钟级别的突破性进展,也重新定义了语音包的生产模式。
百度语音首席架构师贾磊在发布会现场揭秘了背后的技术:“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低,相信百度语音技术在AI时代拥有无限可能”。
(百度语音首席架构师贾磊)
很多家长想给自家萌宝录制语音包,但又不免会担心萌宝有发音不清晰、停顿不规律、普通话不标准的情况,百度地图语音定制功能也克服了这类问题,实现了儿童音的完美合成。当天,百度地图与宝宝巴士发起“快乐启蒙 安全出发”倡议,上线“奇奇妙妙”语音包,通过此类卡通语音包帮助家长在驾车出行场景中安抚宝宝的情绪,为出行安全保驾护航。
对于用户非常关心的音频数据安全问题,百度地图表示,百度地图对于语音定制服务的权限获取将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。
在AI技术的深度加持下,新一代人工智能地图——百度地图持续创新和领先。未来,百度地图还将继续加速,为用户提供更加安全、智能、高效的出行服务。这个十一黄金周,带上自己的专属语音包、带上人工智能地图出发吧!
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。