科技行者 2月28日 北京消息: 2月28日,阿里巴巴语音AI技术成功入选MIT2019年“全球十大突破性技术”。MIT认为,阿里巴巴已拥有比谷歌更好的AI语音技术,可以完成复杂的人类对话功能,甚至可读懂人类的潜在意图。阿里巴巴也是唯一上榜的中国科技公司。
MIT(《麻省理工科技评论》)“十大突破性技术”是全球科技领域的权威发布。它认为,之前出现的不少AI产品并没有真正做到智能,但近期的技术进展正在快速增加AI助手的功能,更智能的AI助手已经面世。在中国,消费者正在习惯阿里巴巴的AI语音助手。它可以通过电话协调菜鸟包裹递送,还可以与顾客讨价还价。
中国物流快递业高速发展,平均每个快递员每天大约要送近200个包裹,没有语音AI助手之前,快递员每天光打电话就要3小时。2018年5月,阿里发布菜鸟智能语音助手,这一语音助手可以自动帮快递员给消费者打电话,询问消费者要将包裹放在什么地方,自主完成派前电联。这一技术帮助快递员大大节省时间,轻松完成工作。
阿里AI语音助手正在大规模应用到日常社会经济活动中。在2018年双11当天,阿里智能客服机器人“阿里小蜜”承担了全平台98%客服咨询量,相当于70万人工客服一天的工作量。在上海火车站,来往的乘客只要直接说出目的地,AI就能通过语言识别与自然语言理解技术自动推荐最近的地铁站,并完成购票。购票时间从30秒缩短到10秒,极大提升了效率。在家庭生活中,阿里推出的天猫精灵已经成为全球出货量最大的中文智能音箱。
除了AI助手,今年MIT评选出的“十大突破性技术”还包括“肠道显微胶囊”、“定制癌症疫苗”、“人造肉汉堡”、“可穿戴心电仪”、“无下水道卫生间”等。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。