Cortana,这个女主持人,哦,准确地说应该是这个私人助理,主持了正常Build2014大会,她是微软蓄谋已久的语音助理,准确地是个人助理,她是微软反击移动互联网市场的重要里程碑。
在Build2014上,微软发布了基于Windows Phone 8.1的语音助理Cortana,开始正式向苹果Siri和Google Now发出挑战。
从现场的演示来看,微软的Cortana比之前其集成在Windows 8之中的语音操作进步了很多,之前版本是感觉更像是一个生硬的命令执行者,而Cortana则更像是一个有了感情的私人助理,她除了完成指令之外,更懂得“主人”的使用习惯,甚至她懂得调侃,感觉这是一个更加高阶的助理。
虽然,目前微软Cortana是附着在Windows Phone 平台,但是整体来看,其对于Windows 系列产品以及微软公司都有着重要意义。
一、微软移动端重要布局:PC上语音识别技术发展有几十年了,而苹果Siri和Google Now算是亮点,微软Cortana问世预示这一市场竞争更具白热化,这也是微软在移动互联网时代的重要布局之一;
二、人机交互的新阵地:语音识别技术也将是未来多年来竞争的热点,随着识别率的提高,语音将成为人机交互将成为热点。之前,微软体感计算方面有着不错的表现,语音识别将进一步展现微软的实力;
三、展示全面实力:相比之下,目前Cortana比苹果Siri和Google Now更好玩,为什么?这是因为它基于Bing搜索,因为Bing有着众多的合作伙伴,因而Cortana可以提供更丰富的服务。另外,Cortana将进一步展现微软的云计算和大数据方面的实力;
四、微软的转折点:虽然目前Cortana是Windows Phone 8.1的重要功能之一,但是相信随着技术的成熟,其将进一步覆盖到微软的所有平台。在Build2014上,微软已经显露出了打造统一平台的信心和决心,未来智能手机、平板电脑、PC以及游戏主机都将给予同一个平台,Cortana将是统一平台之上的一个重要入口。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。