Cortana,这个女主持人,哦,准确地说应该是这个私人助理,主持了正常Build2014大会,她是微软蓄谋已久的语音助理,准确地是个人助理,她是微软反击移动互联网市场的重要里程碑。
在Build2014上,微软发布了基于Windows Phone 8.1的语音助理Cortana,开始正式向苹果Siri和Google Now发出挑战。
从现场的演示来看,微软的Cortana比之前其集成在Windows 8之中的语音操作进步了很多,之前版本是感觉更像是一个生硬的命令执行者,而Cortana则更像是一个有了感情的私人助理,她除了完成指令之外,更懂得“主人”的使用习惯,甚至她懂得调侃,感觉这是一个更加高阶的助理。
虽然,目前微软Cortana是附着在Windows Phone 平台,但是整体来看,其对于Windows 系列产品以及微软公司都有着重要意义。
一、微软移动端重要布局:PC上语音识别技术发展有几十年了,而苹果Siri和Google Now算是亮点,微软Cortana问世预示这一市场竞争更具白热化,这也是微软在移动互联网时代的重要布局之一;
二、人机交互的新阵地:语音识别技术也将是未来多年来竞争的热点,随着识别率的提高,语音将成为人机交互将成为热点。之前,微软体感计算方面有着不错的表现,语音识别将进一步展现微软的实力;
三、展示全面实力:相比之下,目前Cortana比苹果Siri和Google Now更好玩,为什么?这是因为它基于Bing搜索,因为Bing有着众多的合作伙伴,因而Cortana可以提供更丰富的服务。另外,Cortana将进一步展现微软的云计算和大数据方面的实力;
四、微软的转折点:虽然目前Cortana是Windows Phone 8.1的重要功能之一,但是相信随着技术的成熟,其将进一步覆盖到微软的所有平台。在Build2014上,微软已经显露出了打造统一平台的信心和决心,未来智能手机、平板电脑、PC以及游戏主机都将给予同一个平台,Cortana将是统一平台之上的一个重要入口。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了SPIRAL框架,通过让AI与自己对弈零和游戏来提升推理能力。实验显示,仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%,通用推理提升8.4%,且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中,为AI训练提供了新思路。
同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息,创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系,结合深度学习和数学优化方法,在合成数据集上实现37.9%的精度提升,并在真实设备上展现出色泛化能力,为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。
伊利诺伊大学研究团队通过对比实验发现,经过强化学习训练的视觉语言模型虽然表现出"顿悟时刻"现象,但这些自我纠错行为并不能实际提升推理准确率。研究揭示了AI模型存在"生成-验证差距",即生成答案的能力强于验证答案质量的能力,且模型在自我验证时无法有效利用视觉信息,为AI多模态推理发展提供了重要启示。
MIT等顶尖机构联合提出SparseLoRA技术,通过动态稀疏性实现大语言模型训练加速1.6倍,计算成本降低2.2倍。该方法使用SVD稀疏性估计器智能选择重要计算部分,在保持模型性能的同时显著提升训练效率,已在多个任务上验证有效性。