前几年兴起的3D电视等一些看上去很有创新性的产品,尤其是便携式的投影仪现在已经无踪影,不能不说是一种遗憾。这是微软公司全球资深副总裁张亚勤博士在美国CES接受记者视频采访时发出的感叹。
[video]uu=dfa091e731&vu=5ddac0c6c0&auto_play=0&width=600&height=450[/video]
张亚勤博士接受刘克丽总编视频专访
张亚勤博士认为智能、互联、可穿戴是本届CES的三大趋势,当然他也强调,CES更多代表着未来3-5年的技术发展趋势,倒并非发布新品的地方。虽然谈及遗憾,但他依旧认为本届CES也有一些惊喜,比如高清显示技术、曲面技术堪称颠覆。
在访谈中张亚勤博士回忆起90年代Computex的辉煌时说,1999年的Computex有35万人参观,是PC的辉煌时代,现在CES无法相比,原因可能是受美国经济和大厂商不来参展的影响。
他说与之形成对比的是汽车厂商非常积极,汽车才是时刻移动的终端。而微软从WCE(Windows Credentials Editor)开始就已经与很多汽车厂商开展合作,例如与福特公司的合作,另外微软还与十几家汽车厂商合作在Windows建立云计算系统,将导航、安全、保险等信息实时放在云中调用、应急。
在回答记者关于如何看待英特尔在此次CES上发布的物联网战略和爱迪生芯片时,张亚勤认表示,有人的地方就有电,有电的地方就有计算,有计算的万物就应互联。但是万物互联生态环境的建立非常重要并需要中长期的形成,一旦形成,将能给产业升级、消费者带来机会和不止万种应用,但是5年内很难看到这种生态的形成和应用的爆发。
当记者借此机会问及关于当前非结构化数据无法用传统的关系型数据库进行管理的问题时,张亚勤说,所以大数据来了。大数据不仅仅只是指数据量的多少,还指其非结构性,传统的结构化数据提供的是确定的结果,而非结构化数据则提供不明确的多种结果。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了SPIRAL框架,通过让AI与自己对弈零和游戏来提升推理能力。实验显示,仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%,通用推理提升8.4%,且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中,为AI训练提供了新思路。
同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息,创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系,结合深度学习和数学优化方法,在合成数据集上实现37.9%的精度提升,并在真实设备上展现出色泛化能力,为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。
伊利诺伊大学研究团队通过对比实验发现,经过强化学习训练的视觉语言模型虽然表现出"顿悟时刻"现象,但这些自我纠错行为并不能实际提升推理准确率。研究揭示了AI模型存在"生成-验证差距",即生成答案的能力强于验证答案质量的能力,且模型在自我验证时无法有效利用视觉信息,为AI多模态推理发展提供了重要启示。
MIT等顶尖机构联合提出SparseLoRA技术,通过动态稀疏性实现大语言模型训练加速1.6倍,计算成本降低2.2倍。该方法使用SVD稀疏性估计器智能选择重要计算部分,在保持模型性能的同时显著提升训练效率,已在多个任务上验证有效性。