科技行者 1月8日 北京消息(文/李祥敬):美国拉斯维加斯,2020年1月7日——在2020年国际消费电子展(CES 2020)上,英特尔在以“智能驱动创新”(Innovation through Intelligence)为主题的新闻发布会上演示了系列场景,展现了其如何将智能融入云、网络、边缘和PC,推动其对人、企业和社会创造积极的影响。
当前,数据中心是为全球企业提供智能的重要驱动力,而英特尔至强可扩展处理器仍然是数据中心的基石。英特尔公司执行副总裁、数据平台事业部总经理孙纳颐(Navin Shenoy)在主题演讲中宣布,于2020年上半年推出的第三代英特尔至强可扩展处理器,将包含面向内置人工智能训练加速的全新英特尔DL Boost扩展指令集,与之前的产品系列相比,其训练性能提升高达60%,而且至强是唯一的内置AI的通用CPU。
孙纳颐着重介绍了英特尔将智能融入云、网络和边缘计算的数据平台的多种途径,并举例说明其对体育和娱乐体验带来的变革。
孙纳颐介绍说,Netflix采用最新的视频压缩技术——AV1,以优化Netflix的媒体流服务,并将全球范围的内容带入人们的生活之中。相较于之前的AVC压缩技术,它能使压缩的效率提升高达60%。英特尔和Netflix继续合作,推动开源高性能编码器(SVT-AV1)的开发,并在第二代英特尔至强可扩展处理器上进行了优化,显著地提升了质量和性能以实现商业部署。
3D“运动员追踪”(3DAT)是业内首创的计算机视觉解决方案,它利用人工智能提供接近实时的数据洞察和可视化,可大幅提升观赛体验。3DAT使用高度灵活的摄像头捕捉运动员的姿势和动作,然后应用以英特尔DL Boost优化并由英特尔至强可扩展处理器驱动的算法,从生物力学机制的角度对运动员动作进行分析。孙纳颐宣布,该技术将应用于2020年东京奥运会100米及其它短跑项目的视频回放中。
除此以外,英特尔和体育产业正在以“体三维视频”(volumetric video)促进体育赛事观赛体验的变革,这是突破观赛体验极限的重要进展。英特尔 True View合成出体育场馆的全部空间,提供全方位无死角视野,让球迷可以选择从任何有利位置和运动员视角,以流式传输的方式在其设备上观赛。英特尔和美国职业橄榄球大联盟(NFL)以克利夫兰布朗队与亚利桑那红雀队的比赛为例,展示了“体三维”视频的冲击力。仅在一场NFL比赛的第一节,所产生的数据就超过了3TB/分钟,这种指数级的数据增长,需要超强的计算力才能实现。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。