科技行者 1月8日 北京消息(文/李祥敬):美国拉斯维加斯,2020年1月7日——在2020年国际消费电子展(CES 2020)上,英特尔在以“智能驱动创新”(Innovation through Intelligence)为主题的新闻发布会上演示了系列场景,展现了其如何将智能融入云、网络、边缘和PC,推动其对人、企业和社会创造积极的影响。
当前,数据中心是为全球企业提供智能的重要驱动力,而英特尔至强可扩展处理器仍然是数据中心的基石。英特尔公司执行副总裁、数据平台事业部总经理孙纳颐(Navin Shenoy)在主题演讲中宣布,于2020年上半年推出的第三代英特尔至强可扩展处理器,将包含面向内置人工智能训练加速的全新英特尔DL Boost扩展指令集,与之前的产品系列相比,其训练性能提升高达60%,而且至强是唯一的内置AI的通用CPU。
孙纳颐着重介绍了英特尔将智能融入云、网络和边缘计算的数据平台的多种途径,并举例说明其对体育和娱乐体验带来的变革。
孙纳颐介绍说,Netflix采用最新的视频压缩技术——AV1,以优化Netflix的媒体流服务,并将全球范围的内容带入人们的生活之中。相较于之前的AVC压缩技术,它能使压缩的效率提升高达60%。英特尔和Netflix继续合作,推动开源高性能编码器(SVT-AV1)的开发,并在第二代英特尔至强可扩展处理器上进行了优化,显著地提升了质量和性能以实现商业部署。
3D“运动员追踪”(3DAT)是业内首创的计算机视觉解决方案,它利用人工智能提供接近实时的数据洞察和可视化,可大幅提升观赛体验。3DAT使用高度灵活的摄像头捕捉运动员的姿势和动作,然后应用以英特尔DL Boost优化并由英特尔至强可扩展处理器驱动的算法,从生物力学机制的角度对运动员动作进行分析。孙纳颐宣布,该技术将应用于2020年东京奥运会100米及其它短跑项目的视频回放中。
除此以外,英特尔和体育产业正在以“体三维视频”(volumetric video)促进体育赛事观赛体验的变革,这是突破观赛体验极限的重要进展。英特尔 True View合成出体育场馆的全部空间,提供全方位无死角视野,让球迷可以选择从任何有利位置和运动员视角,以流式传输的方式在其设备上观赛。英特尔和美国职业橄榄球大联盟(NFL)以克利夫兰布朗队与亚利桑那红雀队的比赛为例,展示了“体三维”视频的冲击力。仅在一场NFL比赛的第一节,所产生的数据就超过了3TB/分钟,这种指数级的数据增长,需要超强的计算力才能实现。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。