7月8日,在2021世界人工智能大会(WAIC)开幕首日,高通公司总裁兼CEO安蒙(Cristiano Amon)发表主题演讲,具体内容如下:
我们正快速迈向人与万物智能互联的世界。多项技术的融合正在推动这一趋势,包括极速5G连接、高性能低功耗计算以及终端侧AI技术,驱动新一代智能边缘终端和云计算的发展。万物能够实时连接至云端,让终端、体验和数据受益于不断增加的内容、处理能力和云端存储空间。5G、AI和云的结合将有力推动创新和经济增长,赋能全新商业模式、全新服务和全新收入来源,并加速众多行业的数字化转型。
为了实现AI的规模化,我们需要确保智能广泛分布于整个网络。业界预测,2020年至2026年,月度移动数据流量将增长500%以上,数十亿全新联网终端和事物将分布于边缘侧。有效应对数据的快速增长,需要的不仅仅是将数据传输至云端。还需要在终端侧集成AI能力,直接运行算法,为云端智能提供有力补充。
终端侧AI具备多项关键优势,包括更高的即时性、可靠性和安全性。这些优势对于时延敏感和关键业务型应用至关重要,如自动驾驶汽车、智能电网和联网基础设施等。智能边缘终端产生的内容丰富的数据能够实时共享至云端,使AI得以充分发挥作用,并实现从云端到边缘侧的AI规模化应用。
高通公司是赋能终端侧智能的领军企业,这不仅源于超过10年的AI技术研究和产品开发投入,更得益于我们为智能边缘打造的先进处理能力。
让我们看看5G、AI和云将如何重新定义我们的日常生活体验。如今,AI几乎融入智能手机体验的方方面面,从影像到语音识别和安全。但很快AI还将带来全新维度的移动体验,包括高度的个性化、互动性和情境相关性。
视频串流和娱乐应用正在利用面部和运动跟踪,来理解用户对内容的偏好,从而提供高度相关的建议。游戏体验将更具沉浸感、更加令人兴奋,根据玩家技能水平动态调整游戏难度,可使玩家持续获得兼具挑战性和参与感的体验。
增强现实(AR)将改变我们观察周围世界并与之交互的方式。试想一下,佩戴AR眼镜观看足球赛,当球员被自动识别出即可实时查看该球员的统计数据和详细信息,以及社交讨论和其它相关信息。利用增强的手势和自然语言处理能力,我们将与终端、应用及内容更加直观地交互。
这仅仅是构想如何利用AI提升用户体验的开端。5G和AI不仅将变革用户体验,还将推动几乎所有行业的变革。
首先以医疗健康为例,5G和AI在医疗保健全流程中发挥着重要作用。在事故现场,5G和AI赋能的AR眼镜将支持急救人员更准确地诊断伤势,并与急诊室医生分享病人的高清视频。在医院,5G企业专网和基于AI的摄像头将增强对病人的监护以发现异常,并支持医生与专家远程会诊,进行更充分的交流。病人出院后,这些技术将有助于在家中打造综合性康复环境,让病人与专业医疗人员实时安全地分享伤势的高清视频、连续性生命指征和其它传感器数据。在疫情期间,远程医疗已经成为新常态的一部分。而这一变化可能成为长期现象,预计到2030年美国半数医疗服务将通过云端完成,预计中国和全球其它国家及地区将出现类似趋势。这些变化将助力医疗健康行业扩大服务范围、降低成本、提升水平。
5G和AI还将对工业用例和制造业产生重要影响。未来工厂将高度智能化,厂区内密集部署传感器、工业机器人和头显设备,并通过优化过的可扩展、高可靠的5G企业专网,向云端传输此前从未被开发过的数据。制造设备将利用智能摄像头监测生产,动态调整设备以纠正问题。这不仅将助力制造企业提升自动化水平与控制效率,企业还能够实时获取数据,提升对业务的洞察,从而更快更准确地进行决策。这些技术在工业4.0演进中发挥关键作用,支持可重构的工厂提高生产力和灵活性,并支持企业更加轻松地应对需求的变化。
在工业领域,打造更智能的供应链物流和提升港口管理水平也蕴藏着巨大机遇。海运对于全球经济至关重要,全球超过80%的货物运输采用海运方式。数量庞大的集装箱在港口运送,自然而然,越来越多的港口运营企业希望借助5G企业专网和AI提升运营效率和安全性。从自动化货物处理开始,自动岸桥起重机和集装箱运输车精确地卸载集装箱,并将其运送到储存区的合适地点,运输记录会自动更新。同时,智能无人机利用计算机视觉监测船体结构,一旦侦测到任何问题就发送预警。分布在整个港口的智能高清摄像头监测集装箱位置,在提高安全性的同时,确保只有得到授权的人员才能进入相关区域。万物连接至云端,管理人员无论身处何地,都能监测港口运营的方方面面。
我要分享的最后一个领域是汽车,5G和AI正在支持全新功能,让驾乘体验更加安全愉悦。基于5G蜂窝车联网(C-V2X),汽车将能够与其它车辆、行人和基础设施直接通信,实时交换道路和交通状况的信息。它们还能分享驾驶意图、轨迹和位置信息,支持更加可预测的协作式自动驾驶,从而节省时间和能源、减少事故、降低死亡率。在这一领域中国处于前沿,通过《智能网联汽车技术路线图》推动支持C-V2X的网联汽车的发展,旨在实现2025年中国C-V2X终端新车装配率达50%的目标。5G C-V2X与AI结合,将支持更高水平的自动驾驶,大幅提升安全性和便捷性。5G和AI还将变革车内体验,为驾乘人员提供更加个性化的座舱配置和内容。具备计算机视觉的座舱摄像头和心率传感器将监测驾驶者状态,如果发现有疲劳驾驶的迹象就会提醒,并通过和汽车先进驾驶辅助系统(ADAS)融合,预防交通事故。近二十年来,高通一直积极推动汽车行业的发展,我们对未来的机遇倍感兴奋。
为了加速迈向智能云连接的未来,我们正与中国及全球的领先企业合力推动创新。我们倍感兴奋,能够助力打造更智能的边缘终端,让AI在云端发挥全部潜能。5G将是连接万物的连接平台。这对移动通信行业所有从业者而言,意味着巨大的机遇。
再次感谢邀请我参与今天的活动。请大家继续关注本次大会的其它环节。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。