7月8日,在2021世界人工智能大会(WAIC)开幕首日,高通公司总裁兼CEO安蒙(Cristiano Amon)发表主题演讲,具体内容如下:
我们正快速迈向人与万物智能互联的世界。多项技术的融合正在推动这一趋势,包括极速5G连接、高性能低功耗计算以及终端侧AI技术,驱动新一代智能边缘终端和云计算的发展。万物能够实时连接至云端,让终端、体验和数据受益于不断增加的内容、处理能力和云端存储空间。5G、AI和云的结合将有力推动创新和经济增长,赋能全新商业模式、全新服务和全新收入来源,并加速众多行业的数字化转型。
为了实现AI的规模化,我们需要确保智能广泛分布于整个网络。业界预测,2020年至2026年,月度移动数据流量将增长500%以上,数十亿全新联网终端和事物将分布于边缘侧。有效应对数据的快速增长,需要的不仅仅是将数据传输至云端。还需要在终端侧集成AI能力,直接运行算法,为云端智能提供有力补充。
终端侧AI具备多项关键优势,包括更高的即时性、可靠性和安全性。这些优势对于时延敏感和关键业务型应用至关重要,如自动驾驶汽车、智能电网和联网基础设施等。智能边缘终端产生的内容丰富的数据能够实时共享至云端,使AI得以充分发挥作用,并实现从云端到边缘侧的AI规模化应用。
高通公司是赋能终端侧智能的领军企业,这不仅源于超过10年的AI技术研究和产品开发投入,更得益于我们为智能边缘打造的先进处理能力。
让我们看看5G、AI和云将如何重新定义我们的日常生活体验。如今,AI几乎融入智能手机体验的方方面面,从影像到语音识别和安全。但很快AI还将带来全新维度的移动体验,包括高度的个性化、互动性和情境相关性。
视频串流和娱乐应用正在利用面部和运动跟踪,来理解用户对内容的偏好,从而提供高度相关的建议。游戏体验将更具沉浸感、更加令人兴奋,根据玩家技能水平动态调整游戏难度,可使玩家持续获得兼具挑战性和参与感的体验。
增强现实(AR)将改变我们观察周围世界并与之交互的方式。试想一下,佩戴AR眼镜观看足球赛,当球员被自动识别出即可实时查看该球员的统计数据和详细信息,以及社交讨论和其它相关信息。利用增强的手势和自然语言处理能力,我们将与终端、应用及内容更加直观地交互。
这仅仅是构想如何利用AI提升用户体验的开端。5G和AI不仅将变革用户体验,还将推动几乎所有行业的变革。
首先以医疗健康为例,5G和AI在医疗保健全流程中发挥着重要作用。在事故现场,5G和AI赋能的AR眼镜将支持急救人员更准确地诊断伤势,并与急诊室医生分享病人的高清视频。在医院,5G企业专网和基于AI的摄像头将增强对病人的监护以发现异常,并支持医生与专家远程会诊,进行更充分的交流。病人出院后,这些技术将有助于在家中打造综合性康复环境,让病人与专业医疗人员实时安全地分享伤势的高清视频、连续性生命指征和其它传感器数据。在疫情期间,远程医疗已经成为新常态的一部分。而这一变化可能成为长期现象,预计到2030年美国半数医疗服务将通过云端完成,预计中国和全球其它国家及地区将出现类似趋势。这些变化将助力医疗健康行业扩大服务范围、降低成本、提升水平。
5G和AI还将对工业用例和制造业产生重要影响。未来工厂将高度智能化,厂区内密集部署传感器、工业机器人和头显设备,并通过优化过的可扩展、高可靠的5G企业专网,向云端传输此前从未被开发过的数据。制造设备将利用智能摄像头监测生产,动态调整设备以纠正问题。这不仅将助力制造企业提升自动化水平与控制效率,企业还能够实时获取数据,提升对业务的洞察,从而更快更准确地进行决策。这些技术在工业4.0演进中发挥关键作用,支持可重构的工厂提高生产力和灵活性,并支持企业更加轻松地应对需求的变化。
在工业领域,打造更智能的供应链物流和提升港口管理水平也蕴藏着巨大机遇。海运对于全球经济至关重要,全球超过80%的货物运输采用海运方式。数量庞大的集装箱在港口运送,自然而然,越来越多的港口运营企业希望借助5G企业专网和AI提升运营效率和安全性。从自动化货物处理开始,自动岸桥起重机和集装箱运输车精确地卸载集装箱,并将其运送到储存区的合适地点,运输记录会自动更新。同时,智能无人机利用计算机视觉监测船体结构,一旦侦测到任何问题就发送预警。分布在整个港口的智能高清摄像头监测集装箱位置,在提高安全性的同时,确保只有得到授权的人员才能进入相关区域。万物连接至云端,管理人员无论身处何地,都能监测港口运营的方方面面。
我要分享的最后一个领域是汽车,5G和AI正在支持全新功能,让驾乘体验更加安全愉悦。基于5G蜂窝车联网(C-V2X),汽车将能够与其它车辆、行人和基础设施直接通信,实时交换道路和交通状况的信息。它们还能分享驾驶意图、轨迹和位置信息,支持更加可预测的协作式自动驾驶,从而节省时间和能源、减少事故、降低死亡率。在这一领域中国处于前沿,通过《智能网联汽车技术路线图》推动支持C-V2X的网联汽车的发展,旨在实现2025年中国C-V2X终端新车装配率达50%的目标。5G C-V2X与AI结合,将支持更高水平的自动驾驶,大幅提升安全性和便捷性。5G和AI还将变革车内体验,为驾乘人员提供更加个性化的座舱配置和内容。具备计算机视觉的座舱摄像头和心率传感器将监测驾驶者状态,如果发现有疲劳驾驶的迹象就会提醒,并通过和汽车先进驾驶辅助系统(ADAS)融合,预防交通事故。近二十年来,高通一直积极推动汽车行业的发展,我们对未来的机遇倍感兴奋。
为了加速迈向智能云连接的未来,我们正与中国及全球的领先企业合力推动创新。我们倍感兴奋,能够助力打造更智能的边缘终端,让AI在云端发挥全部潜能。5G将是连接万物的连接平台。这对移动通信行业所有从业者而言,意味着巨大的机遇。
再次感谢邀请我参与今天的活动。请大家继续关注本次大会的其它环节。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。