近日,由联合国工业发展组织投资和技术促进网络与中国国际进口博览局主办的“第四次工业革命与智慧出行论坛”在第三届进博会期间举行。大会以“智慧引领 通向未来”为主题,邀请人工智能与智慧出行领域的相关行业专家,共同探讨人类智慧出行的现实情况与未来图景。高通公司中国区研发负责人徐晧博士在描绘智慧出行的蓝图时指出,未来的汽车不应再被单纯的视作技术,更需要解决出行中的痛点,而自动驾驶可以提高效率、减少危险性,将未来出行体验转变为更高品质的娱乐体验。
高通中国区研发负责人徐晧在论坛上发言
2020年7月初,3GPP完成5G标准第二版规范Release 16,将5G大幅扩展至全新服务。Rel-16包括的全新5G规范将在诸多领域激发全新的5G机遇,为各类新行业的变革带来关键技术支持。其中,面向蜂窝车联网(C-V2X)的基于5G NR的直连通信,就是Rel-16的关键发明领域之一。这将增强自动驾驶的安全性,减少行车时间并提高能源效率,加速网络效应,为汽车用例带来全新优势。
徐晧博士认为,要满足业界与大众对车路行协同的智慧出行场景想象,仍有两个主要的技术难点需要克服。首先,在测试自动驾驶的场景时,要实现算法的100%零失误仍很难;其次,在实验室或测试中诞生一台设备很容易,但要将设备商品化、做便宜仍是较大的难题。徐晧指出,“从技术研发到标准制定,再到实验、到商用,每一个部分都需要经过一到两年时间的摸索。真正能够让大众感受到自动驾驶的优势、获得自动驾驶的体验,还需要三到五年时间;但这是一个不断优化的过程,要达到L4、L5级别的自动驾驶,还需要十年甚至更长时间。”
车联网的发展将为实现自动驾驶铺平道路。在通信业界看来,C-V2X继续演进、自动驾驶向L5级别发展,都离不开5G NR框架的支持。作为全球领先的无限科技创新者,高通始终在推动5G在各垂直应用中的扩展,车联网也一直是高通较为看重的领域之一。有研究报告预测,到2035年,5G将为汽车产业及其供应链和客户创造超过2.4万亿美元的总经济产出,几乎占预期5G全球经济影响的五分之一。
高通在汽车领域拥有超过15年的投入,目前全球已有超过1亿辆汽车采用了高通的技术。截至2020年1月,全球11家制造商已在其模组中采用9150 C-V2X芯片组;超过12家路侧单元(RSU)厂商计划在其产品组合中采用上述模组。在该芯片组的支持下,全世界超过10家一级供应商和汽车后市场车载单元(OBU)厂商已为其C-V2X产品上市准备就绪。如今,已有厂商正在考虑采用高通新推出的面向先进驾驶辅助系统(ADAS)和自动驾驶(AD)的Qualcomm Snapdragon Ride平台。
谈及中国在智慧出行领域的底层技术研发与科研能力,徐晧认为,智慧出行领域的技术研发与无线通信的底层研发相似,需要经历每一个通信代际的常年积累。从1G到4G时代,中国在商用部署上一代更比一代进步。中国企业在4G、5G时代,已经非常积极地参加标准制定;到5G技术商用部署时,中国已经走在了世界的前列,成为全世界最先商用5G的地区之一。作为一家跨国企业,高通非常高兴能与包括模组、整车乃至地图领域的中国生态伙伴紧密合作,共同推动智慧出行产业发展。
5G时代,产业合作将成为常态,在智慧出行领域也是如此。在面对不确定性时,高通仍然愿做科技领域合作的稳定力量。
徐晧表示,面对不确定性,高通将始终坚持两个原则:一是对技术革新的重视,二是坚持与合作伙伴共赢互助。高通将始终坚持创新,将精力付诸研发与创新,不断推动移动通信技术向前演进,支持人工智能、自动驾驶技术的并行发展,为生态合作伙伴创造价值。同时,高通也将始终坚持合作共赢,专注于汽车内部的网络体验,以及汽车外部车与车、车与行人、车与基础设施之间的连接,以领先的通信技术持续赋能智慧出行及相关行业合作伙伴的成长,共绘智慧出行的未来图景。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。