科技行者 1月8日 北京消息(文/李祥敬):美国拉斯维加斯,2020年1月7日——在2020年国际消费电子展(CES 2020)上,英特尔在以“智能驱动创新”(Innovation through Intelligence)为主题的新闻发布会上演示了系列场景,展现了其如何将智能融入云、网络、边缘和PC,推动其对人、企业和社会创造积极的影响。
英特尔公司首席执行官司睿博(Bob Swan)在开场演讲中表示,越来越多的“物”都越来越像“电脑”,这是通过坚持不懈的创新实现的。持续的创新为生活创造了新应用、新体验。我们通过发展摩尔定律,带来前所未有的新技术。
司睿博解读了全球数据量的惊人增长:现在全球有560亿互联设备,相当于每个人有7个;2015年以来全球数据量每年增长25%,其中50%的数据量来源于边缘端;到2025年,全球数据量估计达到175ZB,而其中只有1%被人工智能模型所处理。
智能化才刚刚开始。为了应对惊人的数据量,我们需要实现更快地传输数据、高效存储和访问数据,以及处理所有数据。这也是为什么英特尔提出以数据为中心的战略转型。而且当前技术和未来技术平台将产生难以置信的影响。5G、人工智能和边缘智能设备,这些转折性技术结合在一起,让数字智能更加激动人心。
司睿博分享了英特尔子公司Mobileye的最新业务进展,其中一段视频演示,以更自然的方式实现自动驾驶汽车(RoboCar)的交通导航。该演示通过独立的传感系统,融合人工智能、计算机视觉、基于责任敏感安全模型(RSS)的法规科学以及真实冗余等最新科技,充分展示Mobileye如何以独特、创新的方式,令人和车的出行更加安全。
司睿博还重点介绍了英特尔与美国红十字会及其“缺失地图”项目(Missing Maps project)合作,在改善防灾备灾方面开展的工作。利用第二代英特尔至强可扩展处理器上集成的人工智能加速技术,英特尔正在协助美国红十字会及其“缺失地图”项目,为偏远地区绘制高精度的路桥地图,当灾难发生时,能为应急响应提供帮助。在2019年,英特尔数据科学家构建了一个计算机视觉模型,该模型能够识别乌干达卫星图像上先前未被标记的桥梁和道路。
“缺失地图”项目联合创始人、美国红十字会Cascades大区首席执行官Dale Kunce表示,对红十字会的工作人员而言,在防灾规划和紧急响应过程中,精确的地理信息极其重要。但世界上有些地区还未被标记在地图上,这给防灾规划和灾害响应造成了极大的困难。正因如此,我们与英特尔携手,运用人工智能技术绘制易受灾地区的地图,标记道路、桥梁、建筑物和城市。
根据缺失地图项目的数据,世界各地每年有近2亿人受灾。很多灾区并未标记在地图上,这导致应急响应人员缺少必要的信息,以快速制定救灾决策。
卫星图像有时不易辨识,并且各个国家的桥梁和基础设施不尽相同。人工智能模型增强了制图能力,可以覆盖更广泛的区域,并捕捉人眼难以察觉的事物。例如,该模型在乌干达南部发现了70座桥梁,而这些桥梁在“开放街道地图”(OpenStreetMap)或乌干达统计局官方地图中均未找到。
这一计算机视觉模型运行在第二代英特尔至强可扩展处理器上,该处理器内置了英特尔深度学习加速技术(DL Boost)和nGraph编译器。
尽管英特尔并不享有该数据集的全部权利,但正在寻求将该数据集作为开源资源提供给研究者和地理空间专业人士的机会。此外,英特尔还将召开研讨会,探讨如何将卫星图像和AI技术用于人道主义实践,从而充分利用为该项目开发的数据集和代码库。
司睿博表示:“英特尔的雄心,是帮助客户最大限度地利用人工智能、5G和智能边缘等转折性技术变革,共同为生活添彩,塑造我们未来数十年的世界。正如我们今天所着重介绍的那样,英特尔推动智能融入计算技术的方方面面,以创造前所未有的积极影响。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。