科技行者 5月18日 北京消息:大家应该都很清楚,塑料垃圾对于海洋生物一直是种可怕的威胁,然而目前为止,我们依然很难检测到海洋中的塑料污染状况。
塑料制品往往色彩多样,不同尺寸,不同类型,大多数由多种化学物质制成,更糟糕的是,地球上的海洋区域广阔无垠,每年新增的数百万吨塑料很快就会四散蔓延,这种“大塑料”会逐渐分解成细小的塑料块,难以循迹,给海洋生物造成致命威胁。
而只有确定海洋区域内哪些位置的塑料制品最多,才能制定出有针对性的清洁与污染预防举措。
根据近期《自然通讯(Scientific Reports)》期刊上发表的最新研究结果显示,以机器学习为基础的气象卫星,可以搞定海洋环境塑料污染的追踪任务。
英国普利茅斯海洋实验室的一支科学家小组就此进行测试,利用经过训练的机器学习算法分析由欧洲航天局运行的两颗卫星发回的数据,从而找出与塑料垃圾相关的蛛丝马迹。
▲ 图:气象卫星的主责,本是立足环地球轨道,观察威力强大的雷暴与龙卷风。图片来源/美国航空航天局(NASA)
本次研究中使用的两颗Sentinel-2卫星,均配备有12波段多光谱仪(MSI)传感器,能够以10米为基本像素单位,收集海面上的高分辨率图像。在两颗卫星的协同努力下,系统每隔2-5天,即可从世界各地的沿海区域内重复收集数据。换句话说,这套系统每个月能够对地球上所有邻海位置进行6-15次全景图像收集——这可是一大批数据!
卫星会收集包括光信号在内的多种数据类型,并根据对象反射的光信号波长,区分目标的具体材质。从原理层面来看,清澈的海水能够高效吸收近红外(NIR)到短波红外(SWIR)光谱范围内的光波,而塑料及天然碎屑等漂浮物则会大量反射近红外光波。这种光吸收水平层面的差异,也让卫星在理论上获得了检测海面漂浮物的能力。
不同漂浮物的近红外信号也有所区别。研究人员利用卫星数据,训练出一种机器学习算法,成功地从卫星捕捉到的光信号数据中,识别出漂浮塑料的光信号,进而发现了希腊海岸周边存在的塑料漂浮区。研究人员们还利用这类光数据,教会了算法将某些近红外光信号与漂浮的塑料碎片关联起来。同样的,算法也逐步学会了如何区分塑料与天然物质(例如海藻,浮木,以及泡沫塑料等)。
▲ 图:卫星每2-5天对世界范围内各沿海地区进行重复拍摄,借此收集大量可用于跟踪海洋内塑料污染状况的数据。
在算法开始运行之后,研究人员开始利用来自全球四大沿海水域的卫星数据进行测试,分别为:阿克拉(加纳)、圣克安群岛(加拿大)、达南(越南)以及苏格兰(英国)。总体而言,该算法能够以86%的准确度识别出塑料污染,该算法在分析圣胡安群岛的数据时带来了100%准确度。
此外,该算法还能根据卫星数据,定位尺寸≥5毫米的塑料碎片,正是这类“大塑料” 逐渐分解成细小的塑料块,给海洋生物造成了致命威胁。上述结果也表明,将卫星数据与机器学习算法结合,确实能帮助人类跟踪并清理全球塑料污染难题。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。