
互联网是一个奇妙的世界,没人知道你的照片何时拍下、从哪里来。
通过神乎其技的P图处理,图片可以被重复利用,或重新组合,而不留痕迹——这对那些试图为自己的分享增添趣味的人很有帮助,但对虚假信息的提供者也很有帮助。前阵子红极一时的“上海名媛”事件就是一个例子。
来自圣迭戈的初创企业Truepic公司希望让智能手机上的照片与视频更加可信。Truepic与移动芯片制造商高通合作,为智能手机的相机添加一种全新模式,能够根据拍摄的时间与地点,对图像进行安全标记,确保他人能够检查图像或视频的真实性。以此为基础,社交媒体上种种耸人听闻的消息及图片或将得到有效遏制。
这项新功能旨在支持一个名为「内容真实性倡议(Content Authenticity Initiative,下文简称“CAI”)」的组织正在开发的数字图像标准,该组织成员包括Twitter、Adobe以及《纽约时报》。该系统将允许图像和视频被标记上以加密方式编码的信息,包括真实位置与捕捉方式。一切编辑操作都会留下痕迹,新闻机构或其他组织则可借此跟踪篡改活动,或者验证来自其他组织的图像是否真实可信。
但任何标准只有得到广泛应用,才可能发挥影响力。Adobe表示将在旗下旗舰图像增强工具Photoshop中建立支持,《泰晤士报》则计划测试摄影记者与编辑如何使用此项技术。Truepic和高通的首个展示项目,将介绍如何将该方案集中至硬件当中。Truepic公司副总裁Sherif Hanna表示,“我们认为实现这一目标的重要方法,在于将其转化为人们移动设备上的原生功能。”
这项合作可能带来广泛的应用潜力,因为高通公司的芯片一直在为包括三星在内的各类大牌Android智能手机提供支持。高通公司副总裁Manvinder Singh表示,设备制造商完全可以将这项技术集成至公司芯片的未来设计中。Singh透露,“已经有几家企业对此表示兴趣。”当然,考虑到苹果公司一直采用定制化设计的芯片,因此若想在苹果设备上支持类似功能,需要配合单独的实施方案。
图:Truepic技术将支持Adobe及其他厂商正在开发的系统,借此以加密编码信息的形式向图像及视频中添加拍摄地点、如何拍摄等标记。
Truepic开发的照片标记代码,将在设备处理器的安全区域内运行,预计将使用负责支付操作或指纹扫描等任务的专项处理器运行。当人们将相机切换为安全模式时,像素捕捉会绕过设备操作系统,借此保证图像内容不受操纵。使用该设备的人仍可照常拍摄普通照片及视频。Hanna表示,该系统的出现,将使人们更加信息照片内容来自“真实场景,而非由编辑工具或者AI生成”。
但实际应用中的一大障碍,在于该应用需要接入互联网,才能通过政府时间服务器将经过验证的时间戳添加至照片上。整个过程不会添加任何可用于定位当前设备或用户身份的信息。此外,位置标记的精确度可能在几米范围,具体取决于拍摄设备的GPS信号质量。该应用创建的标签,将对支持CAI方案的软件直接可见,但具体标准的最终细节仍在开发当中。
里海大学助理教授Aparna Bharati一直从事图像取证工作,她表示使用图像来源对信息进行标准化标记的工具,将为在线媒体发布内容的可信度构建带来有益的贡献。但实际吸引力如何,恐怕仍有待观察。
在她看来,希望保护自己工作及声誉的媒体专家当然会欢迎这种工具,号称自己亲眼目睹或者经历了某些自然灾害的人们也会在照片加添加标签,让素材在新闻转载中变得更为可信。
但Bharati强调,任何基于真实性标准构建的标记工具,都有可能遭受攻击。未来,很可能有恶意攻击者、特别是政府支持的恶意组织尝试破坏这些控制方法。她认为,“我们必须尝试从敌对方的视角考虑问题。”
根据CAI的说法,他们正在制定措施,以防止对图像标记的滥用或操纵。Hanna则指出,将新功能与手机硬件集成起来,能够有效防止标记遭到干扰。
另外,Truepic还希望通过多种方式提高这种照片安全模式的知名度。这家初创企业已经与保险公司及电商平台开展合作,通过这项功能,确保人们上传真实有效的索赔素材或者退货申请。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。