亚马逊送货无人机
北京时间5月11日早间消息,据BBC报道,亚马逊上月申请了一项专利,希望无论用户身在何地,都能用送货无人机在半小时内将包裹直接送到他们手中。
在此之前,亚马逊的无人机送货计划仅局限于“送货上门”,像传统邮递员一样直接将包裹投递到用户门口。但亚马逊的这项专利申请表明,该公司还在探索新的方式,希望根据用户的智能手机判断其所在的位置,从而直接将包裹送到用户手中。
根据专利申请文件,亚马逊还专门设立了一套订单流程,用户首先通过亚马逊手机应用在线购买一些体积较小的产品,然后在配送选项中选择“送货给我”。之后,与用户距离最近的无人机系统便会执行送货任务,并将产品直接送至用户智能手机所在的位置。
一旦进入一定距离范围,无人机便可借助用户智能手机的摄像头功能实现着陆。目前还不太清楚具体实现方式,从理论上讲,客户可以自行降落无人机。不过,这一过程必须保证无人机的降落安全,避免硬着陆的情况发生。
然而,降落并非关键所在。该专利申请文件表明,无人机未必要真正接触地面即可投递货物,而是可以盘旋在用户周围,然后轻轻投下包裹。文件还现实,亚马逊希望该公司的无人机可以在空中相互交流,从而分享天气信息、地理位置、路径数据和着陆地点。
不过,亚马逊的这项无人机送货服务正式实施前仍需克服一些障碍。目前无法确保美国政府一定会批准这项专利,即使获得了专利,能否最终部署该技术也存在一些疑问。该公司还希望美国及其他国家或地区的航空管理部门允许其推广无人机送货项目,而不必非要将无人机控制在操作者的视线范围之内。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。