当地时间8月19-23日 ,国际数据挖掘顶级会议KDD2018在英国伦敦举行。滴滴技术团队现场重点展示了在地图服务、智能派单等领域的技术突破,并首次对外详解相关算法实践。滴滴还宣布进一步扩大其盖亚数据开放计划,新增174G的免费科研数据集,以开放协作支持全球科研工作者进行更广泛学术研究。
四篇论文入选 交通出行中的人工智能大解密
KDD全称是国际数据挖掘与知识发现大会(ACM SIGKDD Conference on Knowledge Discovery and Data Mining),今年已经是第24届。作为是最有影响力的国际会议之一,大会的课程、报告、论文均被认为代表了领域内最新进展和最前沿应用。
在今年KDD2018上,滴滴共有四篇论文入选,涵盖ETA预测 ( Estimated Time of Arrival,预估到达时间) 、智能派单、大规模车流管理等多个研究领域。此外,滴滴还重点举办了《交通出行中的人工智能(AI in Transportation)》辅导教程(Conventional Tutorial),吸引了来自学术界、工业界的200多名从业人员参与,成为现场最火爆的辅导教程之一。在近四小时的交流中,滴滴的研究团队向现场听众全面地分享了智能交通出行领域中AI算法的挑战、机遇及最新的应用进展,并就ETA预测、交通预测中对路网图结构的利用、强化学习在交通领域的应用等问题进行了重点探讨。
(KDD2018首日,滴滴举办辅导教程,吸引两百多位专业人员参与)
路径规划(route planning)和ETA是地图领域至关重要的两项基础服务。在路径规划部分,滴滴研究团队梳理了经典的路径规划算法,阐述了如何转换思路将路径规划问题建模成一个马尔科夫过程,并引入强化学习技术来提升导航效果。而在ETA部分则回顾了规则模型、矩阵分解模型、时间序列模型,重点介绍了滴滴在ETA问题上的思考和进展,包括基于深度学习的Wide-deep-recurrent模型和基于多任务学习的路径无关ETA模型。两项算法实践均写入论文被KDD2018收录。
(滴滴提出WDR模型显著提升了ETA预测精度,算法专家KDD现场分享模型实践)
除了地图相关的内容之外,滴滴还分享了出行相关的其它重要算法。派单是出行场景中的核心步骤,为了更好的优化派单效率,滴滴使用强化学习技术来构建派单算法,能基于对全天供需、出行行为的预测和归纳,考虑一天内司机整体的效率,能在确保乘客出行体验的同时明显提升司机的收入,这一模型实践论文也在KDD 2018 中以口头报告的形式发表。
(滴滴算法专家在KDD2018现场详解强化学习在滴滴派单中的应用)
此外,滴滴还分析了AI技术在交通预测、智慧信号灯、交通模拟器、电动汽车充电桩运营和电池管理等问题上的运用。据介绍,以智慧信号灯为例,基于滴滴现有数据、交警地磁卡口数据,再结合AI算法,滴滴能精准地预测每一个十字路口各个方向的车流量,并在此基础上更加智能地做信号灯控制。目前,滴滴已经和二十多个城市进行智慧交通合作,帮助优化了全中国超过1300多个红绿灯,平均降低10%至20%的拥堵时间。未来,滴滴也将积极携手更多城市合作伙伴,共建高效、环保的智慧交通体系。
盖亚数据开放计划扩大 二期新增174G免费科研数据集
(叶杰平教授在KDD2018现场发布新一期盖亚数据开放计划)
值得注意的是,在此次KDD上,滴滴还宣布进一步扩大其盖亚数据开放计划,新增174G的二期科研数据集,以开放协作支持全球科研工作者进行更广泛学术研究。全球高校和科研机构的专家学者可登入盖亚数据开放计划网站提交相关信息免费获取。
据悉,相较首期开放的2016年11月滴滴平台专车和快车在成都部分区域内的原始轨迹数据,此次二期数据集在时间和空间维度上均有扩大,不仅新增加了2016年10月成都市同一区域滴滴平台专车和快车的原始轨迹数据,还新开放了2016年10月和11月西安部分区域内专车和快车的原始轨迹数据,能更好地支持学者进行节假日、非节假日及多城市的比较分析。
相关数据并不涉及任何用户的个人信息。滴滴还对数据进行匿名化、加密等处理,能确保相关数据无法追溯到个人,无法还原。
滴滴AI Labs负责人叶杰平表示,滴滴一直在利用大数据、AI技术来改善城市的交通,也希望能和更多的科研工作者一起,激励更多科技创新,在智慧交通前沿做出更多的前瞻探索,共同解决世界级的交通、环保挑战,“我们非常愿意向高校、科研机构开放部分脱敏数据和计算基础设施,未来盖亚数据开放计划也将在保证安全的情况下不断扩大。”
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。