当地时间8月19-23日 ,国际数据挖掘顶级会议KDD2018在英国伦敦举行。滴滴技术团队现场重点展示了在地图服务、智能派单等领域的技术突破,并首次对外详解相关算法实践。滴滴还宣布进一步扩大其盖亚数据开放计划,新增174G的免费科研数据集,以开放协作支持全球科研工作者进行更广泛学术研究。
四篇论文入选 交通出行中的人工智能大解密
KDD全称是国际数据挖掘与知识发现大会(ACM SIGKDD Conference on Knowledge Discovery and Data Mining),今年已经是第24届。作为是最有影响力的国际会议之一,大会的课程、报告、论文均被认为代表了领域内最新进展和最前沿应用。
在今年KDD2018上,滴滴共有四篇论文入选,涵盖ETA预测 ( Estimated Time of Arrival,预估到达时间) 、智能派单、大规模车流管理等多个研究领域。此外,滴滴还重点举办了《交通出行中的人工智能(AI in Transportation)》辅导教程(Conventional Tutorial),吸引了来自学术界、工业界的200多名从业人员参与,成为现场最火爆的辅导教程之一。在近四小时的交流中,滴滴的研究团队向现场听众全面地分享了智能交通出行领域中AI算法的挑战、机遇及最新的应用进展,并就ETA预测、交通预测中对路网图结构的利用、强化学习在交通领域的应用等问题进行了重点探讨。
(KDD2018首日,滴滴举办辅导教程,吸引两百多位专业人员参与)
路径规划(route planning)和ETA是地图领域至关重要的两项基础服务。在路径规划部分,滴滴研究团队梳理了经典的路径规划算法,阐述了如何转换思路将路径规划问题建模成一个马尔科夫过程,并引入强化学习技术来提升导航效果。而在ETA部分则回顾了规则模型、矩阵分解模型、时间序列模型,重点介绍了滴滴在ETA问题上的思考和进展,包括基于深度学习的Wide-deep-recurrent模型和基于多任务学习的路径无关ETA模型。两项算法实践均写入论文被KDD2018收录。
(滴滴提出WDR模型显著提升了ETA预测精度,算法专家KDD现场分享模型实践)
除了地图相关的内容之外,滴滴还分享了出行相关的其它重要算法。派单是出行场景中的核心步骤,为了更好的优化派单效率,滴滴使用强化学习技术来构建派单算法,能基于对全天供需、出行行为的预测和归纳,考虑一天内司机整体的效率,能在确保乘客出行体验的同时明显提升司机的收入,这一模型实践论文也在KDD 2018 中以口头报告的形式发表。
(滴滴算法专家在KDD2018现场详解强化学习在滴滴派单中的应用)
此外,滴滴还分析了AI技术在交通预测、智慧信号灯、交通模拟器、电动汽车充电桩运营和电池管理等问题上的运用。据介绍,以智慧信号灯为例,基于滴滴现有数据、交警地磁卡口数据,再结合AI算法,滴滴能精准地预测每一个十字路口各个方向的车流量,并在此基础上更加智能地做信号灯控制。目前,滴滴已经和二十多个城市进行智慧交通合作,帮助优化了全中国超过1300多个红绿灯,平均降低10%至20%的拥堵时间。未来,滴滴也将积极携手更多城市合作伙伴,共建高效、环保的智慧交通体系。
盖亚数据开放计划扩大 二期新增174G免费科研数据集
(叶杰平教授在KDD2018现场发布新一期盖亚数据开放计划)
值得注意的是,在此次KDD上,滴滴还宣布进一步扩大其盖亚数据开放计划,新增174G的二期科研数据集,以开放协作支持全球科研工作者进行更广泛学术研究。全球高校和科研机构的专家学者可登入盖亚数据开放计划网站提交相关信息免费获取。
据悉,相较首期开放的2016年11月滴滴平台专车和快车在成都部分区域内的原始轨迹数据,此次二期数据集在时间和空间维度上均有扩大,不仅新增加了2016年10月成都市同一区域滴滴平台专车和快车的原始轨迹数据,还新开放了2016年10月和11月西安部分区域内专车和快车的原始轨迹数据,能更好地支持学者进行节假日、非节假日及多城市的比较分析。
相关数据并不涉及任何用户的个人信息。滴滴还对数据进行匿名化、加密等处理,能确保相关数据无法追溯到个人,无法还原。
滴滴AI Labs负责人叶杰平表示,滴滴一直在利用大数据、AI技术来改善城市的交通,也希望能和更多的科研工作者一起,激励更多科技创新,在智慧交通前沿做出更多的前瞻探索,共同解决世界级的交通、环保挑战,“我们非常愿意向高校、科研机构开放部分脱敏数据和计算基础设施,未来盖亚数据开放计划也将在保证安全的情况下不断扩大。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。