当地时间8月19-23日 ,国际数据挖掘顶级会议KDD2018在英国伦敦举行。滴滴技术团队现场重点展示了在地图服务、智能派单等领域的技术突破,并首次对外详解相关算法实践。滴滴还宣布进一步扩大其盖亚数据开放计划,新增174G的免费科研数据集,以开放协作支持全球科研工作者进行更广泛学术研究。
四篇论文入选 交通出行中的人工智能大解密
KDD全称是国际数据挖掘与知识发现大会(ACM SIGKDD Conference on Knowledge Discovery and Data Mining),今年已经是第24届。作为是最有影响力的国际会议之一,大会的课程、报告、论文均被认为代表了领域内最新进展和最前沿应用。
在今年KDD2018上,滴滴共有四篇论文入选,涵盖ETA预测 ( Estimated Time of Arrival,预估到达时间) 、智能派单、大规模车流管理等多个研究领域。此外,滴滴还重点举办了《交通出行中的人工智能(AI in Transportation)》辅导教程(Conventional Tutorial),吸引了来自学术界、工业界的200多名从业人员参与,成为现场最火爆的辅导教程之一。在近四小时的交流中,滴滴的研究团队向现场听众全面地分享了智能交通出行领域中AI算法的挑战、机遇及最新的应用进展,并就ETA预测、交通预测中对路网图结构的利用、强化学习在交通领域的应用等问题进行了重点探讨。
(KDD2018首日,滴滴举办辅导教程,吸引两百多位专业人员参与)
路径规划(route planning)和ETA是地图领域至关重要的两项基础服务。在路径规划部分,滴滴研究团队梳理了经典的路径规划算法,阐述了如何转换思路将路径规划问题建模成一个马尔科夫过程,并引入强化学习技术来提升导航效果。而在ETA部分则回顾了规则模型、矩阵分解模型、时间序列模型,重点介绍了滴滴在ETA问题上的思考和进展,包括基于深度学习的Wide-deep-recurrent模型和基于多任务学习的路径无关ETA模型。两项算法实践均写入论文被KDD2018收录。
(滴滴提出WDR模型显著提升了ETA预测精度,算法专家KDD现场分享模型实践)
除了地图相关的内容之外,滴滴还分享了出行相关的其它重要算法。派单是出行场景中的核心步骤,为了更好的优化派单效率,滴滴使用强化学习技术来构建派单算法,能基于对全天供需、出行行为的预测和归纳,考虑一天内司机整体的效率,能在确保乘客出行体验的同时明显提升司机的收入,这一模型实践论文也在KDD 2018 中以口头报告的形式发表。
(滴滴算法专家在KDD2018现场详解强化学习在滴滴派单中的应用)
此外,滴滴还分析了AI技术在交通预测、智慧信号灯、交通模拟器、电动汽车充电桩运营和电池管理等问题上的运用。据介绍,以智慧信号灯为例,基于滴滴现有数据、交警地磁卡口数据,再结合AI算法,滴滴能精准地预测每一个十字路口各个方向的车流量,并在此基础上更加智能地做信号灯控制。目前,滴滴已经和二十多个城市进行智慧交通合作,帮助优化了全中国超过1300多个红绿灯,平均降低10%至20%的拥堵时间。未来,滴滴也将积极携手更多城市合作伙伴,共建高效、环保的智慧交通体系。
盖亚数据开放计划扩大 二期新增174G免费科研数据集
(叶杰平教授在KDD2018现场发布新一期盖亚数据开放计划)
值得注意的是,在此次KDD上,滴滴还宣布进一步扩大其盖亚数据开放计划,新增174G的二期科研数据集,以开放协作支持全球科研工作者进行更广泛学术研究。全球高校和科研机构的专家学者可登入盖亚数据开放计划网站提交相关信息免费获取。
据悉,相较首期开放的2016年11月滴滴平台专车和快车在成都部分区域内的原始轨迹数据,此次二期数据集在时间和空间维度上均有扩大,不仅新增加了2016年10月成都市同一区域滴滴平台专车和快车的原始轨迹数据,还新开放了2016年10月和11月西安部分区域内专车和快车的原始轨迹数据,能更好地支持学者进行节假日、非节假日及多城市的比较分析。
相关数据并不涉及任何用户的个人信息。滴滴还对数据进行匿名化、加密等处理,能确保相关数据无法追溯到个人,无法还原。
滴滴AI Labs负责人叶杰平表示,滴滴一直在利用大数据、AI技术来改善城市的交通,也希望能和更多的科研工作者一起,激励更多科技创新,在智慧交通前沿做出更多的前瞻探索,共同解决世界级的交通、环保挑战,“我们非常愿意向高校、科研机构开放部分脱敏数据和计算基础设施,未来盖亚数据开放计划也将在保证安全的情况下不断扩大。”
好文章,需要你的鼓励
这项由Snowflake AI Research发表的研究挑战了传统语言学对大型语言模型的批评,通过引入波兰语言学家Mańczak的理论框架,论证了LLM的成功实际上验证了"频率驱动语言"的观点。研究认为语言本质上是文本总和而非抽象系统,频率是其核心驱动力,为重新理解AI语言能力提供了新视角。
freephdlabor是耶鲁大学团队开发的开源多智能体科研自动化框架,通过创建专业化AI研究团队替代传统单一AI助手的固化工作模式。该框架实现了动态工作流程调整、无损信息传递的工作空间机制,以及人机协作的质量控制系统,能够自主完成从研究构思到论文发表的全流程科研工作,为科研民主化和效率提升提供了革命性解决方案。
德国马普智能系统研究所团队开发出专家混合模型的"即时重新布线"技术,让AI能在使用过程中动态调整专家选择策略。这种方法无需外部数据,仅通过自我分析就能优化性能,在代码生成等任务上提升显著。该技术具有即插即用特性,计算效率高,适应性强,为AI的自我进化能力提供了新思路。
Algoverse AI研究团队提出ERGO系统,通过监测AI对话时的熵值变化来检测模型困惑程度,当不确定性突然升高时自动重置对话内容。该方法在五种主流AI模型的测试中平均性能提升56.6%,显著改善了多轮对话中AI容易"迷路"的问题,为构建更可靠的AI助手提供了新思路。