近期,信息检索领域顶级会议ACM SIGIR2018在美国密歇根安娜堡成功举办,滴滴技术团队深度参与了大会,并主办智能交通信息学专题讨论会,详细介绍了滴滴在出行领域的探索和实践并分享了产学研合作经验。滴滴方面还表示,后续将积极以开放协作携手科研工作者进行更广泛学术研究,共同解决世界级的交通、环保挑战。
ACM SIGIR 是国际计算机学会主办的信息检索领域最重要的学术会议,今年已是第四十一届。每年SIGIR都会汇集来自世界各地的顶尖信息检索研究人员和从业人员,对外展示最新技术和最新成果发现。此次SIGIR 2018 共收到论文 736篇,录用184篇(其中长文投稿 409 篇,录用86篇),会议参会人数近800人。
滴滴技术团队撰写的《Taxi or Hitchhiking: Predicting Passenger's Preferred Service on Ride Sharing Platforms》论文也被大会收录。通过对用户的出行选择进行建模,该文章提出了一个基于用户时间、空间和行为特征的推荐系统,能帮助解决用户出行需求和偏好上的预测和推荐问题。离线的模拟表明该模型能大幅提高准确率并且帮助用户更高效地进行出行规划。
(滴滴算法专家现场讲解论文,吸引了众多国内外同行与专家学者来交流。)
不仅是论文接收,大会的主题报告同样也备受外界关注。在SIGIR 2018上,滴滴副总裁、AI Labs负责人叶杰平教授发表了主题演讲,详细介绍了滴滴如何利用人工智能技术帮助提升用户出行体验、解决全球交通挑战,并重点分析了滴滴在智能派单、智能地图、智能客服、语音识别、智慧交通等领域的实践经验。在叶杰平看来,人工智能技术在交通方面的改变是多层次的,未来在交通基础设施、车辆交通工具、共享出行三个层次都将会出现历史性的变革,而滴滴也早已积极布局:不仅包括底层基础的AI算法以及核心的AI 技术,如语音、自然语言处理、图像,还包括由AI技术支持的应用--提升用户体验、助力城市建设智慧交通网络以及积极布局智能驾驶及新能源汽车等。
(滴滴AI Labs负责人叶杰平教授在SIGIR现场畅谈滴滴的AI布局和技术创新。)
据介绍,在城市交通领域,目前滴滴已经与济南、贵阳、沈阳、南京、武汉等20多个城市展开合作,帮助优化了超过1300个智慧信号灯,平均降低了10%-20%的拥堵时间。“我们还将持续投入,并且广泛合作,将人工智能应用拓展至社会公益领域,让技术创造更大价值”,叶杰平说。
学术界和产业界的结合也是大会关注的一大重点。滴滴副总裁、智能出行部负责人郄小虎在SIGIR大数据产学研交流会上,对外分享了滴滴的产学研合作经验。他表示,滴滴拥有丰富的数据积累,基于领先的大数据和技术优势,滴滴正在持续推进技术前沿,同时积极携手学界为新的可持续发展提出解决方案。
(滴滴智能出行部负责人郄小虎在现场详解滴滴的科研合作经验以及人才培养机制)
郄小虎称,除向学界开放脱敏数据资源、开放计算基础设施外,滴滴还先后与密西根大学、斯坦福大学人工智能实验室、中国计算机学会、香港科技大学、电气电子工程协会等国内外十余家学术科研机构建立科研合作关系,共同在人工智能、智慧交通、智能驾驶、经济学、运筹学等领域进行探索交流、人才培养等,携手助推交通产业不断向前突破。近期滴滴还将公布新一轮主题研究计划,希望能与更多专业领域内的优秀学者展开合作。
(密西根大学Pascal Van Hentenryck教授在研讨会上分享自己对未来出行变革的看法)
值得注意的是,本次大会上,滴滴还主办了智能交通信息学研讨会并公开征集论文,携手密西根大学Pascal Van Hentenryck、华盛顿大学班学钢等教授共同分享了当前城市交通治理领域的前沿探索,同时对智能交通信息学的未来进行探讨。经过组委会评选,最终有七篇论文在研讨会上集中展示。
研讨会现场,滴滴通过两篇论文《POI Semantic Model with a Deep Convolutional Structure》、《DiDi Ride Cancellation Smart Fault Determination System》重点展示了在POI(信息点)检索、取消判责领域的研究成果和实践。以POI检索为例,滴滴技术团队提出一种基于深度卷积网络的POI语义模型(Deep POI Semantic Model),能将输入文本通过深度网络模型映射到语义向量空间,从而计算向量之间的相似度值得到文本之间的相关性,有效地解决POI检索场景下的相关性匹配问题,提高滴滴地图的检索满意度。而取消判责,则创新性地提出了一种基于机器学习+规则的混合算法,能引入数以万维的特征作为输入,获得更高的准确率和召回率,显著提升用户体验。
上海交通大学张伟楠副教授现场感言,研讨会向SIGIR社区展示了信息检索主题如何赋能全新领域,内容非常新颖。华盛顿大学班学钢教授也评价称,滴滴持续向学界推进数据开放、推广高校合作,携手学界发现、定义问题,这一做法非常值得更多企业借鉴。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。