近期,信息检索领域顶级会议ACM SIGIR2018在美国密歇根安娜堡成功举办,滴滴技术团队深度参与了大会,并主办智能交通信息学专题讨论会,详细介绍了滴滴在出行领域的探索和实践并分享了产学研合作经验。滴滴方面还表示,后续将积极以开放协作携手科研工作者进行更广泛学术研究,共同解决世界级的交通、环保挑战。
ACM SIGIR 是国际计算机学会主办的信息检索领域最重要的学术会议,今年已是第四十一届。每年SIGIR都会汇集来自世界各地的顶尖信息检索研究人员和从业人员,对外展示最新技术和最新成果发现。此次SIGIR 2018 共收到论文 736篇,录用184篇(其中长文投稿 409 篇,录用86篇),会议参会人数近800人。
滴滴技术团队撰写的《Taxi or Hitchhiking: Predicting Passenger's Preferred Service on Ride Sharing Platforms》论文也被大会收录。通过对用户的出行选择进行建模,该文章提出了一个基于用户时间、空间和行为特征的推荐系统,能帮助解决用户出行需求和偏好上的预测和推荐问题。离线的模拟表明该模型能大幅提高准确率并且帮助用户更高效地进行出行规划。

(滴滴算法专家现场讲解论文,吸引了众多国内外同行与专家学者来交流。)
不仅是论文接收,大会的主题报告同样也备受外界关注。在SIGIR 2018上,滴滴副总裁、AI Labs负责人叶杰平教授发表了主题演讲,详细介绍了滴滴如何利用人工智能技术帮助提升用户出行体验、解决全球交通挑战,并重点分析了滴滴在智能派单、智能地图、智能客服、语音识别、智慧交通等领域的实践经验。在叶杰平看来,人工智能技术在交通方面的改变是多层次的,未来在交通基础设施、车辆交通工具、共享出行三个层次都将会出现历史性的变革,而滴滴也早已积极布局:不仅包括底层基础的AI算法以及核心的AI 技术,如语音、自然语言处理、图像,还包括由AI技术支持的应用--提升用户体验、助力城市建设智慧交通网络以及积极布局智能驾驶及新能源汽车等。

(滴滴AI Labs负责人叶杰平教授在SIGIR现场畅谈滴滴的AI布局和技术创新。)
据介绍,在城市交通领域,目前滴滴已经与济南、贵阳、沈阳、南京、武汉等20多个城市展开合作,帮助优化了超过1300个智慧信号灯,平均降低了10%-20%的拥堵时间。“我们还将持续投入,并且广泛合作,将人工智能应用拓展至社会公益领域,让技术创造更大价值”,叶杰平说。
学术界和产业界的结合也是大会关注的一大重点。滴滴副总裁、智能出行部负责人郄小虎在SIGIR大数据产学研交流会上,对外分享了滴滴的产学研合作经验。他表示,滴滴拥有丰富的数据积累,基于领先的大数据和技术优势,滴滴正在持续推进技术前沿,同时积极携手学界为新的可持续发展提出解决方案。

(滴滴智能出行部负责人郄小虎在现场详解滴滴的科研合作经验以及人才培养机制)
郄小虎称,除向学界开放脱敏数据资源、开放计算基础设施外,滴滴还先后与密西根大学、斯坦福大学人工智能实验室、中国计算机学会、香港科技大学、电气电子工程协会等国内外十余家学术科研机构建立科研合作关系,共同在人工智能、智慧交通、智能驾驶、经济学、运筹学等领域进行探索交流、人才培养等,携手助推交通产业不断向前突破。近期滴滴还将公布新一轮主题研究计划,希望能与更多专业领域内的优秀学者展开合作。

(密西根大学Pascal Van Hentenryck教授在研讨会上分享自己对未来出行变革的看法)
值得注意的是,本次大会上,滴滴还主办了智能交通信息学研讨会并公开征集论文,携手密西根大学Pascal Van Hentenryck、华盛顿大学班学钢等教授共同分享了当前城市交通治理领域的前沿探索,同时对智能交通信息学的未来进行探讨。经过组委会评选,最终有七篇论文在研讨会上集中展示。
研讨会现场,滴滴通过两篇论文《POI Semantic Model with a Deep Convolutional Structure》、《DiDi Ride Cancellation Smart Fault Determination System》重点展示了在POI(信息点)检索、取消判责领域的研究成果和实践。以POI检索为例,滴滴技术团队提出一种基于深度卷积网络的POI语义模型(Deep POI Semantic Model),能将输入文本通过深度网络模型映射到语义向量空间,从而计算向量之间的相似度值得到文本之间的相关性,有效地解决POI检索场景下的相关性匹配问题,提高滴滴地图的检索满意度。而取消判责,则创新性地提出了一种基于机器学习+规则的混合算法,能引入数以万维的特征作为输入,获得更高的准确率和召回率,显著提升用户体验。
上海交通大学张伟楠副教授现场感言,研讨会向SIGIR社区展示了信息检索主题如何赋能全新领域,内容非常新颖。华盛顿大学班学钢教授也评价称,滴滴持续向学界推进数据开放、推广高校合作,携手学界发现、定义问题,这一做法非常值得更多企业借鉴。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。