7月20日,滴滴Di-Tech算法大赛落幕,一等奖获得者拿到了10万美元的大奖。在算法大赛圆桌会议上,滴滴研究院院长何晓飞解释了自己如何被滴滴吸引,并且给业内顶尖人才提出建议,应该解决更多有价值的实际问题。
何晓飞把人工智能的来临形容为“大势所趋”,而自己来滴滴则是“顺势而为”。在过去10年,中国学术界和工业界总体来讲是隔离的。但在美国,这个氛围是不一样的。美国很多高校解决的问题不是纯粹意义的研究,而是直接去解决工业界的需求,产业和工业互相促进。
目前滴滴要解决的出行问题,跟谷歌AlphaGo一样,都需要人工智能,不一样的地方是,滴滴需要的计算比AlphaGo更加复杂。因为每一条道路都是计算网格中的一部分,道路的网格复杂度远远超过围棋网格,此外还需要增加时间维度,因为司机在路上行驶,所以每一秒钟,需求都会发生变化。
在人工智能领域,算法是引擎,大数据是燃料。目前高校有最聪明的人才,但是他们得不到大数据燃料,所以很难训练出更聪明的算法引擎。本次滴滴算法大赛开放了滴滴平台上部分脱敏数据,给参赛人员进行研究,得到数据的参赛队伍交出了令人惊喜的算法。
之后,滴滴希望跟高校有更多合作,但是不希望成为企业抛出问题给研究机构解决这种模式。而是希望通过长期合作、开放共赢的方式,实现共同成长。高校有一流的研究人才,在基础研究领域有深厚的积累,滴滴有海量的大数据,需要解决出行的基础问题,双方很多合作契机。
滴滴研究院副教授叶杰平曾经是密歇根大学终身教授,加入滴滴同样也是被人工智能即将到来的“召唤”、滴滴要解决的世界难题,以及滴滴所拥有的海量数据所吸引。除了完成日常工作之外,叶杰平教授在滴滴开设了人工智能课程,通过讲课的方式使算法人才得到更快的成长。
除了召开算法大赛之外,滴滴还在探索其他与高校合作的形式。比如去年开始的“新锐计划”,对研究生、博士生有特别好的人工智能算法基础的,滴滴会有一个专门的绿色通道。同时,滴滴也在探索更多其他数据、项目上的合作方式。
何晓飞认为,虽然机器学习已经提出很多年,但随着计算能力、大数据存储能力的提高,人工智能大规模爆发的契机已经来临,而算法引擎需要更多顶尖人才的参与,需要学术界和工业界共同的合作和努力。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。