微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

Yoshua Bengio（约书亚·本吉奥）

悟空榜嘉宾

Yoshua Bengio（约书亚·本吉奥）

作者：CNET科技行者

2017-12-25 17:20

分享至：

蒙特利尔大学终身教授，蒙特利尔大学机器学习研究所负责人

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2017-12-25 17:20 • CNET科技行者

在人工智能研究领域，Yann LeCun、Geoffrey Hinton 和 Yoshua Bengio一直被公认为深度学习三巨头。

Yoshua Bengio是蒙特利尔大学（Université de Montréal）的终身教授，任教超过22年，是蒙特利尔大学机器学习研究所（MILA）的负责人，是CIFAR项目的负责人之一，负责神经计算和自适应感知器等方面，又是加拿大统计学习算法学会的主席，是ApSTAT技术的发起人与研发大牛。Bengio在蒙特利尔大学任教之前，是AT&T贝尔实验室 & MIT的机器学习博士后。

他的研究工作主要聚焦在高级机器学习方面，致力于用其解决人工智能问题，他是仅存的几个仍然全身心投入在学术界的深度学习教授之一。

Bengio 的主要贡献在于他对循环神经网络（RNN, Recurrent Neural Networks）的一系列推动，包括经典的neural language model，gradient vanishing 的细致讨论，word2vec的雏形，以及machine translation。Bengio是Deep Learning (《深度学习》)一书的合著者（另两位作者是Ian Goodfellow与Aaron Courville），这本书被Elon Musk评价为“深度学习领域的权威教科书”，且Bengio的”A neural probabilistic language model”论文开创了神经网络的语言模型 language model 先河，里面的思路影响了之后的很多基于神经网络做 NLP（自然语音处理）的文章。

为了在蒙特利尔大学及其附近的麦吉尔大学发展出“AI 生态环境”，2016年年末，Bengio 启动了一个名为 Element AI 的创业孵化器，以帮助研究所催生出的初创公司找准发展方向。

悟空榜嘉宾

分享至

0赞

好文章，需要你的鼓励

推荐文章

人工智能
图像生成
模型优化

2025-12-17 14:51

Adobe与UCLA联手突破AI模型速度瓶颈：让图像生成快一倍的"稀疏化魔法"

Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法，成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域，使用特殊"寄存器令牌"管理其余部分，在文本到图像生成、图像编辑和数学推理等任务中实现显著加速，同时完全保持了输出质量。
人工智能
计算机视觉
零样本学习

2025-12-17 14:51

不用再训练AI模型，香港科技大学团队发明"智能管家"，让AI一眼就知道该抓哪里用哪里

香港科技大学团队开发出A4-Agent智能系统，无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程，在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路，使其能够像人类一样举一反三地处理未见过的新物品和任务。
人工智能
计算机视觉
矢量动画技术

2025-12-17 14:51

韩国KAIST让SVG动画脱胎换骨：AI如何破解矢量图形的"语义迷宫"让静态图标活起来

韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理，解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画，生成的动画文件比传统视频小54倍，在多项评估中超越顶级竞争对手，为数字创意产业带来重大突破。
人工智能
参数效率
新型算法

2025-12-17 14:50

华为诺亚方舟实验室新突破：不加内存也能让AI变聪明的神奇方法

华为诺亚方舟实验室提出VersatileFFN创新架构，通过模仿人类双重思维模式，设计了宽度和深度两条并行通道，在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算，实现了参数重用和自适应计算分配，为解决AI模型内存成本高、部署难的问题提供了全新思路。