作者;微软全球执行副总裁,微软人工智能及微软研究事业部负责人 沈向洋
上周五,我有幸在美国华盛顿大学计算机科学与工程学院的年度毕业典礼致辞。在这样一个特殊的日子里,能和这群才华横溢的年轻人及其亲友一起庆祝,我深感荣幸。
华盛顿大学计算机科学与工程学院毕业典礼——微软全球执行副总裁,微软人工智能及微软研究事业部负责人沈向洋博士与Ed Lazowska教授的合影
我认为,在计算机领域,没有任何一个时代比现在更具有魔力。我成长于上世纪60年代的中国,那是一个技术突飞猛进的时代——人类进入太空、卫星发射、超音速飞机试飞。那时,虽然计算机才刚出现,但却已经成为许多重大突破的核心。
那时,我的父亲,一个高中数学教师,像大多数中国人一样,从来没见过计算机。但他们都听说过计算机,也知道它会很“大”,有可能会改变这个世界。父亲鼓励我在这个全新的领域里求学。我很幸运能来美国继续我的学业。
我们那一代的学生对人工智能非常着迷,致力于计算机视觉、语音识别和机器人科学等领域的研究。但当90年代,我从卡内基梅隆大学获得博士学位时,人工智能相关专业的毕业生却找不到好工作,因为那时人工智能还只是一个愿景。
然而,随着大数据、大规模计算能力以及先进机器学习的融合,现在的计算机科学毕业生,也许比其他专业的毕业生,更有机会加速创新,让我们的世界变得更美好。
所以我决定分享从量子计算、人工智能和混合现实三种技术中总结出的三种人生经验。
在微软,我们15年来在量子计算的研发中投入了很多。我们与全球顶级的技术人才一同提出了一种名为拓扑量子计算的方法。尽管我们做了很多努力,但目前我们还没有研发出第一个拓扑量子位。
但我坚信,我们一定会成功。除了物理学,我们可以从研究量子计算中学到很多。对我来说,它教给我的最重要的人生一课——当你在未知领域进行探索和发现时,要学会拥抱未知。
即使是这个时代最聪明的人也无法预测未来之路。1943年,伟大的IBM首席执行官Thomas J. Watson曾说过一句名言: “我认为,世界仅需要五台计算机。” 没有人真正知道未来会是什么样。所以你必须以开放心态,来调整自身,以最好的状态来迎接未来的未知和意外。
每当谈到人工智能,很多人会担心失业或人类被机器人取代。而我最担心的则是人工智能存在偏见。我们必须建立能够在我们这一多样化的世界中平等地倾听所有人的声音、识别所有的面孔的人工智能系统,从而为每个人创造最美好的未来。
但是,通过我们的数据集和数据模型,人工智能反映出的,是我们,作为一个社会,我们是有偏见的。那么,我们如何编写程序,来确保计算机不会承继或放大我们的缺点呢?这是一个超越技术本身、也不是单纯可以靠技术来解决的难题。
一切都要从我们人类自身开始:我们需要拓宽自己的视野,学会欣赏彼此间的差异。艾萨克·牛顿爵士曾说过:“我们造的墙太多,而桥太少。”
作为一个在两个国家成长,并领导跨国团队的人,我目睹了多样化团队如何取得最出色的成就。
所以,追求那些可以让你体验不同文化、扩展视野的工作。保持开放的心态,行万里路,不断向他人学习。最终,你能学会更好地思考。你也能够为每一个人创造、发明更好的东西。
有些读者可能已经用过微软的HoloLens混合现实。HoloLens是我最喜欢的产品之一,因为它代表了我所相信的计算机科学未来的多学科化——涵盖软件、硬件、芯片、光学、视觉、图形,以及更多。
但HoloLens给我们的人生启迪远不仅限于科技。HoloLens的宣传语总结得很好——当你改变你看待世界的方式时,你就改变了你所看到的世界。
我引用了这样一段给人启迪的话,来结束我的毕业典礼致辞:
“愿你得到启迪,以不同的视角去看待生活、追求新事物。
愿你得到启迪,追随自己的梦想,到未知的领域。
愿你得到启迪,探索你以为不可能中的可能。
想象力是我们唯一的束缚。”
我已经迫不及待地想看到这一代才华横溢的年轻人为我们的世界做出的贡献。致所有的2018届毕业生——祝贺你们,请记住:未来将由你们来创造。
华盛顿大学计算机科学与工程学院毕业典礼
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。