微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

谢尔盖·布林现身“开放麦”：谈Gemini、AGI的边界，以及那些他无法回答的“大问题”

GoogleGemini大模型谢尔盖·布林Sergey Brin播客AGI

谢尔盖·布林现身“开放麦”：谈Gemini、AGI的边界，以及那些他无法回答的“大问题”

作者：周雅

2026-06-09 15:34

分享至：

在硅谷的一场小型聚会AGI House上，Google联合创始人Sergey Brin（谢尔盖·布林）罕见地走出办公室，面对一群华人创业者和工程师，进行了一场近30分钟的非预设的Q&A，观众直接提问，Brin现场作答。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2026-06-09 15:34 • 周雅

作者｜Yara

这是Brin时隔近两年再次出现在AGI House。上一次是2024年初，那时的Gemini还处在风口浪尖之外，Google在AI竞赛中显得有些被动。两年后，Brin以一种几乎不加修饰的姿态回到现场，没有PPT，没有预设议题，把麦克风直接交给了观众。Brin自己说，这两年他一直在Google内部埋头做AI，"基本上没有时间做社交拜访"。

AGI House是硅谷AI创业社区最有辨识度的据点之一，2023年由Rocky Yu在加州Hillsborough一栋价值6800万美元的豪宅中创立，前身是Andrej Karpathy发起的科技社群NeoGenesis。这里每周举办演讲、黑客马拉松和社交活动，来过的人包括Eric Schmidt、OpenAI和Anthropic的创始人。

01/"我们大部分时间都在用AI改进AI"

开场：欢迎Brin回来，先聊聊你的近况吧。距离上次来这里差不多两年了，这期间感觉怎么样？

Sergey Brin：我得先说明一下，外界把我个人对Gemini势头的作用说得有点夸张了。Gemini背后是一整个团队，一旦达到某个临界点，势头起来之后就一发不可收拾，整个过程真的非常震撼。说实话，谁会不想去推动智能的边界呢？这是历史上、也是科学史上独一无二的时刻。

这两年我大部分时间都待在办公室埋头苦干，AI领域节奏太快了，基本没什么时间出来做社交活动。

02/AI for Science 的下一步

问：Google在"AI for Science"方面一直雄心勃勃，下一步的大动作是什么？

Sergey Brin：我们历史上做过的事情五花八门，从管核聚变反应堆，到用AlphaFold做蛋白质折叠等等。

让我兴奋的是，这些原本五花八门的方向，现在正在「收敛」到同一类通用模型上。过去我们必须为每个任务做专门的模型，蛋白质折叠现在确实还是用专门模型，但越来越多地，我们主流的Gemini大模型，已经能在数学等科学问题上达到顶尖水平。

这种「收敛」，说实话是我一开始没料到的，但看着它发生真的很神奇。背后其实是「迁移」这个概念在起作用：你训练模型写代码，居然能帮它提升数学推理；反过来也成立。多模态也是同样的道理，训练模型处理图像，能让它在思考几何题这类问题上变得更强。

03/AGI 之后的世界

问：智能问题被攻克之后，下一波基础设施会是什么样的？
Sergey Brin：哇，这是个好问题。AGI之后是什么？现在大家都在拼命加速AI本身的发展。

回头看，我们最早有了网页和互联网搜索，后来经历了移动互联网这一波大爆发，现在AI是新的产业浪潮。再之后是什么？说实话，如果你能回答这个问题，你就能办一家了不起的公司了。

04/怎么定义超级智能

问：你是理论计算机科学出身，怎么看P=NP这类问题？是不是能解决NP完全问题，就算超级智能了？
Sergey Brin：我觉得这是个挺特别的观点。大多数计算机科学家其实倾向于认为P不等于NP。

如果这件事在数学上就是不可能的，不管AI再聪明，它也办不到。有人尝试用量子计算机来对付这类难题，但即使量子计算机能分解大整数，也不代表它就能搞定NP完全问题。

我觉得业界对超级智能的共识就是"比人类更聪明"，而不是"能解决NP完全问题"。

05/传统工业怎么用上前沿AI

问：我来自重工业，比如汽车和航空航天。这些还在用老旧流程的行业，怎么才能用上今天的前沿AI能力？

Sergey Brin：我越来越多地看到大公司在向AI前沿靠拢，但通常不是动用核心主力团队，而是在边缘做尝试，比如"我们能不能试试用大模型来设计一辆车、一架飞机？"

这些实验我不确定有没有完全开花结果，但他们肯定会继续尝试下去。另外，很多公司也会把日常那些枯燥的行政流程自动化掉，这非常常见。

但对于真正的核心产品，比如需要机械工程的东西，这些目前还停留在实验阶段。不过他们百分之百都在试。

06/人怎么跟上 AI 的速度

问：模型的能力涨得太快，我自己都觉得跟不上。人和模型之间的「带宽」怎么提升？
Sergey Brin：这问题问得非常好。我自己也常常困惑：到底该用什么层次去给模型下指令？

你可以非常具体，比如"帮我调试这段代码"；也可以更抽象，比如"帮我写一个更好的神经网络训练算法"；甚至可以更高层次，"我今天该做什么？"或者干脆"你做点有用的事吧"。

模型越来越聪明，理论上能处理越来越宽泛的任务，但很难跟上它实际能干什么。即便是我们自己做Gemini的人，也不完全清楚它的能力边界在哪。经常会有人提出一个看起来特别直白的需求，结果它居然真的做出来了。

「思维链」就是个典型例子。几年前有人发现，只要在问题前面加一句"让我们一步一步地思考"，模型表现就大幅提升。这听起来傻得不行，这种话怎么可能有用？但它真的有用，还推动了AI能力的一次大跃迁。

所以我想说的是，连最基本的文本交互方式都在快速演变，跟上节奏确实难，我也没有什么神奇的解药。当然，市面上有专门研究和优化提示词的人。

至于人和模型之间的带宽，显然语音和视频已经是高带宽的方式了。有些公司，比如Neuralink，在尝试做脑机接口。就我个人而言，凭今天这些模型的水平，我还不会为了它去改造我的生物身体，我会等技术成熟很多以后再说。

不过我觉得，今天的模型在帮你做通用、有用的事情上已经越来越聪明了。你不一定要用更高的带宽去跟它沟通，而它输出的带宽自然就高了，它能直接给你生成视频、图片之类的东西。

07/实体图谱有戏吗

问：我们在做一个开源的实体图谱，把世界信息按实体（公司、人、地点等）来组织和连接，而不是按URL和文档。你怎么看这个方向？

Sergey Brin：这让我想起Xanadu，我说这个词是不是暴露年龄了？（场下三个人认出来）

说实话，我的第一反应是，你在逆流而上。但逆流而上没什么不好。

如果我们20年前坐在这里聊，那时候人人都在搞知识图谱，反倒是搞神经网络的人才是怪人，大家会说"你不知道吗？那玩意儿五十年代就试过，根本不行"。结果神经网络后来一路走到今天，所有人都在搞神经网络，反而没人搞图谱了，除了你。

所以你押的是冷门赔率，但冷门有时候真的能赢。祝你好运。

08/超级智能时代，人还能做什么

问：超级智能之后，哪些事情还只有人能做？另外，Google未来20年的角色是什么？

Sergey Brin：问题不大嘛，全人类的角色 + Google未来20年......

智能的定义一直都在变。机器能做什么、人能做什么，这条线一直在挪。很长一段时间里，国际象棋就是"智能"的代名词。然后90年代深蓝击败了卡斯帕罗夫。

但有意思的是，人们并没有因此就不下棋了。

Sergey Brin：在场有多少人知道现在世界排名第一的人类棋手是谁？我猜是马格努斯·卡尔森（Magnus Carlsen）吧。

Sergey Brin：那有多少人知道排名第一的AI象棋程序是哪个？（场下有人说Stockfish）

Sergey Brin：你不觉得AlphaZero能赢Stockfish吗？（场下："Stockfish吸收了AlphaZero的很多东西"）

Sergey Brin：哦，被吸收了，行吧。

我想说的是：电脑能把这些事做好，并没有阻止人类在这些事上做得越来越好、获得越来越多的认可，也越来越享受这些事情本身。

我们的看法也在调整。一开始觉得"国际象棋是智能"，后来变成"围棋是智能"，再后来是诗歌、绘画……我觉得AI能做出很多让人惊讶的事，但它也会反过来帮助人类做得更好。

顺便说，AlphaGo之后，围棋这门技艺本身水平大幅提升了，跟AlphaGo下过棋的李世石、柯洁，他们的棋力都明显涨了，整个围棋水平的天花板被推高了。所以即使有AI协助，人们仍然能享受、并做好很多事情。

至于Google未来20年，这问题太大了，我们还是让别人接着问吧。

09/Transformer 能走到 AGI 吗

问：你觉得Transformer架构足够通往AGI吗？

Sergey Brin：我自己问过这个问题很多次。Transformer的灵活性非常出人意料，我们现在用它处理图像、视频、文本，它已经远远超出了最初设计的能力范围。

公平地说，它一路也在变。比如稀疏专家混合（MoE）这类Transformer，很多细节都已经不是原始论文里那个样子了。

如果让我猜，"接近Transformer"的某种东西能不能成为AGI？我会说能。这只是我的猜测，因为它已经证明自己能演化出这么多东西了。但它确实在持续变化，不是论文里那个原始版本了。

10/三年后的Google

问：很多人觉得AGI一两年内就会到来，三年后的Google怎么设想？

Sergey Brin：行啊，把目标降低了。

说实话，我们现在在Gemini其实相当"向内看"，重点是用工具来打造工具本身。

我觉得这跟很多走在前沿的人是相似的，哪怕他们不是技术背景。我有个朋友，六个月前开始用OpenClaw，用它把自己生活的方方面面都自动化了，那种程度让我都印象深刻。

组织内部也一样：能不能让AI帮我们监控训练运行？能不能让AI自己生成训练数据？你开始用工具去造工具，这就是我们这段时间精力大量转移过去的方向，也是我们日常花最多时间在做的事。

11/你和 Demis、Koray 怎么分工

问：你回到Google两年了，你和Demis、Koray这些人是怎么分工的？

Sergey Brin：老实说，我有点像个"搅局者"。Demis和Koray在Gemini上负责，由于我也在Gemini投入大量精力，跟Koray相处时间很多。但真正负责交付成果的是他。

我的角色更多是去戳一戳他和团队："这件事你真的在做吗？真的吗？"不撒谎，有时候确实有点扰乱节奏。Koray才是那个组织各个小组、推动东西落地的人。我把自己的角色更多看成是提醒他们：哪些优先级被忽视了，哪些点子没受到足够重视，等等。

12/世界模型与AGI

问：你怎么看世界模型对AGI的作用？

Sergey Brin：（先打了个岔）等等，你叫Boris，怎么有法国口音？……你妹妹叫Natasha？哈哈好的，你的问题是什么来着？

哦，世界模型，基本上就是视频类的模型。

关于AGI，人们的定义其实挺宽泛。我自己倾向于把AGI理解为"AI能自我改进"。但另一种说法是，AGI意味着AI能做任何人能做的事，可能这种说法更对。这是两件不同的事。

要做"人能做的任何事"，你绝对需要能理解并跟物理世界互动。所以你得能"想象"，如果我做了某件事，这个世界会怎么变化？你得能理解这种因果。

所以是的，如果目标是把所有事都包圆，包括延伸到机器人这类应用，那世界模型就是关键。

你们玩我们Gemini Omni模型的时间可能比我还多，因为我现在深陷在自我改进那一摊事里。但Omni方向我们已经做了很久，它是最新版本。Omni还有个酷的地方：它的训练方式跟Gemini完全一样，文本和其他所有东西一起喂进去训练。这些不同模态最后能收敛到一起，真的挺神奇的。但是的，要让AI能跟物理世界互动，这种能力是必须的。

13/现在还有当年那种信心吗

问：三年前你说过"Google是家大公司，做这件事已经很久了"，让我感觉到你那时就有信心带它回来。今天编程智能体这么火，其他前沿实验室在自我改进上也有进展，你现在还有同样的信心吗？

Sergey Brin：好问题。整体来说，我感觉非常好。

如果我每个月都去测一次"温度"，每次有别家发布新模型就说"完了完了"，那我可能很快就崩溃了。但其实你看长一点，局势是来回反复的。我对Gemini目前的位置感觉相当不错。

我知道现在大家都聚焦在编程上，我们在这个方向上深入得稍微晚了一点。大约六个月前发布的Gemini 3.0和3.1，当时是全方位领先的。但之后其他实验室确实进步明显，特别是在编程方面。

你天天观察会发现：前几个月大家都对Opus特别兴奋，但要论"深度编程"，我现在会把这一项的优势给到GPT 5.5。

不过我也得给你们安利一下Gemini 3.5 Flash，速度快得多。速度这件事在很多场景下也很重要。我要肯定一下竞争对手，如果你想丢一个任务让它跑一整夜，GPT 5.5看起来表现非常出色。但如果是要交互式快速迭代，我们就上Gemini 3.5 Flash。后面也会有更多很棒的模型出来。

事后看，我们大概应该早一点专注在代码上。但我得说清楚，我们现在非常专注于代码。

（全场鼓掌结束）

GoogleGemini大模型谢尔盖·布林Sergey Brin播客AGI

分享至