微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 谢尔盖·布林现身“开放麦”:谈Gemini、AGI的边界,以及那些他无法回答的“大问题”

谢尔盖·布林现身“开放麦”:谈Gemini、AGI的边界,以及那些他无法回答的“大问题”

2026-06-09 15:34
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2026-06-09 15:34 周雅

作者|Yara

在硅谷的一场小型聚会AGI House上,Google联合创始人Sergey Brin(谢尔盖·布林)罕见地走出办公室,面对一群华人创业者和工程师,进行了一场近30分钟的非预设的Q&A,观众直接提问,Brin现场作答。

这是Brin时隔近两年再次出现在AGI House。上一次是2024年初,那时的Gemini还处在风口浪尖之外,Google在AI竞赛中显得有些被动。两年后,Brin以一种几乎不加修饰的姿态回到现场,没有PPT,没有预设议题,把麦克风直接交给了观众。Brin自己说,这两年他一直在Google内部埋头做AI,"基本上没有时间做社交拜访"。

AGI House是硅谷AI创业社区最有辨识度的据点之一,2023年由Rocky Yu在加州Hillsborough一栋价值6800万美元的豪宅中创立,前身是Andrej Karpathy发起的科技社群NeoGenesis。这里每周举办演讲、黑客马拉松和社交活动,来过的人包括Eric Schmidt、OpenAI和Anthropic的创始人。

谢尔盖·布林现身“开放麦”:谈Gemini、AGI的边界,以及那些他无法回答的“大问题”

01/"我们大部分时间都在用AI改进AI"

开场:欢迎Brin回来,先聊聊你的近况吧。距离上次来这里差不多两年了,这期间感觉怎么样?

Sergey Brin:我得先说明一下,外界把我个人对Gemini势头的作用说得有点夸张了。Gemini背后是一整个团队,一旦达到某个临界点,势头起来之后就一发不可收拾,整个过程真的非常震撼。说实话,谁会不想去推动智能的边界呢?这是历史上、也是科学史上独一无二的时刻。

这两年我大部分时间都待在办公室埋头苦干,AI领域节奏太快了,基本没什么时间出来做社交活动。

02/AI for Science 的下一步

问:Google在"AI for Science"方面一直雄心勃勃,下一步的大动作是什么?

Sergey Brin:我们历史上做过的事情五花八门,从管核聚变反应堆,到用AlphaFold做蛋白质折叠等等。

让我兴奋的是,这些原本五花八门的方向,现在正在「收敛」到同一类通用模型上。过去我们必须为每个任务做专门的模型,蛋白质折叠现在确实还是用专门模型,但越来越多地,我们主流的Gemini大模型,已经能在数学等科学问题上达到顶尖水平。

这种「收敛」,说实话是我一开始没料到的,但看着它发生真的很神奇。背后其实是「迁移」这个概念在起作用:你训练模型写代码,居然能帮它提升数学推理;反过来也成立。多模态也是同样的道理,训练模型处理图像,能让它在思考几何题这类问题上变得更强。

03/AGI 之后的世界

问:智能问题被攻克之后,下一波基础设施会是什么样的?
Sergey Brin:哇,这是个好问题。AGI之后是什么?现在大家都在拼命加速AI本身的发展。

回头看,我们最早有了网页和互联网搜索,后来经历了移动互联网这一波大爆发,现在AI是新的产业浪潮。再之后是什么?说实话,如果你能回答这个问题,你就能办一家了不起的公司了。

04/怎么定义超级智能

问:你是理论计算机科学出身,怎么看P=NP这类问题?是不是能解决NP完全问题,就算超级智能了?
Sergey Brin:我觉得这是个挺特别的观点。大多数计算机科学家其实倾向于认为P不等于NP。

如果这件事在数学上就是不可能的,不管AI再聪明,它也办不到。有人尝试用量子计算机来对付这类难题,但即使量子计算机能分解大整数,也不代表它就能搞定NP完全问题。

我觉得业界对超级智能的共识就是"比人类更聪明",而不是"能解决NP完全问题"。

05/传统工业怎么用上前沿AI

问:我来自重工业,比如汽车和航空航天。这些还在用老旧流程的行业,怎么才能用上今天的前沿AI能力?

Sergey Brin:我越来越多地看到大公司在向AI前沿靠拢,但通常不是动用核心主力团队,而是在边缘做尝试,比如"我们能不能试试用大模型来设计一辆车、一架飞机?"

这些实验我不确定有没有完全开花结果,但他们肯定会继续尝试下去。另外,很多公司也会把日常那些枯燥的行政流程自动化掉,这非常常见。

但对于真正的核心产品,比如需要机械工程的东西,这些目前还停留在实验阶段。不过他们百分之百都在试。

06/人怎么跟上 AI 的速度

问:模型的能力涨得太快,我自己都觉得跟不上。人和模型之间的「带宽」怎么提升?
Sergey Brin:这问题问得非常好。我自己也常常困惑:到底该用什么层次去给模型下指令?

你可以非常具体,比如"帮我调试这段代码";也可以更抽象,比如"帮我写一个更好的神经网络训练算法";甚至可以更高层次,"我今天该做什么?"或者干脆"你做点有用的事吧"。

模型越来越聪明,理论上能处理越来越宽泛的任务,但很难跟上它实际能干什么。即便是我们自己做Gemini的人,也不完全清楚它的能力边界在哪。经常会有人提出一个看起来特别直白的需求,结果它居然真的做出来了。

「思维链」就是个典型例子。几年前有人发现,只要在问题前面加一句"让我们一步一步地思考",模型表现就大幅提升。这听起来傻得不行,这种话怎么可能有用?但它真的有用,还推动了AI能力的一次大跃迁。

所以我想说的是,连最基本的文本交互方式都在快速演变,跟上节奏确实难,我也没有什么神奇的解药。当然,市面上有专门研究和优化提示词的人。

至于人和模型之间的带宽,显然语音和视频已经是高带宽的方式了。有些公司,比如Neuralink,在尝试做脑机接口。就我个人而言,凭今天这些模型的水平,我还不会为了它去改造我的生物身体,我会等技术成熟很多以后再说。

不过我觉得,今天的模型在帮你做通用、有用的事情上已经越来越聪明了。你不一定要用更高的带宽去跟它沟通,而它输出的带宽自然就高了,它能直接给你生成视频、图片之类的东西。

07/实体图谱有戏吗

问:我们在做一个开源的实体图谱,把世界信息按实体(公司、人、地点等)来组织和连接,而不是按URL和文档。你怎么看这个方向?

Sergey Brin:这让我想起Xanadu,我说这个词是不是暴露年龄了?(场下三个人认出来)

说实话,我的第一反应是,你在逆流而上。但逆流而上没什么不好。

如果我们20年前坐在这里聊,那时候人人都在搞知识图谱,反倒是搞神经网络的人才是怪人,大家会说"你不知道吗?那玩意儿五十年代就试过,根本不行"。结果神经网络后来一路走到今天,所有人都在搞神经网络,反而没人搞图谱了,除了你。

所以你押的是冷门赔率,但冷门有时候真的能赢。祝你好运。

08/超级智能时代,人还能做什么

问:超级智能之后,哪些事情还只有人能做?另外,Google未来20年的角色是什么?

Sergey Brin:问题不大嘛,全人类的角色 + Google未来20年......

智能的定义一直都在变。机器能做什么、人能做什么,这条线一直在挪。很长一段时间里,国际象棋就是"智能"的代名词。然后90年代深蓝击败了卡斯帕罗夫。

但有意思的是,人们并没有因此就不下棋了。

Sergey Brin:在场有多少人知道现在世界排名第一的人类棋手是谁?我猜是马格努斯·卡尔森(Magnus Carlsen)吧。

Sergey Brin:那有多少人知道排名第一的AI象棋程序是哪个?(场下有人说Stockfish)

Sergey Brin:你不觉得AlphaZero能赢Stockfish吗?(场下:"Stockfish吸收了AlphaZero的很多东西")

Sergey Brin:哦,被吸收了,行吧。

我想说的是:电脑能把这些事做好,并没有阻止人类在这些事上做得越来越好、获得越来越多的认可,也越来越享受这些事情本身。

我们的看法也在调整。一开始觉得"国际象棋是智能",后来变成"围棋是智能",再后来是诗歌、绘画……我觉得AI能做出很多让人惊讶的事,但它也会反过来帮助人类做得更好。

顺便说,AlphaGo之后,围棋这门技艺本身水平大幅提升了,跟AlphaGo下过棋的李世石、柯洁,他们的棋力都明显涨了,整个围棋水平的天花板被推高了。所以即使有AI协助,人们仍然能享受、并做好很多事情。

至于Google未来20年,这问题太大了,我们还是让别人接着问吧。

09/Transformer 能走到 AGI 吗

问:你觉得Transformer架构足够通往AGI吗?

Sergey Brin:我自己问过这个问题很多次。Transformer的灵活性非常出人意料,我们现在用它处理图像、视频、文本,它已经远远超出了最初设计的能力范围。

公平地说,它一路也在变。比如稀疏专家混合(MoE)这类Transformer,很多细节都已经不是原始论文里那个样子了。

如果让我猜,"接近Transformer"的某种东西能不能成为AGI?我会说能。这只是我的猜测,因为它已经证明自己能演化出这么多东西了。但它确实在持续变化,不是论文里那个原始版本了。

10/三年后的Google

问:很多人觉得AGI一两年内就会到来,三年后的Google怎么设想?

Sergey Brin:行啊,把目标降低了。

说实话,我们现在在Gemini其实相当"向内看",重点是用工具来打造工具本身。

我觉得这跟很多走在前沿的人是相似的,哪怕他们不是技术背景。我有个朋友,六个月前开始用OpenClaw,用它把自己生活的方方面面都自动化了,那种程度让我都印象深刻。

组织内部也一样:能不能让AI帮我们监控训练运行?能不能让AI自己生成训练数据?你开始用工具去造工具,这就是我们这段时间精力大量转移过去的方向,也是我们日常花最多时间在做的事。

11/你和 Demis、Koray 怎么分工

问:你回到Google两年了,你和Demis、Koray这些人是怎么分工的?

Sergey Brin:老实说,我有点像个"搅局者"。Demis和Koray在Gemini上负责,由于我也在Gemini投入大量精力,跟Koray相处时间很多。但真正负责交付成果的是他。

我的角色更多是去戳一戳他和团队:"这件事你真的在做吗?真的吗?"不撒谎,有时候确实有点扰乱节奏。Koray才是那个组织各个小组、推动东西落地的人。我把自己的角色更多看成是提醒他们:哪些优先级被忽视了,哪些点子没受到足够重视,等等。

12/世界模型与AGI

问:你怎么看世界模型对AGI的作用?

Sergey Brin:(先打了个岔)等等,你叫Boris,怎么有法国口音?……你妹妹叫Natasha?哈哈好的,你的问题是什么来着?

哦,世界模型,基本上就是视频类的模型。

关于AGI,人们的定义其实挺宽泛。我自己倾向于把AGI理解为"AI能自我改进"。但另一种说法是,AGI意味着AI能做任何人能做的事,可能这种说法更对。这是两件不同的事。

要做"人能做的任何事",你绝对需要能理解并跟物理世界互动。所以你得能"想象",如果我做了某件事,这个世界会怎么变化?你得能理解这种因果。

所以是的,如果目标是把所有事都包圆,包括延伸到机器人这类应用,那世界模型就是关键。

你们玩我们Gemini Omni模型的时间可能比我还多,因为我现在深陷在自我改进那一摊事里。但Omni方向我们已经做了很久,它是最新版本。Omni还有个酷的地方:它的训练方式跟Gemini完全一样,文本和其他所有东西一起喂进去训练。这些不同模态最后能收敛到一起,真的挺神奇的。但是的,要让AI能跟物理世界互动,这种能力是必须的。

13/现在还有当年那种信心吗

问:三年前你说过"Google是家大公司,做这件事已经很久了",让我感觉到你那时就有信心带它回来。今天编程智能体这么火,其他前沿实验室在自我改进上也有进展,你现在还有同样的信心吗?

Sergey Brin:好问题。整体来说,我感觉非常好。

如果我每个月都去测一次"温度",每次有别家发布新模型就说"完了完了",那我可能很快就崩溃了。但其实你看长一点,局势是来回反复的。我对Gemini目前的位置感觉相当不错。

我知道现在大家都聚焦在编程上,我们在这个方向上深入得稍微晚了一点。大约六个月前发布的Gemini 3.0和3.1,当时是全方位领先的。但之后其他实验室确实进步明显,特别是在编程方面。

你天天观察会发现:前几个月大家都对Opus特别兴奋,但要论"深度编程",我现在会把这一项的优势给到GPT 5.5。

不过我也得给你们安利一下Gemini 3.5 Flash,速度快得多。速度这件事在很多场景下也很重要。我要肯定一下竞争对手,如果你想丢一个任务让它跑一整夜,GPT 5.5看起来表现非常出色。但如果是要交互式快速迭代,我们就上Gemini 3.5 Flash。后面也会有更多很棒的模型出来。

事后看,我们大概应该早一点专注在代码上。但我得说清楚,我们现在非常专注于代码。

(全场鼓掌结束)

分享至
0赞

好文章,需要你的鼓励

周雅

Miranda
关注科技创新、技术投资。以文会友,左手硬核科技,右手浪漫主义。
推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-