微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 谷歌I/O全球记者会:我们不是一家广告公司,搜索的本质是内容质量,AI时代也如此

谷歌I/O全球记者会:我们不是一家广告公司,搜索的本质是内容质量,AI时代也如此

2025-05-28 10:54
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-05-28 10:54 周雅

作者|周雅

按照惯例,在I/O的第二天,谷歌会组织一场针对全球媒体的小范围群访。今年也一样,包括Alphabet兼谷歌CEO桑达尔·皮查伊(Sundar Pichai)在内的三位核心管理层,在采访中讨论了AI产品的策略、市场竞争、Gemini的进化、搜索的变革、智能眼镜的复活、AGI的未来等约20个问题。科技行者Techwalker连续第二年参与此类群访。

谷歌I/O全球记者会:我们不是一家广告公司,搜索的本质是内容质量,AI时代也如此

从左到右依次为:Alphabet兼谷歌CEO桑达尔·皮查伊(Sundar Pichai)、谷歌搜索副总裁Liz(伊丽莎白·哈蒙·里德,Elizabeth Hamon Reid)、Google Deepmind首席技术官科雷·卡夫丘格鲁(Koray Kavukcuoglu)

今年是Pichai加入谷歌的十周年。他于2004年以项目经理的身份加入谷歌,于2015年出任谷歌CEO,到今年刚好是第十年。

“谷歌最吸引我的地方之一,正如创始人在公开信中所写——我们将采取深度技术的手段来推动人们生活的进步。”Pichai在采访中指出:“我放弃了我的博士学业,谷歌让我能够将一部分(对科研的)热情投入到实践中,并且能够持续接近研究前沿。这是我工作中最好的部分之一。”

谷歌I/O全球记者会:我们不是一家广告公司,搜索的本质是内容质量,AI时代也如此

采访中,当被问到关于“AI优化广告可能带来的隐忧”问题时,Pichai首先澄清,谷歌远不止是一家广告公司,而是全球第三大企业软件公司,拥有Waymo、Android、Google Play、YouTube(包含订阅和广告)、AI订阅软件等多元化业务。

在广告业务方面,他强调谷歌对待广告与对待搜索产品一样,都以质量为核心原则。“我们不应低估经济体中人们对商业信息的需求,以及企业触达这些用户的需求。连接这两者是一项有价值的服务。我们正是从这个第一性原理出发来对待广告业务。”他认为,AI在某些情况下会帮助广告更贴近用户需求,而如果出现偏差,谷歌的各项指标会反映出来。

面对“反垄断和生态系统”的问题,Pichai表示,谷歌生态非常强大,有超过2000家公司是由前谷歌员工创立的,谷歌也通过风险投资部门投资了许多公司,并提供了像Transformer这样的开源技术,极大地促进了外部创新。

“我们从一个充满活力和动态的初创企业生态系统中受益,我们也希望积极回馈这个生态系统。这就是为什么我们不只为自己构建AI技术,外部开发者也能接触到与我们内部(如搜索团队)使用的相同的AI模型。并非所有公司都能做到这一点。我们也向外部提供TPU,如果他们想用这种方式训练自己的模型。”

Pichai最后总结道:“谷歌一直以一种创新的、促进竞争的方式来发展,我们将凭借自身的实力赢得成功。”

以下是采访全录(为便于读者理解,文字经过适当编辑):

【01】创新驱动力:科研与产品的双向奔赴

(来自印度)我们身处一个“AI优先”的世界,但看向未来,你认为是由研究来定义谷歌产品和应用的方向,还是由企业和消费者日常所需的产品和应用,来反过来指导未来AI研究的走向?

桑达尔:我们反复强调的一个主题是“从科研到现实”(From Research to Reality)。在谷歌,我们很自豪的一点就是坚持这种长远眼光。我们正处在一个AI这项横向技术(horizontal technology)能够应用于一切领域的时代,我们秉持前瞻的视角,进行相应的投资。有些想法可以迅速融入产品,有些则需要时间沉淀。我感到自豪的是,我们在 Google DeepMind 和 Google Research 所研究的深度和广度,以及我们正在定义研究方向。

例如,昨天(指I/O主题演讲)大家可能没有特别注意到,但我们谈到了文本扩散(text distribution)技术。在这些领域,我们正在以一种全新方式推动扩散技术的前沿发展。未来,在时机成熟时(比如延迟等问题得到妥善解决),将这些技术以有趣的方式引入产品,是顺理成章的。

再比如公司的其他领域,像量子计算,或者像Waymo自动驾驶,从研究到产品的转化过程,我认为这都很重要。

但另一方面,将技术交到用户手中,让他们给我们反馈,也同样重要。类似Project Astra这样的项目,会被长期作为研究项目进行开发。但将它引入Gemini Live,观察真实用户的使用情况,则能让我们快速迭代。所以我认为,所有这些共同构成了一个良好的反馈闭环。

因此,我们既致力于推动基础研究,又会非常积极地将成果交到用户手中,并在此基础上进行整合。

问(来自中国):我有一个问题给这位任职十年的CEO。您在主题演讲中的主题是“从研究到现实”,这也发生在搜索上,这也正发生在今天的Gemini和AI上。所以在谷歌内部,如何看待搜索的故事与当今AI之间的相似之处?以及您从中吸取了哪些经验教训,来帮助您在这场AI竞争中取胜?

桑达尔:这是个很棒的问题。我可以用它来帮助我写明年的I/O主题演讲稿了,你总结得非常好。

谷歌最吸引我的地方之一,正如创始人在公开信中所写——我们将采取深度技术的手段来推动人们生活的进步。

我们在十年前就投资了TPU,我们在过去十年里一直在投资量子计算,并期待它成为现实。如果你看到三年前的Waymo,人们对它持悲观态度,但我们却在那时增加了对Waymo的投资。我们始终采取一种基础性的、深度的研究科学和技术的方法,坚持将其带给尽可能多的人。

这正是我当年选择加入谷歌的原因。我放弃了我的博士学业,我退出了我的博士项目,谷歌让我能够将一部分(对科研的)热情投入到实践中,并且能够持续接近研究前沿。这是我工作中最好的部分之一。

【02】订阅模式的未来:AI服务将如何平衡普惠与商业化?

问(来自韩国):关于谷歌订阅服务。谷歌几年前开始披露订阅收入,我了解到它刚刚突破了100亿美元。现在谷歌有越来越多的订阅服务,包括Google AI Ultra,每月249.99 美元,很贵。这些新服务的潜在客户是谁?未来谷歌的订阅服务会是什么样子?现在广告收入远大于订阅收入,未来广告与订阅的比例是怎样?

桑达尔:我们还有Google One和YouTube的订阅服务,我们为企业提供服务的经典业务也已经有了强劲增长。我们的使命是以一种普遍可及的方式提供服务,所以,广告模式使我们能够将其广泛提供给世界每一个人。

但像AI这样的前沿技术,在任何特定时间点,其投资、开发和服务的成本都非常高昂。我们正不断努力,一部分尖端功能会通过Ultra这样的订阅服务提供,但同时,我们也在极其努力地让技术更加普惠,并将其带给尽可能多的人。

以Gemini 2.5为例,科雷的团队一直在开发Pro模型、Flash模型、以及Nano模型,覆盖了从高端到轻量级的整个范围,并努力让更多人能用上。但像Pro DeepThink或Veo 3这样的模型,确实成本高昂,但我们仍然希望将其交到用户手中。

但我认为,这里面存在价值。如果你是一名软件开发者,并且你能够使用像Jules这样的工具,它能让你提高10%的生产力,这对公司和个人都会产生巨大价值。

科雷:没错,我们正在开发所有这些技术,在迈向AGI的过程中,我们不断推动技术前沿。正如你所说,我们更好地理解世界,所有这些类型的模型,我们都希望将最前沿的模型提供给人们去实验,并赋能他们。

这对我们获取反馈将产生更大的影响,如果高级用户能够真正用上这些模型和技术进行实验,我们就能得到反馈。然后,希望我们也能赋能他们,让他们能够用上现有最好的技术进行实验。

桑达尔:Project Astra就是一个很好的例子。它通过Gemini惠及每一个人,所以大家会看到我们持续这样做。如果我们去年就有像Google AI Ultra这样的服务,我们会更快地推出Astra。所以,订阅计划在某种程度上,也让我们能更早部署产品,并将其交到用户手中。

以YouTube为例,YouTube来自订阅的收入份额一直在增长。所以我完全相信,数字服务对人们来说越来越有价值,人们看到了价值,而且那些为此付费的人(也认可其价值)。谢谢。

问:谷歌的收入来自广告,AI可以优化效率。从我作为用户的角度来看,谷歌现在有能力优化广告的效率,这可能会被用户体验为纯粹的操控。这是一种可能性。我想问,谷歌在为其付费客户优化广告方面,是否存在任何限制?免费和付费层级之间是否存在差异?

如果可以的话,还有另一个问题。从过去几天的新闻来看,特别是在反垄断的视角和背景下,我们都对大量新的、和即将出现的技术和服务感到震惊,其中许多将与我们都熟悉的初创公司竞争。从反垄断的角度来看,未来几年谷歌将如何应对?

桑达尔:首先,谷歌远不止是一家广告公司,我们可能是全球第三大企业软件公司,这一点人们可能不知道。我们拥有Waymo、Android、Google Play、YouTube(包含订阅和广告)、AI订阅软件等多元化业务,我们在这方面业务非常广泛。

但在广告方面,我们对待广告与对待我们的搜索产品一样,都以质量为关注焦点。这是基本原则。

我们不应低估在一个经济体中,人们寻找商业信息的需求、以及企业试图触达这些用户的需求。连接这两者是一项有价值的服务。所以我们正是从这个第一性原理出发来对待广告业务,这将使我们受益。

AI,在某些情况下,将帮助我们使广告更贴近人们的需求。但如果我们做错了,我们所有的指标都会显示出来。当你从第一性原理出发设定指标时,它会为你指明方向,以便你针对问题进行正确的优化。

关于反垄断和解决方案。我们这里有一个如此强大的生态系统,谷歌员工离开后创办了超过2000家公司,我们通过风险投资部门投资了许多公司。我们提供的技术在外部创造了创新。Transformer模型就是我们在这个时刻所做贡献的一个例子。

我认为我们将从一个充满活力的初创企业生态系统中受益,我们希望积极回馈这个生态系统,这就是为什么我们不只为自己构建AI技术,外部开发者能够接触到的AI模型,与谷歌搜索团队在搜索任务中运行的AI模型是一样的。你知道,并非所有公司都能这么说。而且,我们向外部提供我们的TPU,如果他们想用这种方式训练模型的话。

所以,我们一直以一种创新的、促进竞争的方式来发展,而且我们将不得不凭借自身的实力赢得成功。这就是我所思考的一切。

【03】智能眼镜的复活:谷歌的XR新篇章

问(来自韩国):关于智能眼镜,距离你们实际上退出消费级智能眼镜市场有10多年了,现在你们又通过与其他公司合作,比如三星、Warby Parker和Gentle Monster,重新进入了这个市场。我想问,尽管你们拥有硬件制造能力,为什么还要通过合作来制造硬件?这是否反映了对上一代产品负面反馈的考量,还是你们希望与其他公司建立更深层次的合作?

桑达尔:我们绝大部分在Android上的努力,一直都是与生态系统合作。今天我们所做的一切,无论是智能手机还是其他设备,都是如此。XR在很多方面,产品、设计等,对谷歌来说,是一个复杂的产品,这就是为什么我们与三星合作,就像我们做手机一样。

但在智能眼镜方面,其设计理念是希望它能够“融入背景,不那么显眼”。对很多人来说,眼镜产品本身就是一种时尚配饰。所以,我们提供技术并,与这些眼镜品牌紧密合作。这就是我们这样做的原因。但是,我们的策略并没有改变,这始终是我们处理问题的方式。

【04】AI重塑搜索体验:用户行为将如何演变?

问(来自德国)谷歌搜索是互联网的主要支柱之一。通过AI模式(AI Mode),你们正在从根本上改变它。所以,你们正在为哪些负面后果做准备?如何确保网站仍然能获得足够的流量来维持商业模式?

桑达尔:纵观全局,我们真心认为搜索的一个宝贵定位在于,人们在搜索时,是在寻找世界上已有的信息,我们正在通过更丰富的上下文将他们与这些信息连接起来,这是核心体验。

「AI模式」也将以同样的方式处理。我们认为生态系统中存在着深厚的价值,存在着丰富性,存在着视角的多样性,我们希望将这些带给用户。

伊丽莎白是的,确保人们能够继续连接到网络,是我们看待「AI Overview(AI概览)」和「AI模式」方式的基础。我们确实花了很多时间思考,如何通过这些功能更好地呈现精彩内容。

目前,我们已经看到了一些变化。通过AI概览,人们在网站上获得的点击质量更高,这意味着人们在这些网站上花费的时间更长,当他们继续深入了解时,他们确实想要互动。我们也看到,流量正在流向更多样化的网站。我认为,特别是第二点,当然第一点也是,随着AI的发展只会增长。

长期以来的一个挑战是,当人们只使用少数几个词进行搜索时,很多网页结果都只与那几个词相关。但是AI带来了机会,人们可以更充分地表达他们真正想要的东西。这使得那些小众创作者,那些专注于某个领域的小型商家,能够真正被发现。所以我认为会有很多新的机会。

最后,我想说的是,我们通过AI概览看到,人们的搜索次数更多了,他们开始问一些更有趣的问题。我认为这将为整个网络生态创造新的机遇。

问(来自中国):我有一个关于搜索的问题。现在出现了一些新的AI搜索竞争对手,那么未来搜索竞争的主要焦点会是什么?谷歌将如何保持领先?

伊丽莎白我认为搜索的焦点始终是如何真正帮助人们获取信息,这是核心。这可以涵盖从“我需要一个快速答案”,到“我有一个非常难的问题”,再到“我需要帮助完成一项任务,比如我需要买一条裙子”,等等。

搜索有着悠久历史,总是能采纳最前沿的技术。我们使用AI,并将AI融入搜索已经很长时间了,比如通过RankBrain和BERT等技术,将搜索对高质量信息的深刻理解、对信息新鲜度的把握、以及通过知识图谱等对世界的理解相结合,所有这些融合在一起,创造出一个让人们用起来毫不费力的搜索产品,让人们可以问任何问题。我认为搜索将继续专注于此。

问(来自加拿大):我想继续讨论关于AI模式,它会如何影响那些提供信息的网站?我试用了,问了它一个问题,比如“如何制作木薯淀粉?”它告诉我制作方法。这是从某个网站获取的信息吗?那个网站是否因此获得了某些益处?然后在旁边,它向我展示了相关的文章,比如“如何制作珍珠奶茶”,它是从哪里获取这些网站信息的?它是如何找到这些网站的?

伊丽莎白是的。当AI模式工作时,它同时结合了模型的能力+搜索查询网页索引的能力,并从中提取信息,然后将所有这些整合起来,所以来自网络的信息绝对是核心。那些相关的链接,实际上也是作为输入信息的一部分。我们非常希望用户能够继续深入探索。

我不清楚珍珠奶茶这个具体的例子,但通常网站会提供多种食谱,所以很有可能那是一篇同时谈论珍珠奶茶、木薯淀粉以及其他相关内容的文章。据我们了解,人们通常会先在AI模式或AI概览中提问并开始探索,然后想要更深入地了解,他们可能先弄清楚了木薯淀粉的基本做法,但紧接着他们想要一个橙子口味的绝佳木薯淀粉食谱,他们就会继续搜索。

所以这些网站有机会进一步与用户互动,而且在很多主题上,一旦人们获得初步了解,他们就会受到启发,想要继续深入挖掘。

追问:但是,AI概览是在搜索结果出现的,而AI模式是在一个独立的区域。谷歌是否发现,人们会回到那些(原始)链接?因为我只是不断地提问,它就不断地给出答案。

伊丽莎白人们会给出各种反馈,但总体而言,作为用户,你可能会花更多时间(在AI模式中),但你同时也在培养新的兴趣,然后你会回到(传统的)搜索。如果你将会话作为一个整体来看,当我们推出精选摘要(Featured Snippets)时,人们也说过,如果你们在页面上直接给出答案(就不会有人再点击了)。

AI模式为你提供上下文,扩展你的兴趣和好奇心,让你之后会做更多研究,而当你访问那些(原始)网站时,你的意图更明确。这些都是更高质量的引荐流量,你也会在那些网站上花费更多时间。就是这样。

但自始至终,团队都在以一种专注于为生态系统回馈价值的方式来做事情,这是一个重要的原则。

【05】AGI的黎明:智能、个性化、Agent

问(来自巴西):昨天在主题演讲中,我们看到了很多AI智能体(Agentic AI)的功能,而且似乎全球范围内,AI智能体正迎来走向大众的时刻。那么,要让这些智能体最终为消费者所用,还缺少什么?这些功能又将如何让我们更接近AGI?

桑达尔:首先,这是一个激动人心的前沿领域。我们曾提到,智能(intelligence)、个性化(personalization)、智能体能力(Agent)是我们未来一年重点推进的三个前沿方向。

大家可以看到我们取得的进展。我们计划将其引入搜索、Chrome浏览器以及Gemini应用中。显然,底层技术协议的演进方式,比如谷歌的开放智能体协议Agent2Agent(A2A)和智能体多边通信协议MCP(Multi-Agent Communication Protocol)等等也在发展。

对消费者而言,这将改善用户体验,减少操作阻碍,节省他们的时间,让他们能更专注于自己最感兴趣的事情。如果你在购物,有些人喜欢浏览和花时间比较,也有些人像我一样,只想快点买到东西。所以,这将允许不同的人以他们喜欢的方式花费时间。

科雷:是的,这些智能体正变得越来越普及。比如,我们正在通过不同的提示方式使其更加可用,所以我们正在将这些能力带给不同的用户。同时,我们也在将底层技术引入到API,这样不同场景下的开发者也可以在此基础上做开发,开发出能够触达更多用户的产品。

当你退一步思考AGI时,思考智能体系统(agentic systems)——那些能够为你执行任务、提供帮助的系统——是非常基础的。为你提供帮助的最佳方式,除了回答你的问题,更重要是完成那些你真正希望得到协助的任务。所以我们正在朝这个方向努力。

这其中很大一部分也涉及到对环境的理解,理解你的本地环境,理解你的虚拟环境,比如你的桌面、你在现实生活中用的工具、你在虚拟生活中用的工具,等等。所以从这里开始的旅程,更多的是关于如何更好地理解这些上下文,这意味着它们将能够更好地用这些工具。

通过像Project Astra这样的项目,我们正在让AI理解你的本地环境。然后通过像Project Mariner这样的项目,通过智能体API,我们希望赋予AI理解你的虚拟环境和其中工具的能力,并利用它们来帮助你完成工作。

这么一来,我们离通用人工智能(AGI)更近一步,这条路也越走越宽。我们人类依赖工具来构建和扩展我们的智能,智能体也是一样,它们不仅要会用我们现在给它们打造的工具,更重要的是,它们自己也得学会创造新工具。只有这样,才能不断进化,最终达到AGI的水平。谢谢。

问(来自哥伦比亚):DeepMind在Gemini的进化中扮演了怎样的角色?从谷歌的视角来看,你们认为我们正在实现AGI吗?

科雷:Gemini模型的开发,核心是在Google DeepMind进行的,但这是一个涉及整个谷歌的、非常深入的合作项目。

开发像Gemini这样的模型,并思考AGI、迈向AGI,最重要的事情之一就是与产品团队紧密合作,这样我们才能获得用户的反馈。我们与莉兹的团队(搜素)以及谷歌其他团队,都保持密切合作。

在技术的推动方面,大家已经看到Gemini 2.5 Pro取得了多少进展,包括我们的推理能力、思考方法等,这是通往AGI需要向前推进的关键能力。但同时,用户反馈以及来自用户的问题,也会影响我们。因此,我们通过API与外部伙伴合作,在内部也与我们的产品团队大量协作,这是一段非常激动人心且任务驱动的旅程。

我们努力确保快速迭代,同时对于进入哪些领域、产生何种影响,我们都非常审慎。

【06】AI如何普惠新兴市场?

问(来自南非):我很高兴看到在印度,创新在各种限制条件下依然蓬勃发展。你认为新兴市场,特别是非洲大陆,在AI领域开辟自己的道路有多大希望?

桑达尔:我一直觉得,每一次技术变革,都应该让更多人接触和使用这项技术。我成长在一个可能要等5年才能装上一部固定电话的时代,印度大部分地区的人们都无法使用电话,但移动电话的出现,使这个国家的大多数人都用上了手机。

对于AI,它蕴含着同样的承诺。尤其在谷歌,我们不仅关心提供最前沿的AI技术,我们之所以如此努力,是因为我们致力于将AI带给全球数十亿用户,并让人们能够接触到。

想象一下AI模式(AI Mode)的力量,搜索正在经历的变革,这些都将向全世界开放。一个在南非的用户,将会获得和生活在加州的居民完全相同的体验。这非常了不起。

我认为下一代的孩子们,将能够以前所未有的方式获取知识,他们也将能够以前所未有的方式进行创造,所有这些都令人兴奋。所以我无法想象比AI技术更好的机遇了。

追问:那他们不应该在任何领域都规划自己的道路吗?或者,他们应该规划自己的道路吗?

桑达尔:不同国家总会有其特定的需求。我希望南非政府能够探索,如何利用AI来改善其公民服务,本地的初创企业也会应运而生。

记住,我们力量的源泉之一在于,我们不仅仅是在构建消费级产品,我们也在提供API。这意味着非洲、印尼、印度、巴西等地的企业家们,都可以利用这些技术,这正是科技的力量所在。因此,我希望创新能够在世界各地发生。谢谢。

【07】AI与监管的博弈:法律法规是否会影响创新步伐?

问(来自法国):我有一个关于法规的问题。AI概览功能尚未在法国上线,你们认为欧洲的法规是创新的障碍吗?另外,你们计划何时在欧洲,特别是在法国,推出包括AI模式在内的新搜索功能?

伊丽莎白正如你提到的,我们已经在欧洲大部分地区推出了AI概览,法规的复杂性确实会导致延迟。随着法规变得越来越复杂,需要做的事情也越来越多。就法国而言,存在许多法律上的不确定性,这尤其影响了时间表。

但随着AI模式更广泛地推广,我们希望从美国开始,将其带给世界其他地区。随着我们对用户使用情况的了解加深,并完成每个国家的严格测试以确保高质量,我们期待将AI模式更广泛地引入欧洲。

问(来自爱尔兰):爱尔兰在欧洲,欧盟这边对数据保护和数据安全管得都比较严。这些担心当然是全世界都有的,所有大型科技公司,估计都因此在欧盟碰壁。所以我想问问,当谷歌在欧洲发展和推广AI技术的时候,具体会怎么做来保证一直遵守像GDPR(欧盟通用数据保护条例)这样的规定,好好保护用户的数据?

第二个问题,爱尔兰虽然国家不大,但在欧洲其实挺重要的,因为很多大型科技公司的欧洲总部都设在这里。考虑到现在国际上的一些复杂情况,谷歌在爱尔兰未来的发展前景怎么样?”

桑达尔:关于隐私和GDPR,首先,隐私是我们公司的一个基本价值观,能够获得用户的信任是一种荣幸,没有什么比信任更重要,所以我们从第一性原理出发来确保正确行事。显然,世界各地都有复杂的法规在不断演变,我们一直遵守GDPR以及任何其他通过的法律法规,我们这一承诺不会改变。

AI显然是新的前沿。有时如果出现新的法规,我们也在代表用户进行创新,在这些时刻总会有良好的交流,这是创新运作的方式之一。我们对我们在欧洲、在爱尔兰的业务发展是坚定的。

我们服务于一个国际化的世界。但我确实认为,当前的AI创新浪潮,对欧洲很重要。我与欧盟领导人的对话让我备受鼓舞,他们正将此视为一个投资和创新的机会,并且如果可能的话,也希望简化法规,以便像我们这样的公司能够服务欧洲消费者。

这也是我们从欧洲消费者那里听到的,他们同样渴望获得这些产品,我们致力于将产品带给他们。这对欧洲也是一个机遇。

【08】AI隐忧:谷歌如何应对可持续性与人类智能挑战?

问(来自阿根廷):你好,桑达尔。恭喜您担任CEO十年。我想谈一个独特问题,那就是可持续性。大模型需要消耗大量能源和水,而且未来它会持续增长,所以会持续消耗,谷歌怎么解决?

第二个问题,您最常用哪个模型?在日常工作中何时使用它?

第三个问题,我们如何避免我们的大脑变得越来越懒?我已经不再记任何数字了,没有地图我就不会开车,我的大脑现在很懒,我甚至忘了第一个问的是什么。

桑达尔:(关于可持续性)我对此非常乐观,我认为其实人类擅长应对挑战时刻,我们正在创造的这种(能源)需求,我们可以解决它。我们早已拥有能够产生大量清洁可再生能源的技术。这种需求将迫使我们进行投资。

看看投入到核技术领域的资金,无论是小型模块化核反应堆(SMRs)、核聚变、地热能等等。在谷歌,我们在内华达州有一个数据中心,主要由地热能供电。我们正在签署一份合同,关于2030年使用SMRs来支持部分数据中心需求。所以,对我而言,这其实是一个机遇,我为此感到兴奋,它正在推动对清洁可再生能源的大量投资。这实际上会让我们处于一个更好的位置。

至于我一直使用的模型,我一直很喜欢Gemini 2.5 Pro,它简直无所不能。我把我的I/O主题演讲稿放进2.5 Pro,我让它告诉我国际媒体可能会就主题演讲问我哪些问题。所以它超级有用,我非常喜欢用它。

(关于大脑变懒),我刚说了多少次“令人兴奋”了?(笑)

伊丽莎白:这是个好问题。不过我觉得,AI带来的影响可能正好和大家担心的相反。

就拿视频来说吧,AI一下子让普通人也能玩出新花样,以前想都不敢想的创作方式现在都能实现了。比如,你可以用几张照片就生成一段视频,或者让AI带你进入各种充满创意和想象的新奇世界。这感觉太棒了!

还有实时编程,就是我在大会演讲里演示过的。我特别喜欢这个功能,因为它真的能让更多不同背景的人都开始自己动手做应用程序。现在,开发应用程序变成了一件能赋予人力量的事情。你只要有个具体的想法,AI模型就能帮你把它变成一个实实在在的应用程序。

你甚至可以让AI模型当你的老师,教你感兴趣的东西。它能用全新的方式来教你、辅导你,或者直接帮你做一个小程序来辅助你学习。所有这些功能,都能帮你更好地和信息互动,探索新的领域。这是我最喜欢AI的地方。

他们一开始提到,我用AI复习数学,其实我不光用它复习,还用它学习那些我以前搞不懂或者压根不知道的新知识。AI实际上能激发你的创造力、好奇心和学习的劲头。这真的太让人兴奋了!

问(来自以色列):很多人担心AI发展下去,最终会取代人类的工作。而另一些人则认为,掌控AI的人将取代那些不掌控AI的人。如何现实地看待未来工作领域的前景?

桑达尔:我认为在短期内,确实会出现一套强大的辅助工具,它们将极大地提升人们的能力,我们一直以来都依靠技术来完成更多事情,将一些单调乏味的工作自动化,这样你就可以花更多时间,以一种更有成就感的方式,从创造性的角度来思考问题。

在编程领域,我们以前使用非常低级的语言,现在谁也不想再用那种方式编程了。我想我们都对现代编程语言心存感激。但是10年后,会有人看待我们今天使用的编程方式,就像我现在看到汇编语言之类的东西时一样,所以这里面有一个发展过程。我经历过整个过程,Fortran此刻就浮现在我的脑海,但我们已经进步很多。

我认为,当我们审视正在开发的这些软件智能体时,作为一名工程师,你试图分解一个问题,你试图在脑海中实现一个用例,能够专注于核心问题,而不是所有的繁琐事务,这是一个巨大的进步,所以我认为这普遍适用于所有领域。

如果你想创作内容,你会希望把大部分时间花在创作过程中。如果能让编辑工作更容易,我想人们会喜欢的,更多的人会去创作内容。这就是未来的机遇。

对大多数人来说,有机会去积极拥抱AI工具,学习使用它们,并调整工作流程来适应它们,这是迎接变革的最佳方式之一,这也是机遇所在。我不想轻描淡写,显然可能会有一些(挑战),但我们都必须去应对。技术正在快速发展,特别是对于各个国家而言,为了在这个数字经济、数字世界中保持竞争力,拥抱创新并适应它至关重要。所以AI最终会变得很重要。

分享至
11赞

好文章,需要你的鼓励

周雅

Miranda
关注科技创新、技术投资。以文会友,左手硬核科技,右手浪漫主义。
推荐文章
  • LLM情境调节与持续工作流程提示:革新化学分子式的多模态验证技术

    LLM情境调节与持续工作流程提示:革新化学分子式的多模态验证技术

    这项研究探索了如何通过"LLM情境调节"和"持续工作流程提示"技术来提高大型语言模型在验证化学分子式时的准确性。研究者发现,普通提示方法往往不可靠,因为LLM倾向于自动"纠正"错误而非指出它们。然而,通过精心设计的情境调节提示,研究成功引导Gemini 2.5 Pro不仅识别出文本中的错误,还发现了之前人工审阅未察觉的图像中的分子式错误。这一概念验证研究表明,即使不修改模型本身,也能通过适当的提示策略显著提高LLM在科学技术文档细节验证中的表现。

  • 微生物显微图像分割新突破:复旦大学研究团队借助多模态大语言模型统一显微镜下的"万物分割"

    微生物显微图像分割新突破:复旦大学研究团队借助多模态大语言模型统一显微镜下的"万物分割"

    复旦大学研究团队开发的uLLSAM模型成功将多模态大语言模型(MLLMs)与分割一切模型(SAM)结合,解决了显微镜图像分析的跨域泛化难题。通过创新的视觉-语言语义对齐模块(VLSA)和语义边界正则化(SBR)技术,该模型在9个领域内数据集上提升了7.71%的分割准确度,在10个从未见过的数据集上也展现了10.08%的性能提升。这一统一框架能同时处理光学和电子显微镜图像,大大提高了生物医学图像分析的效率和准确性,为科研人员提供了强大的自动化分析工具。

  • 用强化学习让大语言模型为汇编代码提速:斯坦福团队的优化探索

    用强化学习让大语言模型为汇编代码提速:斯坦福团队的优化探索

    斯坦福大学等机构研究团队利用强化学习训练大语言模型,使其能够优化汇编代码性能。研究构建了8,072个程序的数据集,并通过近端策略优化(PPO)训练模型生成既正确又高效的汇编代码。实验表明,训练后的Qwen2.5-Coder-7B-PPO模型实现了96.0%的测试通过率和1.47倍平均加速比,超越包括Claude-3.7-sonnet在内的所有其他模型。研究发现模型能识别编译器忽略的优化机会,如用单一指令替代整个循环,为性能敏感应用提供了有价值的优化途径。

  • 播放师傅变声魔术:让你的录音遵循参考风格的推理时间优化新方法

    播放师傅变声魔术:让你的录音遵循参考风格的推理时间优化新方法

    这项研究提出了一种改进的声乐效果风格迁移方法,通过在推理时间优化过程中引入高斯先验知识,解决了传统ST-ITO方法忽视参数合理性的问题。研究团队基于DiffVox数据集构建了专业效果器参数分布模型,将风格迁移转化为最大后验概率估计问题。实验结果表明,该方法显著优于基准方法,参数均方误差降低了33%,并在主观听感测试中获得最高评分。这一创新为音频处理领域融合数据驱动和专业知识提供了新思路。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-