
就在外界都以为Google会按惯例在I/O上更新Gemini Pro系列时,结果等来的主角是 3.5 Flash,而Pro被一笔带过,只说“下个月发”。一家公司每年分量最重的发布会,C位留给了一个轻量模型,这显然与当下行业的卷态格格不入。
I/O的第二天下午,Google的核心管理层接受了全球小范围媒体群访,Alphabet兼谷歌CEO Sundar Pichai在谈到3.5 Flash的时候,说了这样一句话:
“技术的有趣之处在于,你既在推进它,作为Google,我们又特别承诺把它降下来、让它可及、让全世界每个人都用上同样的技术。”
然后你会发现,这次I/O几乎所有新品都在朝同一个方向走——够用够好、便宜省钱、可大规模部署。
Gemini 3.5 Flash的性能在线,但定价不到对标前沿模型的一半,Pichai 当时给出了一个测算,云端排名靠前的几家企业客户目前每天处理大约1万亿 token,如果他们把80%的工作负载从其他前沿模型迁到 3.5 Flash,每年能省下超过 10 亿美元。Gemini Spark跑在云端虚拟机上,核心卖点不是更聪明,是 24 小时不下线,合上电脑也在跑任务。Universal Cart 不需要颠覆性AI能力,它要的是跨 Search、YouTube、Gmail、Gemini 触达每一个消费者。Android XR的音频眼镜,甚至没有屏幕,但不影响它听歌拍照打电话、唤醒手机里的应用而不掏手机。
Pichai 给出的对照本身就是答案。3.5 Flash 已经追平四个月前的前沿模型(Pro/Ultra 类的旗舰),这些前沿模型正在被自家轻量化版本快速覆盖。换句话说,前沿模型的存在是为了证明“我们能做到”,而商业上真正赚钱、真正影响产业的,是能跑在每一台手机、每一次搜索、每一封Gmail草稿里的轻量模型,因为它们够用够好、便宜省钱、可大规模部署。所以,Pro在前方“奔跑”,但Flash已经在足够多真实场景里“够好”。
这个选择的另一面也很现实。9亿月活的Gemini app用户、25亿月活的AI Overviews用户、刚突破10亿月活的AI Mode。这些数字加在一起,是Google的底气。
Google真正擅长的,是把一种基础能力「扩散」到所有人都已经在用的产品里。搜索引擎虽然不是Google发明的,但Google却扩散了它,通过PageRank加极简搜索框加持续更新的索引,扩散成了大部分用户的搜索入口。Android或许不是最聪明的操作系统,但它被扩散到了30亿台设备。
当然,要支撑这种规模的扩散,需要的不止是技术突破,更是一座座造出来的「工厂」。
Pichai 在采访里给出了一个具体数字:“过去两年,Google 建造的计算能力,等于此前20 年的总和。”这个基础可以理解为三层。
第一层是芯片。前不久的Cloud Next 上,Google公布了第八代TPU——首次采用双芯片架构,8t 专为大规模预训练,8i 专为推理。Pichai 在采访里特别提到 JAX 和 Pathways 的设计:他们已经能把训练任务分布到全球100多万颗TPU 上,跨越多个数据中心。“我们越来越不只是在单一数据中心做大规模训练,而是在全球构建虚拟集群。”从AI基建的角度看,这句表述也许可以理解为Google正在从“建一个大型数据中心”切换到“把全球数据中心组成一台机器”。
第二层是能源。Pichai透露,Google正在为新型能源签署长期采购协议:核聚变、地热、小型模块化反应堆(SMR)都在采购清单上。一家科技公司开始为还未规模化的能源签合同,只能说明一件事:它的算力扩张速度已经超过了现有电网的承载能力。Google在押注未来的电。
第三层是供应链。Pichai 在采访里用这样一句话带过亚洲供应链:“我们很依赖来自全球,尤其是亚洲的供应链,他们对这一动态时刻反应得很好。”这句话滴水不漏,但背后的事实是清楚的:Google的TPU需要TSMC、SK海力士、Samsung这样的产能保障,而这些产能也是全球争夺的对象——Nvidia、AMD、苹果、华为都在同一份名单上排队。
把这三层叠起来,Google 在做的事接近于一种工业时代级的基础设施工程。它和洛克菲勒的标准石油在1880年代做的事结构相似。洛克菲勒赢的不是炼油技术,他赢的是炼油加储运加销售加运输的全链路整合。在AI时代,Google想成为的,是“全栈深度最深的公司”。
这种基建的最终目的,是支撑「扩散」。一个数据中心可以服务几千万人,一百万颗 TPU 跨数据中心协同,才能服务几十亿。
采访尾声时,一位来自墨西哥的记者问了最后一个问题:“AI 何时能让普通人感受到可持续的好处?”
Pichai 他指了指外面,Waymo 即将进入东京和伦敦,Google 的 AI 模型正在帮助核聚变研究,AlphaFold 的数据库正在被巴西、印度、欧洲、亚洲的生物学家访问。
“技术只有当它在某个具体的人的具体生活里改善了什么,才有意义。这就是技术作为enabler(赋能者)的目的。我们要确保以负责任的方式向前推进,覆盖尽可能多的人。”
这句话本身平淡如水,但它非常适合放在这里作为论证,Google 在赌每一天,Gemini 出现在多少人完全没意识到的瞬间:你某一天打开 Chrome 时发现地址栏旁边多了一个智能的东西,某一天 Gmail 帮你自动起草了一封邮件,某一天 Maps 帮你订了餐,而你已经记不清是从哪一天开始,这一切就在自动发生。
扩散,是一种几乎不被看见的快。
图从左到右依次为:谷歌搜索副总裁Elizabeth Reid(下文写作Liz)、Google Deepmind CTO Koray Kavukcuoglu;Alphabet兼谷歌CEO Sundar Pichai
问(澳大利亚记者):你们投入了这么多资源和钱,花这么大力气办 I/O,这值得吗,为什么?
Pichai:Google I/O 是我们一年一度系统性传达“我们正在做的所有事情”的机会,我们很努力地想传递清楚:技术目前处于什么状态?我们接下来一年想做成什么?
我们是一家全球公司,很幸运、很荣幸地拥有 13 款触达 10 亿用户的产品,以及 5 款触达 30 亿用户的产品和平台。我希望我们能同时出现在世界各地,我们其实正在用量子计算研究这件事。但在那之前,把大家请到一个地方,是我们能想到的最好方式。所以谢谢你们来,花时间在我们身上,也帮世界其他地方的人了解情况。
问(韩国记者):今年 I/O 上发布的智能搜索框、Gemini Omni、Spark 都让我印象深刻。人们普遍认为,要让 AI 真正融入日常生活,最终的核心一定是离用户最近的智能手机。Google 有自己的手机产品线 Pixel,过去也常用 I/O 舞台聚焦关键设备。但批评者一直指出,Google 快速演进的 AI 软件和 Pixel 硬件之间,还没有真正发生协同效应——更像是两条平行的轨道。
考虑到你们在构建 Android 生态中的关键作用,你怎么回应这种担忧?另外,Google 计划如何把这一切——包括与 Pixel 的整合,做成一款能甩开对手的杀手级设备?
Pichai:谢谢你的问题。你说得对,智能手机仍然是用户体验的核心,我们非常专注于把 AI 带到智能手机里,Pixel 一直走在“把 AI 体验带到设备上”的前列。上周我们刚开过“Android秀”的活动,我们每年都在这场活动里宣布即将到来的开发者更新,这次谈了Gemini Intelligence,谈了 Gemini 怎么进入 Android。
我们当然也和很多合作伙伴一起做这件事,包括来自韩国的标志性公司三星,它是 Android 的旗舰 OEM。我们对和三星的合作非常兴奋,他们是推广 Gemini Intelligence 的关键伙伴,新设备今年秋天就会发布,Google Pixel 也是。所以这是一个良性循环,模型层面我们开发下一代,这会反映在操作系统设计上,我们讲清楚这个故事,新设备跟上来。
其实我们在很多方面已经走在前沿。我们这次 I/O 上还讲了 Android Halo——在一个 agents 大量存在、人们会大量使用 agents 的世界里,我们正在 Android 里创造一个新的空间,让你接收来自 agents 的通信,它就是你在 Android 上和 agents 打交道的“指挥中心”。这些都是我们处于前沿的例子。
问(瑞士记者):几年前你在 I/O 上反复强调“安全和进步要平衡”,我想聊聊这个话题。你能不能分享一下,你今天怎么平衡这两件事,尤其是现在,你们的竞争对手只要产品基本能用就赶紧推出,他们也不像 Google 这样面对一个庞大用户群,扮演“守门人”的角色。“安全 vs 进步 vs 竞争”,你现在怎么看?
Pichai:谢谢,这是一个很重要的问题。你说得对,前沿在快速推进,行业里有大量竞争动态。但与此同时,我也看到一些令人鼓舞的进展。
比如我们用SynthID取得的进展,以及围绕它建立的生态,前沿公司像是 OpenAI、Google、Meta 等聚到一起,共同推进这项技术。这就是我们在协作的一个例子。
另一个例子是,最近大家关注的“前沿模型对网络安全的影响”,前沿实验室、安全厂商、各国政府(包括美国政府)之间正在产生大量协作。这些都是证据,证明我们既在快速推进技术,又在推进“如何更好地协同”。随着技术进入更高级阶段,这样的框架会变得越来越必要。
作为一家公司,我们对“负责任”非常坚定。这就是为什么发布 Gemini Omni 时,我们从 Omni 的 Flash 版本开始。Omni 显然是一个能力非常强的产品,但我们从 Flash 版本起步。我们也在扩大 SynthID 的覆盖,把它放进 Search、Gemini app 和 Chrome,让用户能很容易识别 AI 生成的内容。推进技术进步和安全,我们是同步在做的。
所以你会看到我们在整个过程中始终“既大胆,又负责任”。我也认为,随着技术在社会中铺开,政府将越来越扮演重要角色。
问(阿根廷记者):在你日常生活里,你怎么用AI?
Pichai:我说一个场景,但这是 AI 在我生活里非常深的一个用途。我一直让我父母把他们从医生那里拿到的所有报告通过邮件发给我,我在 Gemini 里给每位都建了 notebook 文件夹,把所有报告都放进去,这样我就能持续和它对话,让我安心地持续了解父母的身体状况。
这是一个简单但对我来说非常有意义的场景。另外说实话,我其实不算特别有创造力、特别会表达的人,但 AI 让我感觉自己更像是那样。我儿子有时候会问:“这真是你做的吗?”我说:“是啊,我发誓。不过是借助 Gemini 做的。”我会这么回答。
Lily(Google全球传播副总裁Lily Lin,作为本场主持人):我用NotebookLM,在我的内容生产里,我对它做查询,它帮我核查事实。我每天用的产品里,几乎没有哪个不带AI属性,Google Photos,甚至Maps,AI都被整合进去了。我住在旧金山,常常坐Waymo。
Liz:我用 AI 的方式很多样化,我发现自己现在会问更多问题,以前觉得自己知道答案,现在反而问得更多。我也开始重新写一点代码了,因为“上手成本”低了很多,我不需要把过去几年演进的整个代码库都搞懂。
个人生活上,我一直在用 Daily Brief 来真正搞清楚我孩子学校在发生什么。学校的邮件来自 50 个不同源头、不同的人名,有时带学校名字,有时不带,根本记不住。但现在我能真正知道我孩子这周在干什么了。听起来很搞笑,但我居然知道了,太棒了。
Koray Kavukcuoglu:重新开始写代码这件事,我跟Liz一样。我觉得 AI 让很多人,尤其是那些以前会写代码、后来停下来的人,重新开始写代码,再次“上手”那种感觉太好了。我感觉,自己虽然在追赶团队,但还是能做出一些贡献,这让我很开心。
除此之外,我尽量让白天每一个决定、每一件事都让 Spark 或 Gemini 过一遍。Spark对我特别有用,开始这一天之前,我一定会先和 Spark 聊一下,我今天要做什么,最重要的事是什么,得到一份完整的“今日总览”,非常有帮助。
平常或个人生活里,我基本都用 AI Mode 或 Gemini 做事实核查,或了解任何我感兴趣的东西。我们刚从伦敦搬到加州,关于不同国家的生活方式有太多未知,比如这个国家的垃圾分类怎么搞?跟以前的国家一样吗?甚至想买房这种事,交易流程到底怎么走?AI 真的太有用了。甚至,你会发现最近开会准备得比以前充分多了,自从你开始用AI之后(玩笑)。
问(中国台湾记者):在 AI 的算力竞赛中,计算能力是关键瓶颈。Google 的 TPU 基础设施作为战略差异化优势,是怎么满足全球需求的?另外看东亚市场,要让模型在繁体中文上达到和英文一样的语言细腻度和准确度,主要挑战是什么?
Pichai:先说算力,我觉得这是计算领域一个非凡的时刻。技术界、科学家、研究者、工程师从来都对挑战回应很好。我们对计算基础设施的要求比以往任何时候都高。
有一个很好的对比方式:过去两年,Google 建设的算力,相当于此前 20 年累计的总和。这种时刻不常见,它对每一层技术栈都是挑战。
我感到兴奋的是,你看我们在新能源上的投入,我们已经签了核聚变、地热、小型模块化反应堆的购电协议;TPU 的建设节奏也加快了;我们越来越不只是在单一数据中心做大规模训练,而是在全球范围内构建虚拟集群。这些都是这一刻催生的创新。当然我们也很依赖全球,尤其是亚洲的供应链,他们对这种动态时刻反应得非常好。这将是一个生态范围内的非凡创新与价值创造时刻,我很激动能参与其中。
Koray Kavukcuoglu:关于模型支持多种语言,比如韩语、中文等等,这从一开始对我们就非常重要。我们一直说“建一个通用模型”,从最开始我们就坚持多语言原则,以Google一贯的风格,我们想覆盖尽可能多的人和语言。新技术给我们的机会,不只是理解语言本身,还能理解一点文化,因为语言是嵌在文化里的。我们的语言研究越来越多地朝向“理解文化”发展,只有你理解文化,翻译或交流才能做得更好。
这是我们投入很多精力的方向,我也很高兴这种方式能让全球进行知识共享。因为很多知识只存在于某些语言里,并不是每种文档都有每种语言的版本。把所有语言融合到一个模型里的这种力量,能让这些信息服务于很多全球社区。
问(法国记者):关于基础设施,Google今年投入了1900亿美元,明年还会增加,你为什么觉得这是值得的?以及它什么时候会停止增加?
Pichai: 我觉得第一部分容易回答得多。我们承诺要做一家关键的技术公司,处于技术发展的前沿。Transformer 不是偶然在 Google 发明的,它至今仍是这场生成式 AI 革命的基础。我们一直采取长期视角,要在 AI 这一刻处于尖端,需要大量投入,我们对此承诺坚定。
我们能有信心做这件事,是因为我们看到了需求,我们公司的多元化做得很好。我们看到来自消费者、开发者、企业、全球的需求,一个例子是 Google Cloud 上季度财报里的待签订单,增长了将近 2000 亿美元。所以我们有信心去投资,因为我们看到了未来的需求。要跟上这项技术,就需要这样的投入。
至于第二部分,我们其实是在一个对线性预测未来时常非常谦卑的领域里工作,我们经历过若干轮“快速投资周期、紧接着快速效率收益”。两者会交替发生。比如手机,最早的手机非常贵,现在人人都有智能手机;电动车也是。技术总是这样。
我特别为 3.5 Flash 自豪,它将成为全球 Gemini app 用户的默认模型,也将进入 Search。这个 3.5 Flash 模型,比我们四个月前的前沿模型还要好。所以我们正在把这种技术扩散给数十亿人。两件事是同时发生的。
技术的有趣之处在于,你既在推进它,作为 Google,我们又特别承诺把它降下来、让它可及、让全世界每个人都用上同样的技术。
关于 CapEx 长期轨迹,我不完全确定,预测总是很难,但我预期会有这样的时刻,作为行业,我们能更有效率,能更专注于优化模型本身,因为它们能力更强了。随着我们在编程方面取得很多进展,我们能找到效率的提升方式。这是我们在分享的进展的一部分。
问(中国记者):中国的产品比如DeepSeek、Manus现在正在东南亚、中东、拉美与Gemini竞争。Google怎么看待与这一代中国builder的合作?Google和中国builder在哪些地方可以一起把AI推向全球?
Sundar:现在有一个非常有活力的开源社区。我看到来自中国的研究前沿,还有非常活跃的开源模型。我会说这是积极的互动。我们正生活在一个时代,美国用户也在尝试这些产品、这些模型。所以我看到一种良性循环正在发生,从我的角度看是相当稳健的。
Koray:我觉得最重要的是,世界上有很多地方都有模型构建者,拥有最好、最受欢迎的技术本身才是最重要的事。正如你说的,中国一些公司在模型路线上采取了不同方法,我们试图两条路都走,我们有专精模型、也有通用模型。但归根结底,重要的是技术上的扎实进步,同时对我们而言重要的是把技术转化给用户。
所以像 Google 一样,当我想到技术进步时,重要的是从产品出发去想,用户想要什么?用户需要什么?把技术往前推的正确方式是什么?以“大胆且负责任”的方式推动技术,这是我们正在做的事,包括 Omni 模型、SynthID、Spark 的 agent 能力、3.5 Flash,我们把它带给用户,但非常注意用户的控制权,这些必须并行进行。我觉得只有把这些做对,才能让技术对全球产生正面影响。
问(法国记者):考虑到AI带来的工具,比如co-scientist,你最希望做出的“终极科学发现”是什么?是攻克癌症?解决某些数学问题?
Sundar:我们还在早期阶段。尤其在过去 6 到 12 个月里,你能看到一个趋势:顶尖科学家、顶尖数学家、顶尖物理学家越来越多地把这些工具整合进研究流程。我们有 AlphaEvolve、co-scientist,我们投资研究 agents 来推动科学前沿。你越来越多地看到科学家用这些模型做出突破。每个月都有新的发现、有以前无解的问题被解决。这是个迷人的时代。
我觉得 AlphaFold 本身就是我们已经展示的最深远的科学发现之一,非常具体、可见。它的数据库正在被全球最杰出的研究者使用,巴西、印度、欧洲、亚洲的生物学家都在用它。这是一个非凡的时刻。
我们正在加速科学发现。回头看,我们会把今天视作“我们深刻地推动这件事”的早期阶段。我希望我们正在进入这样一个阶段,每个科学家都自然地使用这些工具,让发现、创造过程变得更好、更快。
Koray:我希望看到的不是某一个具体突破,而是整体科学进步的加速。我们承认 AI 是其中重要的一部分,科学家们真的在感受到使用 AI 的力量。我相信,加速科学进步,对所有人都是净正面的。
问(加拿大记者):我有一个澄清和一个问题。你之前在某个回答里说Pixel新设备今年秋天发布?
Pichai:我很乐意确认,我们将在 8 月发布新的 Pixel。哦,具体日期我其实不确定,但肯定会在 I/O 和今年年底之间发布。不过你别发出去,我应该再小心一点。这边在场的有些人非常密切关注我们做的事,我得更小心一些。我有点说漏了。
追问:真正的问题是,为什么你们和竞争对手能合作得这么融洽?比如 Apple Intelligence、Siri 背后用 Gemini,你们也在 iOS 上努力做 Gemini app。我玩 iMessage 绿色气泡那种游戏时,我觉得你们比他们友善多了,为什么?
Pichai:我觉得我们是一家既有产品、又有平台的公司。当你是平台提供商,你就有责任提供平台,并与客户合作。你刚提到了两个例子,但我可以举更多。
三星生产手机,但他们也给竞争对手提供重要部件,这就好比是,如果你是三星的内存部门,你和移动部门的对手紧密合作。我们认真承担“平台提供商”的角色,Google Cloud 是一个非凡的平台,我们在那里有客户,我们承诺尽全力服务他们。这并不妨碍在某些领域我们会竞争,我们的内部团队也在拼尽全力做最好的产品,比如搜索。
问(印度记者):你们今年在 I/O 舞台上做了很多发布,5 到 10 年后回头看,你觉得这次 Google I/O 上,人们会记住的“那一个”发布或产品是什么?
Pichai:这次 I/O 为我们产品中的“agentic transformation(智能体转型)”奠定了基础。你听到了 Search 里有 agents,Gemini 里有 agentic models,Chrome、Android 里都有。
我们处在一个技术转型的时刻,以前你查询、得到一些信息,然后结束;后来是和这些产品持续对话;现在产品能真正采取有意义的行动,让你的生活更轻松。这种转型,是人们回头看会记住的“基础”,它会贯穿我们的核心产品。我们非常激动能在多年后回头看,看它确实运转良好,并在规模上赋能了数十亿用户。
问(墨西哥记者):AI 带来了重大的社会、环境、经济权衡,普通人什么时候才能体验到可持续的好处?Google 在推动这种采用上扮演什么角色?
Liz:我们昨天谈到,搜索每天被数十亿人使用,25 亿人在用 AI Overviews,这就是非常具体的好处。Google 年复一年成功的一件事,就是把技术带给人们的方式非常自然,人们不必担心“我在用 AI 还是没用 AI”,他们只是发现自己生活变好了。这就是一个小例子。
Koray:我补充一下,开放技术很重要。我们相信这项技术能以一种“foster(培育/鼓励)”的方式被使用。通过产品,理解人们如何在日常生活中使用它,是很重要的,当人们使用我们的产品时,我们感到高兴。当我们以有用的方式把更多 AI 放进去,人们用得更多、更喜欢用,这是净正面的,为什么,因为它对他们的生活有帮助。这是我们开发技术的目标:通过我们大量的产品创造正面影响;通过技术和科学发现,帮助那些正在试图改变世界的人。
Pichai:我们承诺把技术带给世界上每一个人,其实有非常具体的方式,它已经在发生:药物发现的改善会影响人们的生活;我们用 AI 模型帮助改进核聚变技术;在美国,我们正在更大范围铺开 Waymo,并且已经宣布 Waymo 的国际扩张,正在东京、伦敦等地推进。我们这样做的部分原因是,我们需要把技术带去更广阔天地,技术最终能拯救人类生命。
所有这一切,技术只有以改善人们生活的方式呈现才有意义,这就是技术作为 enabler(赋能者)的目的,我们要确保以负责任的方式向前推进,覆盖尽可能多的人。
Lily:Sundar,我们正进入一个 AI 更加“agentic”(智能体化)的新时代,你对此的整体愿景是什么?这项技术如何改变Google?
Sundar:这是一个非凡的时代。我以前说过,能在一家有永恒使命的公司工作,我感到很幸运。有了AI这种更好的技术,来推动这个使命——“组织信息,让它普世可及、有用”,再合适不过。我们一直认为,AI 是推进这个使命最深远的方式。
所以 10 年前我们把公司转向“AI 为先”,采取了一种非常差异化的全栈打法来推动创新。现在我们看到了一个机会,技术正在突飞猛进,但怎么把它扩散出去,让更多人用上?这是我们在做的很大一部分工作。这也是为什么 3.5 Flash 这次的发布如此重要——它是我们的主力模型,把这种已经触达前沿的能力带给我们的产品、带给全球用户,特别是 agent 这一层的能力。
技术现在已经发展到这一步,它越来越能成为一个强大的个人助手,在日常生活里帮人做有意义的事。把这种能力扩散到消费者、开发者、企业的每一个接触点——这是我们现阶段最关注的。
Lily:要做出这些新的产品体验,Google 在研究层面是怎么扩展边界的?
Koray:像 Sundar 说的,我们在 AI 上的投入是长期的,主要靠两根支柱。
第一根支柱当然是做绝对前沿的研究。世界上最好的研究,需要最好的环境支撑。回顾 AI 研究的历史,哪些事推动了最大进步,你会发现都和 Google Research 有关。
第二根支柱同样关键,是我们在硬件上的投入。从很早开始,硬件和芯片研究就是 Google 的重点。我们把这两根支柱“协同工程、协同设计”,让它们并行往前推进——我们可以借助研究稍微看到一点未来,然后据此设计硬件。几周前发布的第八代 TPU 就是这种思路的产物,它是我们的新一代训练芯片。
今天的成果其实是几年前埋下的种子。展望未来,我们会继续锻炼这块肌肉,同时与所有产品和服务紧密协作。因为现阶段,构建智能本质上意味着,把来自用户、来自企业的真实问题,反向融入到技术塑造中——我们要在技术里解决哪些问题?怎么把技术注入进去?我们正在以合作伙伴的方式协同推进。
Lily:说到这里,Google搜索正在经历近年最大的变革,我们怎么让AI做到这一点的?
Liz:有意思的是,用户的需求一直都在。人们一直有那些“想了解更多”的事情,但技术一直是个障碍,让大家没法真正问出心里的问题,因为你得把它翻译成搜索框能理解的关键词,你得用文字写出来,你必须当下就能实现它。现在的技术真的让我们能打破这些障碍——用户心里真正想问的问题,直接问就好。
昨天我们提到的 “information agents”(信息智能体)也一样——“想在某件事发生的那一刻就知道”是一直存在的需求,但你不知道它什么时候会发生,你不可能每天去查,这是不现实的。现在我们说:好,你不用每天查了,有信息我们告诉你,你就可以深入挖掘、读文章、了解更多。
我们一直在看用户需求是什么。在信息领域,agents真的能让我们既解锁更难的任务,也解锁更整合的任务。
好文章,需要你的鼓励
AWS AI Labs研究团队发布EvalAgent,这是一套通过"评估技能"自动生成AI智能体评测方案的系统,将首次运行成功率从17.5%提升至65%,并在人类专家评测中获得79.5%的偏好选择。
亚历山大大学提出M2Retinexformer,通过融合深度、亮度和语义三种辅助模态,让AI在增强暗光图像时兼顾几何结构与视觉自然度。
浙大、西湖大学等联合提出FAAST,无需反向传播,一次正向扫描将训练样本压缩为快速权重矩阵,推理时间和内存占用分别节省90%和95%以上。
慕尼黑工业大学发布RealICU基准,用专家后见之明评测大语言模型在ICU实时决策中的真实能力,发现现有顶级AI存在有害推荐率过高和锚定偏差两大安全隐患。