文|周周
6月11日,OpenAI首席执行官Sam Altman在他的个人博客上发表了一篇文章,题为《温柔的奇点(The Gentle Singularity)》,他认为超级智能(superintelligence)即将到来,奇点已经开始,但这一过程是渐进的而非灾难性的。
在他眼中,奇点的进程是这样的:“我们很快从惊叹AI能生成精美段落,到好奇它何时能写出整本精彩小说;从惊讶它能做出救命诊断,到期待它何时能开发出治愈方案;从惊讶它能创建小程序,到期待它何时能创建整个公司。这就是奇点的进程:奇迹变成常态,然后成为基本条件。”
Altman甚至给出了明确的时间表:
2025年,我们已经看到能真正思考和工作的AI代理(Agent);
2026年,可能出现能提出“原创见解”的AI系统;
2027年,可能出现能在现实世界执行任务的机器人;
2030年,智能(想法)和能源(将想法变为现实的能力)将变得极其丰富,这两样东西一直是限制人类进步的主要因素,如果有了大量的智能和能源(再加上好的管理),我们能拥有一切。
传统上,“奇点”(Singularity)一词在技术语境中有着特定含义。正如已故科幻作家Vernor Vinge在1993年的论文中所定义的,技术奇点指的是“人类失去对人工智能的控制,导致文明被AI完全主宰的理论时刻”。Vinge将奇点描述为人类的灾难性事件,可能导致人类的物理灭绝。
Altman将“奇点”重新定义为技术进步的自然延续,而非人类被取代的转折点。他在博客里写道:“从相对论的角度看,奇点是一点一点发生的,合并也是缓慢进行的。我们正在攀登技术进步的指数曲线:向前看总是垂直的,向后看起来总是平坦的,但它是一条平滑的曲线。”
不过,Altman也承认存在严峻挑战,并提出了两步走的解决方案:首先,解决AI安全和对齐问题;然后,专注于让超级智能变得便宜、广泛可用,避免过度集中在任何个人、公司或国家手中。
有意思的是,他还首次公开了ChatGPT用了多少电:一次普通查询只用约0.34瓦时的电,这相当于烤箱开一秒多,或者节能灯泡亮几分钟的电量,或者相当于使用约0.000085加仑水,差不多是1/15茶匙。他认为,“未来AI的成本最终会接近于纯电力成本。”
值得一提的是,《华盛顿邮报》去年与研究人员合作发现,用GPT-4生成一封100字的邮件大约需要“略多于1瓶水”的资源。研究还发现,耗水量可能会因数据中心所在位置不同而变化很大。
《温柔的奇点》原文如下(经编辑):
我们已经跨过了一个重要的门槛,AI的大规模发展已经启动。人类正在创造超级智能,但令人惊讶的是,这一切发生得比我们想象中更平常、更自然。
看看周围——机器人还没有遍布街头,大多数人也没有整天和AI聊天,人们仍然会生病死亡,我们还不能轻松地去太空旅行,宇宙中仍有大量谜团等待解答。
但我们现在的AI系统,在某些方面已经超过了人类智能,并且能大大提高人们的工作效率。最难的技术突破已经实现了——虽然开发GPT-4和o3这样的系统付出了巨大努力,但这些突破将带我们走得更远。
AI将在很多领域改变世界,最大的好处是它能加速科学研究和提高生产力,这将极大改善我们的生活质量,未来可能比现在好很多倍。科学进步是人类发展的最大推动力,想想我们能获得多少新发现,这真的很令人兴奋!
从某种角度看,ChatGPT已经比历史上任何人都“强大”。每天有数亿人依赖它完成越来越重要的工作,它的一个小功能更新就能产生巨大的积极影响,但如果有一个小缺陷,乘以数亿用户,也会造成巨大的问题。
2025年,我们已经看到能真正思考和工作的AI代理出现。到2026年,可能会出现能提出原创见解的系统。到2027年,或许会有能在现实世界执行任务的机器人。
更多人将能创作软件和艺术作品。虽然专业人士只要愿意使用这些新工具,仍会比新手做得更好,但这些工具会大大缩小差距。简单说,一个人在2030年能完成的工作量可能是2020年的好几倍,这将是一个惊人的变化,很多人会找到方法从中受益。
人类生活的核心部分在2030年代可能不会有太大变化。人们仍会爱家人,表达创造力,玩游戏,在湖里游泳。
但在许多重要方面,2030年代可能会与以往完全不同。我们不知道人工智能会超越人类智能水平多少,但我们很快就会知道答案。
在2030年代,智能和能源——也就是想法和实现想法的能力——将变得极其丰富。这两样东西一直是限制人类进步的主要因素,如果有了大量的智能和能源(再加上好的管理),理论上我们能拥有任何其他东西。
我们已经生活在令人惊叹的数字智能时代,经过最初的震惊后,大多数人已经习惯了。我们很快就从惊讶AI能写出漂亮段落,变成好奇它何时能写出整本精彩小说;从惊讶它能做出救命诊断,到期待它何时能研发治疗方法;从惊讶它能写简单程序,到期待它何时能创建整个公司。这就是技术变革的过程:奇迹很快变成常态,然后成为基本条件。
科学家们告诉我们,使用AI后,他们的工作效率提高了2-3倍。高级AI有许多令人兴奋的用途,但最重要的可能是,我们可以用它来加速AI研究本身。我们可能会发现新的计算方法、更好的算法,以及许多意想不到的东西。如果我们能在一个月或一年内完成原本需要十年的研究,进步速度显然会大不相同。
从现在开始,我们已经开发的工具将帮助我们获得更多科学发现,并帮助我们创造更好的AI系统。虽然这还不是AI完全自主更新自己的代码,但这已经是自我改进的早期形态。
还有其他正在形成的良性循环。AI创造的经济价值已经启动了一个良性循环,推动更多基础设施建设来支持这些越来越强大的AI系统。能制造其他机器人的机器人(从某种意义上说,也包括能建造其他数据中心的数据中心)已经不远了。
假设我们需要用传统方式制造第一批百万个人形机器人,但之后这些机器人就能运营整个供应链——挖掘和提炼矿物、驾驶卡车、管理工厂等——来制造更多机器人,进而建造更多芯片工厂和数据中心,那么发展速度显然会大不相同。
随着数据中心生产自动化,智能的成本最终可能接近电力成本。(人们常好奇ChatGPT查询耗能多少:平均一次查询用电约0.34瓦时,相当于烤箱运行一秒多,或高效灯泡亮几分钟的电量。或者相当于使用约0.000085加仑水,差不多是1/15茶匙。)
技术进步会继续加速,而人类几乎能适应任何变化。会有一些艰难的挑战,比如整类工作岗位消失,但另一方面,世界将变得如此富有,以至于我们能认真考虑以前不敢想的新政策。我们可能不会一下子改变整个社会制度,但几十年后回头看,这些渐进变化将积累成巨大转变。
历史告诉我们,人类总能找到新的事情做和新的需求,并迅速适应新工具(工业革命后的工作变化就是个好例子)。人们的期望会提高,但我们的能力也会同步提高,大家都能获得更好的产品和服务。我们将为彼此创造越来越美好的事物。人类比AI有一个长期且独特的优势:我们天生关心其他人及他们的想法和行为,而我们对机器并不那么在意。
一千年前的自给自足农民看到许多人所做的事情,可能会说我们都在做“假工作”,只是在玩游戏娱乐自己,因为我们有充足食物和难以想象的奢侈品。我希望一千年后的人看我们那时的工作也会觉得是“假工作”,但我相信那些工作对做它们的人来说会感到非常重要和有满足感。
新奇迹出现的速度将会非常快。我们今天很难想象2035年会有什么发现——也许我们会从一年解决高能物理问题,到第二年开始太空殖民;或从一年取得重大材料科学突破,到第二年实现真正的高带宽脑机接口。很多人会选择和现在差不多的生活方式,但至少一些人可能会选择“接入”新技术。
展望这样的未来听起来难以理解,但实际经历这个过程可能会令人印象深刻却又可控。从相对论角度看,技术奇点是一点一点发生的,融合也是慢慢进行的。我们正在攀登技术进步的指数曲线——向前看总像是陡峭的悬崖,向后看则很平坦,但实际上这是一条平滑的曲线。(想想2020年时,如果有人说2025年会有接近通用人工智能的系统,听起来有多疯狂,再对比过去5年实际发生的情况。)
除了巨大的好处,我们也面临严峻挑战。我们确实需要解决技术和社会层面的安全问题,但考虑到经济影响,让超级智能广泛可用同样重要。最好的前进路径可能是:
首先解决AI与人类目标一致的问题,确保AI系统能学习并实现人类真正长期想要的东西(社交媒体算法是不一致的例子——它们很擅长让你不断刷屏并了解你的短期喜好,但它们通过利用你大脑中的机制,往往会覆盖你的长期利益)。
然后让超级智能变得便宜、广泛可用,避免过度集中在少数人、公司或国家手中。社会有适应能力、创造力和恢复力。如果我们能利用集体智慧,即使会犯错误,有些事情会出错,但我们能快速学习和适应,最大化技术好处,最小化坏处。在社会共同设定的广泛边界内,给用户充分自由似乎很重要。世界越早开始讨论这些边界和如何定义集体一致性,就越好。
整个AI行业正在为世界打造一个“大脑”。它会高度个性化,人人易用;我们将只受好创意的限制。长期以来,科技创业圈常嘲笑“点子人”——那些有想法但需要团队实现的人。现在看来,他们即将迎来自己的黄金时代。
OpenAI现在涉足多个领域,但首先,我们是一家超级智能研究公司。我们面前有很多工作,但大部分路径已经清晰,未知区域正在迅速减少。我们非常感激能做现在的工作。
便宜到几乎免费的智能已经触手可及。这听起来可能很疯狂,但如果我们在2020年告诉你我们今天的成就,那可能比我们对2030年的预测听起来更疯狂。
愿我们能平稳、快速且平安地通过超级智能时代!
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。