
著名物理学家斯蒂芬·霍金(Stephen Hawking)昨晚出席了美国HBO频道的“Last Week Tonight”节目,并与主持人约翰·奥利弗(John Oliver)展开了深刻而有意义的对话(至少霍金的谈话是深刻而有意义的),并认为机器人可能“比我们聪明”。
当奥利弗问及霍金他最希望人们能够理解什么事情时,霍金回答说:“虚时间(imaginary time)。”
他说道:“虚时间就像是宇宙空间中的另一个方向,这是我的作品中还未被科幻小说家使用过的一则假说。”
说实话,尽管所有的科幻小说只是在科学家的作品中加入了血和性等元素,那为什么没有科幻小说作家在虚时间的基础上创作故事呢?霍金说道:“他们不理解虚时间。”
当然,笔者也不能假装理解什么是虚时间。无论如何,它是一种与时间有关的东西,与每天侵蚀我们的时间朝着不同的方向运行。
不过,奥利弗最希望了解的是人工智能。与众多人工制成品一样,人工智能对人类而言也可能是有害,甚至是致命的。
霍金对此非常肯定:“人工智能在并不遥远的未来可能会成为一个真正的危险。”
但肯定不是在谷歌那群好男孩的掌握之下吗?霍金认为,这或许将与谷歌那些好男孩的想法无关。因为一般的机器人可以“进行设计改进它自己,使得它们自己比我们所有人都更聪明。”
奥利弗继续问道:“那为什么我不应该为能够与机器人战斗而感到兴奋呢?”
霍金给出的回答很干脆:“你会输掉。”
奥利弗开始担心之前根本不是霍金在与他谈话,而有可能是一个充满智慧的计算机在同他问答。霍金(或假装霍金的机器人)回答说:“你是个白痴”。
但这难道不是人类的本质吗?尽管我们认为我们什么都知道,至少当我们对自己诚实时,我们最清楚的一件事就是——我们都是傻瓜。我们所不知道的要远远超过我们所做到的。
事实上,考虑到世界上可能有很多平行宇宙,奥利弗怀疑是不是在某个平行宇宙里,他可能会比霍金聪明。
“是的,”霍金回答道,“而且还有一个宇宙,在那里你很有趣。”
好文章,需要你的鼓励
本文介绍了由南方科技大学等机构于2026年4月发表的研究(arXiv:2604.08865),提出了名为SPPO的大模型推理训练新方法。该方法将推理任务重新建模为"序列级情境赌博机",用一个轻量级价值模型预测题目难度,以单次采样替代GRPO的多次采样,解决了标准PPO的"尾部效应"问题。实验显示,SPPO在数学基准测试上超越GRPO,训练速度提升约5.9倍,配合小尺寸价值模型还能显著降低显存占用。
这项由香港科技大学数学系完成的研究(arXiv:2604.10465,2026年ICLR博客论文赛道)提出了一种从朗之万动力学视角理解扩散模型的统一框架。研究指出,扩散模型的前向加噪和逆向去噪过程,本质上是朗之万动力学这一"分布恒等操作"被拆成了两半。在这个视角下,VP、VE-Karras和Flow Matching等不同参数化的模型可被精确互译,SDE与ODE版本可被统一解释,扩散模型相对VAE的理论优势得以阐明,Flow Matching与得分匹配的等价性也得到了严格论证。
中国人民大学高岭人工智能学院等机构联合开发了AiScientist系统,旨在让AI自主完成机器学习研究的完整工程流程,包括读论文、搭环境、写代码、跑实验和迭代调试,全程无需人工干预。系统核心设计是"薄控制、厚状态":由轻量指挥官协调专业代理团队,通过"文件即通道"机制将所有中间成果持久化存储,使每轮工作都能建立在前一轮积累的基础上。在PaperBench和MLE-Bench Lite两个基准上,系统表现显著优于现有最强对比系统,论文发布于2026年4月。
这项由字节跳动发布的研究(arXiv:2604.13030)提出了生成式精化网络(GRN),一套模仿人类画家"边画边改"直觉的视觉生成新框架。其核心包括两项创新:层级二进制量化(HBQ)通过多轮二分逼近实现近乎无损的离散图像编码,以及全局精化机制允许模型在每一步对整张图像的所有位置重新预测并随时纠错,从根本上解决了自回归模型的误差积累问题。配合基于熵值的自适应步数调度,GRN在ImageNet图像重建(rFID 0.56)和生成(gFID 1.81)上均创下新纪录,并在文本生成图像和视频任务上以20亿参数达到同等规模方法的领先水平。