作者:高飞
1. CCTV宣布了春晚的吉祥物海报,这次倒是没有人说“设计得丑”,但是有很多人说“看起来是AI设计的”。这可比说“设计得丑”还严重,说“丑”顶多是水平差,说“是AI生成的”,那就是造假了。“真的差”肯定比“假的好”强一点,这是大家的共识。比如,五月天被怀疑在演唱会上假唱就很严重,但伍佰不唱就没问题。
2. 我相信,这套图肯定不是AI设计的,因为犯不上。以央视的体量,和春晚的名头,一不差预算,二不差有人愿意义务劳动。后来CCTV也公布了设计师的草图,证明其是人类劳动。
3. 不过,如果大家看一下设计,可能也会和很多质疑的人产生同感,第一眼确实AI味儿很浓。从色彩到轮廓,充满了“夫妻肺片”感。所以,为什么明明是人类设计的,却看着像AI?
4. 因为我们走向了一个误区。从OpenAI的宫斗开始,有一个词就流行开来,叫「对齐」——意思是怕机器的价值观不正确,以及会产生幻觉,所以应该花大力气,让AI和人类对齐。
5. 但实际上,从人类艺术创作史来看,人类其实一直是向机器对齐的。拿文艺复兴来说,很多画家是极擅长透视的。但是当下身价最高的画家,大卫·霍克尼写了一本书叫《隐秘的知识》,其中认为15世纪之后的很多知名画家,根本不是用眼睛画画的,而是用光学设备,在画布上做投影画画的。简单的说,就是对着影子描边。
6. 那是不是印象派看起来不透视,就不受机器影响了呢?当然不是,后来,技术机器对艺术的影响就更大了。在照相机发明之后,人类在画画的时候,就知道不用再把人物都顶着边框画了,而是可以裁边的,这就是照相机边框带来的影响。见下图左边的半个人,这是典型的照相机构图造成的裁边。
7、所以,我总结一下结论。因为机器造物效率太高了,我们很快就会被机器所造之物围绕,从起床睁眼开始,我们看到的一切东西,只要不是生物,绝大多数都会是AI所造。不信的人回想一下,我们能看到多少手绘的画,多少手机拍摄的照片?
8、再所以,一旦机器所造之物流行于人类社会,我们就不要奢望让机器对齐人类了。技术机器会创造其独有的文化、风格、价值观,不知不觉地影响人类。
9、回到开篇说的央视春晚吉祥物海报。它设计的确实是很像AI,但是这不是因为它是AI设计的,而是设计它的人,或许不知不觉受了AI风格的影响。而对于普通人而言,也因为看了太多的AI创作,就会想当然的看什么都像AI。
10、2022年,毫无疑问是一个分水岭。从那一刻开始,真和假的界限将不再清晰,什么属于人类,什么属于机器也不再确定。今年,几次和老朋友微软中国CTO韦青交流,他说现在我们到了一个假的比真还真的时代。
11、昨天Google说自己的Gemini在大规模多任务语言理解中超过了人类专家《Gemini:我们规模最大、能力最强的 AI 模型》。我们要珍惜机器智能还要靠人机PK来证明自己的最后时光。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。