作者:高飞
1. CCTV宣布了春晚的吉祥物海报,这次倒是没有人说“设计得丑”,但是有很多人说“看起来是AI设计的”。这可比说“设计得丑”还严重,说“丑”顶多是水平差,说“是AI生成的”,那就是造假了。“真的差”肯定比“假的好”强一点,这是大家的共识。比如,五月天被怀疑在演唱会上假唱就很严重,但伍佰不唱就没问题。
2. 我相信,这套图肯定不是AI设计的,因为犯不上。以央视的体量,和春晚的名头,一不差预算,二不差有人愿意义务劳动。后来CCTV也公布了设计师的草图,证明其是人类劳动。
3. 不过,如果大家看一下设计,可能也会和很多质疑的人产生同感,第一眼确实AI味儿很浓。从色彩到轮廓,充满了“夫妻肺片”感。所以,为什么明明是人类设计的,却看着像AI?
4. 因为我们走向了一个误区。从OpenAI的宫斗开始,有一个词就流行开来,叫「对齐」——意思是怕机器的价值观不正确,以及会产生幻觉,所以应该花大力气,让AI和人类对齐。
5. 但实际上,从人类艺术创作史来看,人类其实一直是向机器对齐的。拿文艺复兴来说,很多画家是极擅长透视的。但是当下身价最高的画家,大卫·霍克尼写了一本书叫《隐秘的知识》,其中认为15世纪之后的很多知名画家,根本不是用眼睛画画的,而是用光学设备,在画布上做投影画画的。简单的说,就是对着影子描边。
6. 那是不是印象派看起来不透视,就不受机器影响了呢?当然不是,后来,技术机器对艺术的影响就更大了。在照相机发明之后,人类在画画的时候,就知道不用再把人物都顶着边框画了,而是可以裁边的,这就是照相机边框带来的影响。见下图左边的半个人,这是典型的照相机构图造成的裁边。
7、所以,我总结一下结论。因为机器造物效率太高了,我们很快就会被机器所造之物围绕,从起床睁眼开始,我们看到的一切东西,只要不是生物,绝大多数都会是AI所造。不信的人回想一下,我们能看到多少手绘的画,多少手机拍摄的照片?
8、再所以,一旦机器所造之物流行于人类社会,我们就不要奢望让机器对齐人类了。技术机器会创造其独有的文化、风格、价值观,不知不觉地影响人类。
9、回到开篇说的央视春晚吉祥物海报。它设计的确实是很像AI,但是这不是因为它是AI设计的,而是设计它的人,或许不知不觉受了AI风格的影响。而对于普通人而言,也因为看了太多的AI创作,就会想当然的看什么都像AI。
10、2022年,毫无疑问是一个分水岭。从那一刻开始,真和假的界限将不再清晰,什么属于人类,什么属于机器也不再确定。今年,几次和老朋友微软中国CTO韦青交流,他说现在我们到了一个假的比真还真的时代。
11、昨天Google说自己的Gemini在大规模多任务语言理解中超过了人类专家《Gemini:我们规模最大、能力最强的 AI 模型》。我们要珍惜机器智能还要靠人机PK来证明自己的最后时光。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。