曾几何时,在孩子们的童年还没有被各类智能手机和电脑游戏所占领的年代,父母和长辈们会不时兴致勃勃地把尚且年幼的孩子叫到跟前,出一些字谜让他们猜,而后饶有兴致地分享各类字谜的解法。随着时代的车轮不断向前,猜字谜这项有趣的中国传统民间文化逐渐消失在了人们的视野中。现在,我们很难有机会在除了元宵节之外的日子体验猜字谜游戏的乐趣。即便能够体验,现代的青年人恐怕在面对各类字谜时,也会显得无从下手吧。
元宵节当天,微软亚洲研究院在已有的微软对联平台上推出了一个新功能——微软猜字谜。当用户输入谜面后,系统自动分析谜面,而后迅速给出谜底。更有趣的是,这款系统还可以为用户自动生成谜面。当用户输入谜底(单个字)后,系统可自动生成若干谜面供用户选择。
字谜是中国文化独有的内容,是以一个或几个汉字为谜底的谜语。这种谜语的编写或是利用了汉字的造字规律,或是利用了汉字形、音、义某一方面的特点,既有趣味,又有知识内涵。根据谜面的不同,字谜可分为:字形谜、字义谜、典故谜等多个类别。由于中国字义谜和典故谜的构成更为复杂,此次微软亚洲研究院推出的计算机自动猜字谜系统主要针对的是字形谜,即谜面是根据谜底(一个字)的字形而设计的。
这款字谜系统由微软亚洲研究院自然语言计算组开发,耗时四个月。开发这样一个系统,研究人员需要首先进行大量的数据挖掘工作,并从收集到的大量字谜中挑选出字形谜。而后建模,用统计机器学习的方法对模型进行训练,得到一个能将各类自然语言描述转化为特定偏旁部首的优化模型。最后,将得出的各类偏旁部首映射到有可能的字,即谜底。在这款字谜系统的页面中,我们不仅在输入字形谜的谜面后可以看到最佳答案,而且还可以看到推理的过程,这对于猜字谜的思维训练是非常有帮助的。
自然语言计算组负责人,微软亚洲研究院首席研究员周明是机器翻译和自然语言处理等领域的专家,曾主导了微软对联系统的开发。他表示:”猜字谜是在微软对联系统之后,我们对人工智能的又一个有意义的尝试。这些创新集中体现了NLP 2.0的战略思想,即对基于互联网的平台,对大数据进行搜集、利用统计机器学习方法自动学习建立智能模型、然后快速上线获得用户反馈从而把用户引入到创新的过程之中。猜字谜系统的水平也会不断提升“。
当然,推出这款基于字形谜的计算机自动猜字谜系统仅仅是个开始,微软亚洲研究院的研究员们还将继续深入研究,推出包括更多类型的字谜系统,以及扩展到字谜之外的其他类型的谜语。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。