曾几何时,在孩子们的童年还没有被各类智能手机和电脑游戏所占领的年代,父母和长辈们会不时兴致勃勃地把尚且年幼的孩子叫到跟前,出一些字谜让他们猜,而后饶有兴致地分享各类字谜的解法。随着时代的车轮不断向前,猜字谜这项有趣的中国传统民间文化逐渐消失在了人们的视野中。现在,我们很难有机会在除了元宵节之外的日子体验猜字谜游戏的乐趣。即便能够体验,现代的青年人恐怕在面对各类字谜时,也会显得无从下手吧。
元宵节当天,微软亚洲研究院在已有的微软对联平台上推出了一个新功能——微软猜字谜。当用户输入谜面后,系统自动分析谜面,而后迅速给出谜底。更有趣的是,这款系统还可以为用户自动生成谜面。当用户输入谜底(单个字)后,系统可自动生成若干谜面供用户选择。
字谜是中国文化独有的内容,是以一个或几个汉字为谜底的谜语。这种谜语的编写或是利用了汉字的造字规律,或是利用了汉字形、音、义某一方面的特点,既有趣味,又有知识内涵。根据谜面的不同,字谜可分为:字形谜、字义谜、典故谜等多个类别。由于中国字义谜和典故谜的构成更为复杂,此次微软亚洲研究院推出的计算机自动猜字谜系统主要针对的是字形谜,即谜面是根据谜底(一个字)的字形而设计的。
这款字谜系统由微软亚洲研究院自然语言计算组开发,耗时四个月。开发这样一个系统,研究人员需要首先进行大量的数据挖掘工作,并从收集到的大量字谜中挑选出字形谜。而后建模,用统计机器学习的方法对模型进行训练,得到一个能将各类自然语言描述转化为特定偏旁部首的优化模型。最后,将得出的各类偏旁部首映射到有可能的字,即谜底。在这款字谜系统的页面中,我们不仅在输入字形谜的谜面后可以看到最佳答案,而且还可以看到推理的过程,这对于猜字谜的思维训练是非常有帮助的。
自然语言计算组负责人,微软亚洲研究院首席研究员周明是机器翻译和自然语言处理等领域的专家,曾主导了微软对联系统的开发。他表示:”猜字谜是在微软对联系统之后,我们对人工智能的又一个有意义的尝试。这些创新集中体现了NLP 2.0的战略思想,即对基于互联网的平台,对大数据进行搜集、利用统计机器学习方法自动学习建立智能模型、然后快速上线获得用户反馈从而把用户引入到创新的过程之中。猜字谜系统的水平也会不断提升“。
当然,推出这款基于字形谜的计算机自动猜字谜系统仅仅是个开始,微软亚洲研究院的研究员们还将继续深入研究,推出包括更多类型的字谜系统,以及扩展到字谜之外的其他类型的谜语。
好文章,需要你的鼓励
这项由Snowflake AI Research发表的研究挑战了传统语言学对大型语言模型的批评,通过引入波兰语言学家Mańczak的理论框架,论证了LLM的成功实际上验证了"频率驱动语言"的观点。研究认为语言本质上是文本总和而非抽象系统,频率是其核心驱动力,为重新理解AI语言能力提供了新视角。
freephdlabor是耶鲁大学团队开发的开源多智能体科研自动化框架,通过创建专业化AI研究团队替代传统单一AI助手的固化工作模式。该框架实现了动态工作流程调整、无损信息传递的工作空间机制,以及人机协作的质量控制系统,能够自主完成从研究构思到论文发表的全流程科研工作,为科研民主化和效率提升提供了革命性解决方案。
德国马普智能系统研究所团队开发出专家混合模型的"即时重新布线"技术,让AI能在使用过程中动态调整专家选择策略。这种方法无需外部数据,仅通过自我分析就能优化性能,在代码生成等任务上提升显著。该技术具有即插即用特性,计算效率高,适应性强,为AI的自我进化能力提供了新思路。
Algoverse AI研究团队提出ERGO系统,通过监测AI对话时的熵值变化来检测模型困惑程度,当不确定性突然升高时自动重置对话内容。该方法在五种主流AI模型的测试中平均性能提升56.6%,显著改善了多轮对话中AI容易"迷路"的问题,为构建更可靠的AI助手提供了新思路。