艺术品的归类与分析向来以困难著称,只有极少数专业人士拥有发言权,人工智能在这一领域的应用更是长期空白。但最近,已经有多个研究小组做出尝试,希望将机器学习与大型艺术品数据库相结合,以有意义的方式对作品做出分类与描述。
首先,来自杭州的浙江工业大学研究人员对多种神经网络做出比较,希望了解它们在艺术品归类方面表现如何。他们使用来自WikiArt及其他数字馆藏的图像进行神经网络训练,帮助模型了解特定艺术流派所对应的画作拥有哪些共性。以此为基础,他们进一步尝试使用不同神经网络模型识别其他画作的艺术风格。
很明显,这项工作即使对人类来说都颇为困难。一部分画作在绘制方法上有着非常强烈的风格与流派特征,相对更容易识别。对于神经网络来说,找出归属于立体主义流派的作品并不是问题;真正的问题在于,某些流派之间非常相似,甚至在绘画过程中的呈现点位也高度一致,导致程序很难做出准确判断。
▲ 在德国柏林一场展览中亮相的文森特·梵高的《星空》。人工智能也在研究中使用这幅作品尝试进行艺术流派归类
此外,艺术归类神经网络还面临着很多完全影响不到人类的微小细节,例如,区分城市景观与自然景观间的差异。人类无需任何思考,就能指明建筑物与自然风光间的区别;但在计算机看来,二者似乎都代表着典型的“户外”元素,而界定户外的关键特征“云”与“天”并不能帮助模型真正看懂画面内容。
对于人类艺术爱好者,了解一件艺术品属于哪种流派或者类别,属于一种相对直接而且客观的判断。与神经网络类似,我们可以观看大量艺术品并从中寻找同流派作品的共通模式。但相较于人类,计算机却很难更进一步:形成对于艺术的自主观点,并用言语分享观看时产生的感受。但到底只是更难,还是根本不可能?
人工智能的根基源自训练数据。因此,要教会AI形成关于艺术风格的观点与情感陈述,我们还需要投入大量人工,建立起关于不同艺术品的描述内容。斯坦福大学、巴黎综合理工学院以及阿卡杜拉国王科技大学的研究人员们决定做出尝试,他们创建起ArtEmis数据集,其中包含超过40万项情感属性以及整理自WikiArt的超过8万张画作的描述信息。
为了创建ArtEmis数据集,研究团队要求志愿者们分享自己对于艺术品的直观感受,并用语言做出评述。可以想见,人们对于相同作品往往有着截然不同的感受。您眼中安详宁静的田野画面,在我眼中可能压抑而阴郁。实际上,这种对同一幅画作做出正面与负面感受的情况非常普遍,在ArtEmis数据库的全部画作中占比高达61%。
接下来就看AI的表现了。在接受ArtEmis数据集的训练之后,各AI系统开始尝试为给定的艺术品生成标题。其中一些结果颇具说服力,当然也有不少完全是驴唇不对马嘴。例如,AI对伦勃朗的画作《被斩首的施洗约翰》做出的描述包括“女性看起来很开心”及“中间位的男性看起来很痛苦”。结合画面中的场景,这很明显是在胡说八道。
▲ 某AI算法会根据从画面中识别出的人类情感生成图像描述。此算法在描述伦勃朗的《被斩首的施洗约翰》时提到“女性看起来很开心”、“中间位的男性看起来很痛苦”
但好消息是,计算机生成的描述中约有半数通过了图灵测试,意味着AI确实可以学会生成令人信服的原创艺术品描述。但目前的情况还远不够完美,毕竟神经网络连准确判断画中是自然风光还是城市景观都有困难。
必须承认,不少艺术品本身天然难以归类,人们对绘画的观点也具有很强的主观性,这就导致人工智能更难理解我们的归类与描述方式。但此次最新研究表明,计算机在某些任务的处理方面一直在进步。也许与人类的艺术品归类与描述能力仍然无可匹敌,但AI程序已经迈出了追赶的脚步!
好文章,需要你的鼓励
这项研究提出了"高效探测"方法,解决了掩码图像建模AI难以有效评估的问题。通过创新的多查询交叉注意力机制,该方法在减少90%参数的同时实现10倍速度提升,在七个基准测试中均超越传统方法。研究还发现注意力质量与分类性能的强相关性,生成可解释的注意力图谱,展现出优异的跨域适应性。团队承诺开源全部代码,推动技术普及应用。
伊利诺伊大学研究团队开发了CLAIMSPECT系统,通过层次化分解复杂争议、智能检索相关文献、多角度收集观点的方法,将传统的"真假"判断转变为多维度分析。该系统能够自动构建争议话题的分析框架,识别不同观点及其支撑证据,为科学和政治争议提供更全面客观的分析,已在生物医学和国际关系领域验证有效性。
清华大学研究团队首次提出情感认知融合网络(ECFN),让AI能像人类一样理解和表达情感。该系统通过多层次情感处理架构,在情感识别准确率上比现有最佳系统提升32%,情感表达自然度提升45%。研究突破了传统AI情感理解的局限,实现了跨模态情感融合、动态情感追踪和个性化情感建模,为医疗、教育、客服等领域带来革命性应用前景。
哈佛大学研究团队通过创新的多智能体强化学习方法,让AI在战略游戏中学会复杂推理。研究发现AI通过游戏竞争能发展出类人思维能力,在逻辑推理、创造性解决问题等方面表现显著提升。这项突破性成果为未来AI在医疗、教育、城市管理等领域的应用奠定基础,展现了通过模拟人类学习过程培养真正智能AI的新路径。