微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

AI新技能：艺术品归类与品鉴

人工智能

AI新技能：艺术品归类与品鉴

作者：科技行者

2021-03-31 20:22

分享至：

也许与人类的艺术品归类与描述能力仍然无可匹敌，但AI程序已经迈出了追赶的脚步！

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2021-03-31 20:22 • 科技行者

艺术品的归类与分析向来以困难著称，只有极少数专业人士拥有发言权，人工智能在这一领域的应用更是长期空白。但最近，已经有多个研究小组做出尝试，希望将机器学习与大型艺术品数据库相结合，以有意义的方式对作品做出分类与描述。

首先，来自杭州的浙江工业大学研究人员对多种神经网络做出比较，希望了解它们在艺术品归类方面表现如何。他们使用来自WikiArt及其他数字馆藏的图像进行神经网络训练，帮助模型了解特定艺术流派所对应的画作拥有哪些共性。以此为基础，他们进一步尝试使用不同神经网络模型识别其他画作的艺术风格。

很明显，这项工作即使对人类来说都颇为困难。一部分画作在绘制方法上有着非常强烈的风格与流派特征，相对更容易识别。对于神经网络来说，找出归属于立体主义流派的作品并不是问题；真正的问题在于，某些流派之间非常相似，甚至在绘画过程中的呈现点位也高度一致，导致程序很难做出准确判断。

▲ 在德国柏林一场展览中亮相的文森特·梵高的《星空》。人工智能也在研究中使用这幅作品尝试进行艺术流派归类

此外，艺术归类神经网络还面临着很多完全影响不到人类的微小细节，例如，区分城市景观与自然景观间的差异。人类无需任何思考，就能指明建筑物与自然风光间的区别；但在计算机看来，二者似乎都代表着典型的“户外”元素，而界定户外的关键特征“云”与“天”并不能帮助模型真正看懂画面内容。

对于人类艺术爱好者，了解一件艺术品属于哪种流派或者类别，属于一种相对直接而且客观的判断。与神经网络类似，我们可以观看大量艺术品并从中寻找同流派作品的共通模式。但相较于人类，计算机却很难更进一步：形成对于艺术的自主观点，并用言语分享观看时产生的感受。但到底只是更难，还是根本不可能？

人工智能的根基源自训练数据。因此，要教会AI形成关于艺术风格的观点与情感陈述，我们还需要投入大量人工，建立起关于不同艺术品的描述内容。斯坦福大学、巴黎综合理工学院以及阿卡杜拉国王科技大学的研究人员们决定做出尝试，他们创建起ArtEmis数据集，其中包含超过40万项情感属性以及整理自WikiArt的超过8万张画作的描述信息。

为了创建ArtEmis数据集，研究团队要求志愿者们分享自己对于艺术品的直观感受，并用语言做出评述。可以想见，人们对于相同作品往往有着截然不同的感受。您眼中安详宁静的田野画面，在我眼中可能压抑而阴郁。实际上，这种对同一幅画作做出正面与负面感受的情况非常普遍，在ArtEmis数据库的全部画作中占比高达61%。

接下来就看AI的表现了。在接受ArtEmis数据集的训练之后，各AI系统开始尝试为给定的艺术品生成标题。其中一些结果颇具说服力，当然也有不少完全是驴唇不对马嘴。例如，AI对伦勃朗的画作《被斩首的施洗约翰》做出的描述包括“女性看起来很开心”及“中间位的男性看起来很痛苦”。结合画面中的场景，这很明显是在胡说八道。

▲ 某AI算法会根据从画面中识别出的人类情感生成图像描述。此算法在描述伦勃朗的《被斩首的施洗约翰》时提到“女性看起来很开心”、“中间位的男性看起来很痛苦”

但好消息是，计算机生成的描述中约有半数通过了图灵测试，意味着AI确实可以学会生成令人信服的原创艺术品描述。但目前的情况还远不够完美，毕竟神经网络连准确判断画中是自然风光还是城市景观都有困难。

必须承认，不少艺术品本身天然难以归类，人们对绘画的观点也具有很强的主观性，这就导致人工智能更难理解我们的归类与描述方式。但此次最新研究表明，计算机在某些任务的处理方面一直在进步。也许与人类的艺术品归类与描述能力仍然无可匹敌，但AI程序已经迈出了追赶的脚步！

人工智能

分享至

0赞

好文章，需要你的鼓励

推荐文章

英特尔
大模型

2025-09-30 15:33

数据中心的智算挑战，英特尔要如何应对？

阿里云第九代企业级ECS实例g9i不到150天服务超2万家客户，现在已有接近3万用户。
软件工程
智能体编程
人机协作

2025-09-30 14:59

Queen's大学重磅研究：程序员的角色即将彻底改变，从码农到智能体指挥官

Queen's大学研究团队提出结构化智能体软件工程框架SASE，重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者，建立双向咨询机制和标准化文档系统，解决AI编程中的质量控制难题，为软件工程向智能化协作时代转型提供系统性解决方案。
医疗人工智能
视觉语言模型
超声影像诊断

2025-09-30 14:59

医疗AI的"显微镜革命"：西北工业大学团队发布首个超声影像专用智能助手EchoVLM

西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM，通过收集15家医院20万病例和147万超声图像，采用专家混合架构，实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题，为医生提供智能辅助，推动医疗AI向专业化发展。
自回归图像生成
自监督学习
视觉理解优化

2025-09-30 14:59

上海AI实验室突破自回归图像生成瓶颈：ST-AR让AI"先理解再创造"

上海AI实验室团队发现自回归图像生成模型存在局部依赖、语义不一致和空间不变性缺失三大问题，提出ST-AR训练方法。该方法通过掩码注意力、跨步骤对比学习和跨视角对比学习，让AI"先理解再生成"。实验显示，ST-AR将LlamaGen模型的图像理解准确率提升一倍以上，图像生成质量提升42-49%，为构建更智能的多模态AI系统开辟新路径。