
科技行者 4月19日 北京消息 考虑到将给整个人类社会带来的深远影响,目前关于人工智能以及机器学习的讨论可谓如火如荼。但除此之外,利用神经网络进行艺术创作也开始快速兴起,目前人们正积极训练算法以绘制人脸、烟花甚至是人体艺术作品。尽管看似愚蠢,但这种另类的尝试确实能够帮助我们更透彻地理解人工智能技术。
现居慕尼黑的谷歌公司艺术家Mario Klingemann正在Twitter上持续发布一项有趣的神经网络实验。他以几乎实时方式展示其利用各类数据训练而成的神经网络,而得出的结果往往令人捧腹不止——特别是在算法尝试绘制人脸时。然而,这也正是此项实验的重点所在:通过观察神经网络如何“傻傻”地进行学习,我们将能够一窥人工智能艺术创作的基本思路。
目前,Klingemann专注于使用1900年以前的油画肖像。他利用英伟达的pix2pixHD算法配合1900年之前的画作照片构建起一款写实派人脸生成器,并利用数千幅欧洲艺术家作品对其进行训练。而最终得出的人脸绘制结果则在真实与可笑之间往来游移。
Klingemann在接受邮件采访时表示,“纵观整个艺术发展史,可以清楚地看到自文化启蒙以来,人们就对艺术沉迷不已。我想其中的一大重要原因在于,面孔的绘制既简单但又可以极为复杂——我们可以画出一张简单可辨的面孔,也可以努力重现每个毛孔的具体细节。最困难的冷媒是,每个人都是人脸识别方面的专家,我们会注意到表情中的细微变化,并轻松发现极为细微的比例失调问题。这意味着如果绘制或者说生成一张人脸之后,这种轻微变化所引发的影响将很快被人们所发现。”
那么,我们该如何对人类画作与神经网络的作品进行区分?
乍看之下,我们似乎难以判断。但在仔细观察之下,大家就会发现神经网络的作品中存在着一些奇怪之处——包括黑色的左眼右手部分胡须状的阴影。对于Klingemann来说,让神经网络绘制出真正的好作品绝对是一大挑战——就目前而言,其表现还无法令人满意。他指出,“我能够轻松判断出这套模型的能力水平,特别是在细节方面,因为任何错误都会引发一些不可思议的内容。”他同时承认,由于该模型的训练素材主要为几百年前的欧洲中年男性及年轻女性画作,因此大部分人物面部都白得过分——他正在寻找更多图像来源以丰富自己的训练数据集。
在Klingemann看来,训练神经网络的过程亦是一项艺术挑战,换言之同时要求人类与机器发挥自身创造性。他解释称,“构建面部生成器就像开发故事生成器一样。每张面孔或者一组面孔都会引发相应的联想、问题甚至是情绪。当然,机器在处理这类任务时往往会带来令人意想不到的结果。”
事实上,通过此轮实验,他发现生成十九世纪油画风格的肖像要比创造写实派风格的肖像简单得多。他指出,“当我们观看画作时,往往会对那些看起来不太准确的部分更为包容。这是因为我们会考虑这可能是艺术家们有意为之。”毕竟,有很多画作都存在着解剖学原理层面的问题,这会进一步缩小人类作品与机器作品间的差异。
以《荆冕耶稣像》为例,这是一幅诞生于1930年的拙劣耶稣画像,并在2012年因其奇异的风格而在网络上名震一时。Klingemann创作出了自己的绘画算法版本,其拥有着与原作一样令人毛骨悚然的风格——但同时又相当搞笑。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。