科技行者 1月13日 北京消息:好莱坞各大电影制片厂,在筹备与制作新的电影作品时,正越来越多将AI技术纳入决策流程。
如果你对好莱坞大片的套路感到缺少惊喜甚至已经审美疲劳,电影业本身无疑更清楚这一点。最近,电影业巨头华纳兄弟已经与Cinelytic公司签署一基协议,由后者开发一套AI驱动型系统,负责根据演员、预算以及品牌等因素,预测电影获得市场成功的可能性。
可以遇见的是,华纳兄弟也将在电影制作甚至是立项之前,就将Cinelytic的软件引入整个讨论过程。Cinelytic的平台能够确定每位演员在全球各个地区的“价值”(即市场吸引力),同时计算电影作品在院线上映以及周边销售(例如发行DVD)所能带来的潜在收入。
虽然AI技术显然无法准确衡量电影的艺术水平,但华纳兄弟方面的想法也很单纯——在早期制作阶段引入这类方案,尽快剔除那些最不可能获得市场好评的方案。曾经,华纳兄弟在《正义联盟》与《小飞侠》等影片项目中损失惨重,《蝙蝠侠大战超人》等影片也未能达到预期的市场表现。
另外,华纳兄弟似乎也并不是唯一一家打算把AI技术纳入决策流程的电影制片厂。以往,制片厂已经对于AI有所应用,只是重视度不够。华纳的积极举动,很可能在行业内掀起一波拥抱AI的高潮。
例如,早在前几年,二十世纪福克斯公司就已经在使用Merlin系统。与Cinelytic平台不同,Merlin主要利用AI与机器学习(配合大数据)将特定影片与特定类型的观众进行匹配。Merlin系统的工作原理,是利用计算机视觉技术对电影预告片进行逐帧分析,在标记预告片中出现的各个对象与事件之后,它就能建立起与影片本身对应的数据,并据此与其他电影数据进行比较。例如,Merlin系统可能会发现最新预告片在观感上很像原先的电影甲、乙、丙,而这些片子都很受女性青少年观众的喜爱。
通过数据集比较,Merlin帮助二十世纪福克斯公司确定了每一部电影的理想受众目标。除了将电影预告片与传统风格流派对应起来之外,Merlin系统还能帮助制片厂决定如何对新片进行宣传与归类。
除了华纳兄弟以及二十世纪福克斯之外,其他电影制片厂与制片公司可能也已经建立起自己的AI转型计划,只是目前还没有正式公开。例如,来自比利时的ScriptBook公司就在利用AI技术分析电影剧本,并据此计算最终可能实现的票房收入。除此之外,ScriptBook的平台甚至能够对电影角色、目标受众画像甚至是潜在的IMDB得分给出预测意见。
根据ScriptBook公司CEO Nadira Azermai的介绍,该系统已经拥有相当成熟的发展水平,能够以86%的准确率为每一部电影提供收入预测支持。从另一个角度来看,尽管没有公开任何制片厂或者公司名称,ScriptBook方面无疑已经在与电影行业的客户开展合作。
ScriptBook公司成立于2015年,算是这一新兴领域中的重要力量。不过随着基于AI型电影预测业务的不断发展与推进,更多从业企业可能会在未来几年内快速出现。去年8月,来自韩国成均馆大学的研究人员透露,他们正在利用深度学习技术训练机器人,尝试根据描述电影情节的剧本摘要预测电影获得市场成功的可能性。他们根据42306部电影的情节摘要对机器人进行了训练,并最终发现其能够很好地预测哪些电影无法得到市场认可。
相比于发现经典电影,该机器人明显更擅长识别出“垃圾电影”,这确实令人感到振奋。毕竟除了担心AI的大量涌入导致好莱坞电影工业继续保持自我重复的老路之外,各大制片厂也有希望刻意控制AI的应用范围,或者说单纯利用它保证影片不至于票房惨败。以此为基础,人类编剧可能会获得更大的决策与创造力空间,保证他们可以把精力更有针对性地投入到有望获得商业成功的方向上。
另外,AI技术的介入也有可能弱化好莱坞电影作品的同质化倾向。举个简单的例子,超级英雄电影的巨大成功可能导致:虽然单部影片的回报越来越低,但人类制片方还是更愿意拍板立项类似的影片制作计划。相比之下,利用大量更新数据进行定期训练的AI平台则更加更改,从而排除制作新的蝙蝠侠或者超人电影、选择其他真正更具成功可能性的影片类型。
也就是说,AI平台也许会以更具说服力的方式敦促制片厂调整自身艺术取向或者电影风格。如果实际情况真是如此,那么电影评论家与爱好者们倒是不必担心AI入侵的危害,反而可以期待电影行业在新兴技术支持下迎来又一轮百花齐放的新浪潮。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。