今年的政府工作报告提出,提高科技创新支撑能力。稳定支持基础研究和应用基础研究,引导企业增加研发投入。两会期间,提高科技创新支撑能力、加速人工智能应用落地成为代表热议的话题。
全国人大代表丁国林为人工智能进言献策:“我们要增强紧迫感和使命感,推动关键核心技术自主创新突破,以互联网思维探索人工智能技术转化运用,用主流价值导向驾驭‘算法’,。”
丁国林表示:“为适应信息主体视听化、网络视频爆发期大势,要更加有力推动AI影像技术的应用,更加精准促进媒体融合转型,更加迅速占领信息传播制高点,一是大力扶持相关技术企业,出台针对性减税降费政策;二是积极开放应用场景空间,合力做强媒体融合国家战略;三是成立产学研一体联盟,共同推动技术进步和业务应用。”
随着5G技术的大规模商用,视频流量将呈指数级增长,视频化表达已是大势所趋。但当前,我国媒体转型与发展正面临着发展瓶颈,主要表现在:低效率的视频生产方式制约了传统媒体向融媒体、智媒体转型;海量化的视频生产规模使内容审核更加复杂困难。
丁国林认为,AI 影像技术的赋能加持可以有效解决传统媒体发展瓶颈,也是实现媒体融合发展战略的必由之路。
目前,AI影像技术对于媒体融合潜力巨大、前景广阔,主要作用有5个方面:一是自动化生产,融合多模态图像识别、情感语境、关键帧捕捉等关键技术,自动化生产全新视频,极大缩短工时、降低成本;二是智能化识别,基于数据快速处理、视频智能识别,有效解决镜头提取准确率不高、类型识别不准、通用性差等问题;三是数据化挖掘,通过人工智能技术,盘活持续性海量视频资料,使其可搜索可随需提取,实现价值最大化;四是结构化服务,提供精确到帧的自动化视频结构化服务,实现视频、图片、声音等内容自动合规性审核;五是个性化推送,分析理解观众兴趣偏好,视频输出从常规单向输出变为按需求输出,更加贴合观众需求。
实际上,国内已经有企业正在利用AI影像技术服务于国家的“媒体融合”战略。作为国内典型的智能影像技术系统的开发者及提倡者,影谱科技(Moviebook)的智能影像系列方案可支持大批量数字内容视频化,融合多模态图像识别、情感语境、关键帧捕捉等关键技术,实现影像生产过程的自动化,提升视频生产效率,降低生产成本,在文娱、媒体、科教等行业得到大规模商用,并使影谱科技迈入中国计算机视觉市场第一阵营。
影谱科技创始人姬晓晨表示,“影像内容将是继文字、图片之后的主要信息载体,随着信息视频化提速,影像内容产制播将进一步向个性化和智能化演进,智能影像与机器影像并存。智能影像技术在流媒体领域的充分应用将推动‘个性化和互动性的智能内容将成为重要组成部分’,并已达到大规模应用的临界点”。
据悉,影谱科技开发了一套AI生成无限视频内容的技术引擎AGC,该技术可基于用户的喜好及技术应用者的需求自动生产符合场景需求的短视频、视频内片段、虚拟主持人等AI智能影像。该技术在很大程度上缓解了高质量内容生产力不足的情况。与单一业务流应用略有不同,Moviebook影谱科技聚焦于从内容创建到分发,形成以元数据为基本单位的一站式智能影像技术服务。面向传媒企业提供包括批量化创建智能影像、视频资产管理与分析、智能影像运营、再到智能视频商业化的全过程。
AI影像技术已成为人工智能在媒体领域的应用标杆之一,不仅能创建及优化内容本质,它还可以在定义“技术如何快速落地”方面发挥重要作用。除此之外,智能影像技术仍然充满了各种可能性。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。