微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 搜狗AI技术再迎突破,全球首个3D AI合成主播发布

搜狗AI技术再迎突破,全球首个3D AI合成主播发布

2020-05-21 15:05
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2020-05-21 15:05 科技行者

5月21日,搜狗联合新华社推出的全球首个3D AI合成主播“新小微”正式亮相,为全国观众带来最新的两会新闻资讯报道。基于搜狗人工智能核心技术“搜狗分身”打造的“新小微”,将拉开中国传媒行业全面进入智慧时代的序幕。

搜狗分身技术再突破,带领AI合成主播进入3D时代

作为AI合成主播的开创者和引领者,自2018年基于搜狗分身技术推出全球首个AI合成主播后,搜狗分身持续取得重大突破,此次的3D AI合成主播就是搜狗分身最新的突破性成果。

“新小微”以新华社记者赵琬微为原型,基于超写实3D数字人建模、多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前沿技术,使机器可以基于输入文本生成逼真度极高的3D数字人视频内容。

3D AI合成主播结合了原力科技提供的业界领先的扫描还原、面部肌肉驱动、表情肢体捕捉等技术,生产出了高度还原真人发肤、形象逼真的数字人模型;同时基于搜狗分身领先的端到端多模态建模技术,使用语音、图像、文本、3D肌肉运动数据等多模态信息完成联合建模训练。在AI算法的驱动下,只需输入文本内容,“新小微”就能根据语义实时播报新闻,其表情唇动、肢体动作和语音表达高度契合、自然逼真。

从2D到3D,搜狗AI持续引领融媒体应用创新

搜狗推出全球第一位AI合成主播后,通过不断迭代更新使AI合成主播具备了多语种播报、对话交互等诸多能力,用最前沿的技术能力和产品效果,不断推动传媒行业内容生产的效率变革。据统计,首位 AI 合成主播“新小浩”已在新华社客户端上持续为观众服务500 多天,先后产出13,000多条新闻报道,累计时长超过35,000分钟。

较之前的2D AI合成主播,3D“新小微”不仅立体、灵活,可控,还具有同时支持多机位多景深,360°任意角度呈现内容等能力,在应用空间上拥有更多的可能性,为新闻节目多样化制作和呈现带来了更多选择。

5G时代,搜狗分身技术应用将全面爆发

从最初的2D到今天的3D AI合成主播,其背后不仅仅是搜狗分身技术的一次次突破迭代,更体现出人工智能驱动传媒行业生产效率与生产流程的不断革新。不仅减轻了行业从业者的重复性工作,更让相关工作“拟人化”、“生动化”,让传媒新闻播报更加有趣,更具现场性。不久的将来,3D AI合成主播还会走出演播厅,支持外景播报和互动采访,为观众带来最前沿的新闻讯息。

在5G全面铺展的新技术时代,随着分身技术落地经验的不断积累以及产品技术的突破创新,搜狗分身也会从传媒领域出发,快速向影音娱乐、医疗健康、教育金融等众多领域蔓延辐射,持续推动大众智能生活的建设。

分享至
0赞

好文章,需要你的鼓励

推荐文章
  • 奖励设计:让AI学会智能使用工具的关键
    2025-04-23 17:39

    奖励设计:让AI学会智能使用工具的关键

    想象一下,你有一个非常聪明的朋友,他知道很多知识,但每当需要使用计算器、搜索引擎或查询最新天气时,却变得像个笨手笨脚的孩子。这正是当前大语言模型(简称LLMs,如ChatGPT这类AI系统)面临的尴尬处境。

  • ToolRL:奖励设计是工具学习所需的全部
    2025-04-23 17:34

    ToolRL:奖励设计是工具学习所需的全部

    想象一下,你拥有一个聪明的助手,它知道很多知识,但在面对需要使用计算器、搜索引擎或查询最新信息时却显得笨手笨脚。这正是当前大语言模型(LLMs)面临的困境。虽然这些模型已经通过监督微调(SFT)学会了使用工具的基本能力,但它们常常在面对复杂或不熟悉的场景时表现不佳。

  • X-Teaming:使用自适应多智能体进行多轮越狱攻击和防御
    2025-04-23 14:08

    X-Teaming:使用自适应多智能体进行多轮越狱攻击和防御

    想象你正在和一个智能助手聊天。如果你直接要求它提供有害信息,它很可能会礼貌拒绝。但如果你通过一系列看似无害的对话,逐步引导它走向你的真实目标呢?这就是当前AI安全领域面临的一个严峻挑战——多轮对话中的安全漏洞。

  • "思考操纵":用外部思考让大型推理模型更高效
    2025-04-22 16:43

    "思考操纵":用外部思考让大型推理模型更高效

    想象你在使用一个非常聪明的AI助手完成一项复杂任务,比如解决一道数学难题。你可能注意到这个助手会花很长时间"思考",一步一步写下大量推理过程,最后才给出答案。虽然这种详细的思考过程确实帮助AI做出了更准确的判断,但同时也带来了一个明显的问题:它太"啰嗦"了,消耗了大量的计算资源和时间。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-