
作者| 金旺
栏目| 具身资讯
近日,在民营企业座谈会上,宇树科技创始人王兴兴指出,“今年年底之前,整个AI的人形机器人会达到一个新的量级。”
作为国内人形机器人明星企业,在2024年9月完成C轮融资后,宇树科技估值已经突破80亿元。
不过,宇树科技的人形机器人真正在大众层面得到广泛认知,是在今年春晚上。
在今年春晚上,宇树科技16台人形机器人H1与新疆艺术学院舞蹈演员表演的舞蹈节目《秧BOT》,作为今年春晚的特色之一,迅速让人形机器人闯入大众视野。
与此同时,人形机器人在人工智能技术加持下,确实在以肉眼可见的速度发生着改变。
01 机器人跳舞太“丝滑”,被质疑为AI生成
近日,一个宇树人形机器人G1的跳舞视频在网上爆火,在视频中,从机器人跳舞的稳定性、流畅度,以及自然程度上来看,都很难想象是现阶段人形机器人能够实现的能力。
毕竟,宇树人形机器人在春晚舞台上还曾因被舞蹈演员“扶着”下台被主持人调侃。
这段人形机器人跳舞视频发布后,在视频平台上被算法识别并自动打上了“疑似使用AI技术生成”的提醒标签。
为了证明人形机器人跳舞的真实性,宇树科技官方昨日在视频平台上又更新了一个视频,视频中,宇树G1跳的依然是之前的舞蹈,不同的是,镜头侧面放置了一面全身镜实时显示周边环境,并时不时由旁边的员工给他丢个球、来两下,进行干扰。
在这则视频中,宇树科技官方也对上一个视频中提到的“算法升级,任意舞蹈任意学”的说法给出了解释:
“最近几天刚开发好的功能,还没有推送给客户,不同型号版本的机器人功能也有差异。”
这一方面证实了机器人跳舞的真实性,另一方面也对客户手中的机器人没有这个功能给出了一个交代。
据悉,宇树科技的人形机器人在今年登上春晚后不久,就曾直接在京东平台上开售H1和G1两个型号的人形机器人,前者售价65万元,预计60天交货,后者售价9.9万元起售,预计45天交货。
然而,这两款产品在上线不久后就进行了下架,如今依然需要通过官方渠道进行购买。
值得注意的是,宇树科技这款人形机器人此前在京东线上页面显示整机重约35kg,身高127cm,续航为2—4小时,主要面向场景为娱乐陪伴。
对于希望在2025年实现量产的人形机器人产业而言,面向消费市场的娱乐陪伴场景,显然是一个更广阔的量产市场。
不过,王兴兴在近日接受媒体采访时指出:
“今年年底之前,整个AI(驱动)的人形机器人会达到一个新的量级,如果顺利的话,诸如服务业、工业等基础场景到明后年就可以推起来了,但家用(场景)会慢一点,因为家用对安全性的要求更高,需要技术相对更成熟一点。”
02 人形机器人产业继续竞速
在宇树人形机器人登上春晚,马斯克号称Optimus将要量产的2025年,人形机器人仍在竞速。
就在近日,我们看到,美国人形机器人明星企业Apptronik官宣融资3.5亿美元(约25.5亿元),国内也有初创公司灵宝CASBOT完成了亿元天使轮融资。
在技术迭代方面,逐际动力近日发布了LimX VGM具身机器人操作算法,据官方公开资料显示,这是一个基于视频生成大模型的具身操作算法,通过人类操作视频数据对现有的视频生成大模型进行后训练,仅需将场景图片和操作任务指令作为提示Prompts,即可实现任务理解与拆分、物体操作轨迹生成以及机器人操作执行的全流程,全过程零真机样本数据,并且可实现多平台泛化。
加速进化Booster T1也在近日公开了耐用性和撞击测试视频,在官方公开的视频中,Booster T1人形机器人在表演完“胸口碎大石”后,依然可以再次起身。
不过,在这一系列人形机器人企业融资、技术创新背后,人形机器人产业竞争也在加剧。
2025年不仅是人形机器人步入量产的关键一年,也将会是人形机器人大浪淘沙的一年。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。