在宇树人形机器人登上春晚跳起东北二人转时,仿佛就注定了人形机器人在2025年仍将继续横扫全球市场。
这不,刚过完春节,美国人形机器人明星企业Figure AI就官宣要和OpenAI“闹分手”,紧接着是波士顿动力与前CEO成立的研究院再“牵手”。
当然,马斯克也没闲着,他则是在加紧为特斯拉招兵买马,为人形机器人量产做准备。
“机器人公司应该自己做模型”
作为美国最具名气的人形机器人公司之一,成立于2022年的Figure AI如今已经是估值26亿美元(189亿元)的准独角兽企业。
据公开信息显示,在2024年年初的融资中,OpenAI与微软、英伟达等科技巨头和投资机构一同为Figure AI提供了B轮6.75亿美元的融资。
Figure AI在美国追捧程度由此也可见一斑。
作为Figure AI研发的人形机器人产品,Figure 01曾在2024年3月搭载OpenAI大模型对外进行demo演示,彼时这一可以通过语音控制收拾杯盘、整理桌面的人形机器人demo视频一经放出,在全球范围内引起广泛关注。
随后,Figure AI不仅官宣了与宝马汽车工厂的试点合作,还宣布了第二代人形机器人Figure 02将使用 OpenAI 模型进行自然语言交流。
不过,Figure AI团队最近有了新的想法。
Figure AI创始人Brett Adcock在接受外媒采访时称,“我们发现,要想在现实世界中解决人形机器人的具身智能问题,就必须自己做人工智能技术研发,我们不能外包人工智能就像我们无法外包硬件一样。”
为此,Brett Adcock也宣布了与OpenAI的“分手”,宣布放弃使用OpenAI的大模型。
与此同时,Adcock在其社交媒体平台上还表示,Figure AI在端到端机器人AI上已经有了重大突破,将会在接下来30天里展示一些人们在人形机器人上未曾实现的能力。
这算是Brett Adcock为我们埋下了一个彩蛋,不过,努力在将人工智能技术融入人形机器人的不仅有Figure AI,几乎所有人形机器人团队都在将人工智能作为一个重要的技术研发方向。
这其中自然也包括美国老牌机器人明星团队波士顿动力。
波士顿动力为机器人注入AI
波士顿动力是美国老牌机器人团队,早在1992年由麻省理工学院脱胎,创始团队也是由Marc Raibert拉起的一支麻省理工科班团队。
波士顿动力早年间因各种机器人demo视频在YouTube上走红,因而也一直被视为机器人界的网红,不过,由于波士顿动力的机器人产品迟迟难以量产商用,在团队成立后的几年里被几经转手,先后被谷歌、软银、现代汽车收购。
在2021年6月正式被现代汽车收购时,波士顿动力创始人兼CEO Marc Raibert已经卸任离职,并在2022年8月创立了波士顿动力人工智能研究所,这一研究院后更名为机器人与人工智能研究所(RAI Institute),这一研究所的目标正是为波士顿动力机器人做基础技术研究,人工智能自然也是其中的重中之重。
就在被现代汽车收购后不久,全球迎来了人形机器人浪潮,在这波浪潮中,波士顿动力于2024年官宣转向电驱,并发布了电驱版的Atlas。
近日,波士顿动力官宣了一项与其前CEO Marc Raibert创办的RAI研究所的合作,这项合作旨在为电驱版Atlas人形机器人建立强化学习训练的共享机制,提升电驱版Atlas在动态环境中的移动操控能力。
Marc Raibert在官方声明中指出,“RAI的目标是开发支持未来智能机器的技术,与波士顿动力合作开发Atlas使我们能够在最先进的人形机器人上取得强化学习方面的进展,这项工作将在提升人形机器人的能力方面发挥关键作用,不仅可以扩展其技能,还可以简化获得新技能的过程。”
更关注机器人技术研究的Marc Raibert,正在通过人工智能技术支持波士顿动力机器人走向商业市场,不过,要说人形机器人的商业化,还要看更为激进的马斯克。
特斯拉Optimus年内要量产万台
马斯克最近也没闲着。
在1月30日的特斯拉2024年Q4业绩会上,马斯克透露,特斯拉人形机器人Optimus生产线月产能已经达到1000台,明年将建设的第二条生产线月产能将会达到10000台。
他还指出,预计今年Optimus将在特斯拉内部投入使用,负责完成工厂中最无聊、最讨厌的一系列工作,明年下半年将会面向其他公司交付产品。
为了加紧人形机器人产品量产并在特斯拉工厂中得以应用,特斯拉也在紧急招聘相关工程师,据官方挂在招聘网站上的信息显示,特斯拉目前正在为机器人团队招聘工程师、流程主管、产品经理等十多个岗位。
马斯克是这波人形机器人浪潮的关键人物,始终对人形机器人未来前景保持着乐观的态度,在Q4的业绩会上,他还公开了特斯拉2025年10000台机器人量产目标,并指出,未来随着Optimus年产量趋稳(年产量达到100万台以上),Optimus生产成本将会低于2万美元。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。