机器人技术面临的一大挑战是,必须投入大量精力针对每个机器人、任务和环境训练机器学习模型。现在,由谷歌 DeepMind 和其他 33 家研究机构联合开展的一个新项目旨在通过创建一个通用的人工智能系统来应对这一挑战,该系统可以与不同类型的物理机器人协同工作,并执行多种任务。

谷歌机器人技术公司高级软件工程师潘纳格-桑凯蒂(Pannag Sanketi)告诉 VentureBeat:"我们观察到,机器人是很好的专家,但却是很差的通才。"通常情况下,你必须针对每项任务、机器人和环境训练一个模型。改变一个变量往往需要从头开始。"

为了克服这个问题,使机器人的训练和部署变得更加简单快捷,这个名为 Open-X Embodiment 的新项目引入了两个关键组件:一个包含多种机器人类型数据的数据集,以及一个能够在各种任务中转移技能的模型系列。研究人员在机器人实验室和不同类型的机器人上对这些模型进行了测试,与常用的机器人训练方法相比,取得了卓越的效果。


结合机器人数据

Open X-Embodiment 项目的诞生源于这样一种直觉:将来自不同机器人和任务的数据结合起来,可以创建一个优于专用模型的通用模型,适用于所有类型的机器人。这一概念部分受到大型语言模型(LLMs)的启发,在大型通用数据集上进行训练后,LLMs 可以与在狭窄的特定任务数据集上训练的小型模型相媲美,甚至更胜一筹。令人惊讶的是,研究人员发现,同样的原理也适用于机器人技术。

为了创建 "Open X-Embodiment "数据集,研究团队收集了来自不同国家 20 个机构的 22 个机器人实例的数据。该数据集包含 100 多万个事件中的 500 多种技能和 15 万项任务的示例(一个事件是机器人每次尝试完成一项任务时的一连串动作)。

RT-2-X 在新技能(即训练数据集中未包含的新任务)方面的成功率是 RT-2 的三倍。特别是,RT-2-X 在需要空间理解的任务上表现得更好,例如,分辨将苹果移到布附近与放在布上的区别。

研究人员在一篇发布 Open X 和 RT-X 的博文中写道:"我们的研究结果表明,与其他平台的数据共同训练为 RT-2-X 注入了原始数据集中没有的额外技能,使其能够执行新颖的任务。"


迈出机器人研究的未来步伐

展望未来,科学家们正在考虑将这些进展与DeepMind开发的自我完善模型RoboCat的见解相结合的研究方向。RoboCat 可以学习在不同的机械臂上执行各种任务,然后自动生成新的训练数据,以提高其性能。

桑凯蒂认为,另一个潜在的方向是进一步研究不同的数据集混合物会如何影响跨实验泛化,以及改进后的泛化是如何实现的。

该团队已经开源了Open X-Embodiment数据集和RT-1-X模型的一个小版本,但没有开源RT-2-X模型。他说:

"我们相信,这些工具将改变机器人的训练方式,并加速这一领域的研究。我们希望数据开源和提供安全但有限的模型能够减少障碍,加快研究。机器人技术的未来有赖于让机器人能够相互学习,最重要的是让研究人员能够相互学习。"