腾讯Robotics X机器人实验室公布了其智能体研究的最新进展。

6月14日,鹅厂公布了其“机器狗 Max”的最新进展。


能钻“狗洞”,还能跨栏。

现在市面上的机器狗大多还停留在原地踏步的阶段,腾讯此次新升级的机器狗Max,还真的要跟真狗抢饭碗了。

本次研究新进展由腾讯Robotics X机器人实验室带来。该实验成立于2018年,目前推出的机器人项目包括机器狗Max一代、二代、机器狗Jamoca、轮式机器人Ollie、自平衡自动驾驶摩托车等。

2021年,腾讯正式发布首个软硬件全自研多模态四足机器人机器狗Max,2022年,第二代四足机器人“Max”发布,这次的三代跟之前相比,关节自由度有了明显提升。腾讯方表示,通过将前沿的预训练AI模型和强化学习技术应用到机器人控制领域,让这次机器狗 Max的灵活性和自主决策能力得到大幅提升。


第二代四足机器人“Max”

通过引入预训练模型和强化学习技术,可以让机器狗分阶段进行学习,有效地将不同阶段的技能、知识积累并存储下来,让机器人在解决新的复杂任务时,不必重新学习,而是复用已经学会的姿态、环境感知、策略规划多个层面的知识,进行“举一反三”,灵活应对复杂环境。

具体来看,在第一个预训练学习中,Robotics X实验室与腾讯游戏展开合作,使用游戏研发过程中的动捕数据集,让Max学会走、跑、跳、站立等动作。

第二个预训练学习通过额外的网络参数来将第一阶段掌握的机器狗灵动姿态与外界感知联系在一起,使得机器狗能够通过已经学会的灵动姿态来应对外界环境,完成匍匐前进、跨栏跑、障碍物跑酷穿梭等高难度动作。

在第三阶段的学习中,附加的网络会获取与复杂任务有关的信息,例如在游戏中,获取对手的信息、旗子的信息,最终使得机器狗在策略侧面能自主形成认知。

为了测试Max所掌握的这些新技能,研究员受到障碍追逐比赛“World Chase Tag”的启发,设计了一个双狗障碍追逐的游戏。

在基于预训练好的模型下,机器狗通过深度强化学习,不仅学会了真狗的走、跑、跳、站立等动作,还具备了一定的推理和决策能力。当追击者意识到自己在躲避者碰到旗子之前已经无法追上它的时候,追击者就会放弃追击,而是在远离躲避者的位置徘徊,目的是为了等待下一个重置的旗子出现。

另外,当追击者即将抓到躲避者的最后时刻,它会跳起来向着躲避者做出一个“扑”的动作,这些都是机器狗为了确保自己的胜利采取的主动加速措施。

据介绍,游戏中机器狗的所有控制策略都是神经网络策略,在仿真中进行学习并通过zero-shot transfer(零调整迁移),让神经网络模拟人类的推理方式,来识别从未见过的新事物,并把这些知识部署到真实机器狗上。

腾讯方面表示,整个过程都在虚拟世界里进行训练,不需进行实机训练、调整。机器狗Max在未来将不停进化、适应,有望投入到搜寻、援救等紧急工作中。

目前,已有许多公司切入四足机器人领域。波士顿动力以机器狗“Spot”而闻名,去年8月10日,小米首款仿生四足机器人CyberDog正式亮相,小鹏汽车生态企业鹏行智能去年9月7日也发布了全球首款可骑乘智能机器马。另外,还有云深处、宇树科技等一批本土初创企业。

预训练AI模型和深度强化学习技术为未来机器人解决其他复杂任务提供了一套通用的解决方案,为机器人走入现实生活,服务人类打下了坚实的基础。腾讯机器狗就是AI赋能机器人的生动诠释。

AI所造就的机器人,与传统机器人最大的区别在于,AI机器人表现出一些与人类相似的智能特征,从原先的“自动化”迈向了真正的“自主学习”。

从技术层面来说,四足机器人集成了动力系统部件的仿生结构设计、环境感知技术、自主控制技术、运动规划、运动控制、SLAM等多种技术的先进水平,随着机器人性能和功能的提升,机器视觉也能被加在四足机器人身上。可以预见的是,随着计算机视觉、自动控制、人工智能、步态规划和能源供应等技术的不断进步,“机器狗”的竞争力将进一步增强。