当地时间12月12日,特斯拉发布了第二代人形机器人擎天柱Optimus Gen2。演示视频中,机器人用手指捏起鸡蛋的能力受到广泛关注:机器人用左手的拇指和食指把鸡蛋从纸浆蛋托里拿起来,再用右手的食指和拇指捏住,将鸡蛋稳稳地放到锅里。这个看似简单而日常的动作,背后需要动用的技术却一点也不简单。


捏鸡蛋考验传感器和微系统的精细度

有那么多物品可以展示,特斯拉为什么偏偏选择了鸡蛋?

记者推测,之所以做这样的选择,是因为鸡蛋易碎的特点:力气小了会滑落,力气大了会捏破。显然,鸡蛋这种重量轻、质地薄且易碎、表面平滑且易落的物品,对机器人感知系统的识别能力和抓取动作精细度提出了更高的要求。可能这也是特斯拉希望借助视频传达出来一条信息:二代擎天柱连抓握鸡蛋的功能都能实现,那么也能轻松完成日常生活所涉及的其他动作手部。

那么,机械手捏鸡蛋,背后需要什么样的技术支撑?

ADI市场经理祝臻在接受《中国电子报》记者采访时表示,完成抓取的动作,首先要具备感知能力。

关于机器人指尖的感知方式,记者通过采访了解到如下几种:

其一是压力感知

相较于工业机器人,人形机器人手部的受力方向更复杂。因此,有业界人士认为,手部的力量感知应该用六维力传感器实现。坤维科技CTO袁明论介绍称:“如果力的方向是固定的,可以采用一维力传感器;如果力作用点与传感器标定参考点重合,但力的方向随机变化,可以用三维力传感器;而如果力的方向和作用点都在三维空间里随机变化,就应该选用六维力传感器进行测量。”

人形机器人的手部抓握力的测量,就属于这第三种情况。且不仅要求测量的方位更多,也要求其测量精度更准,需要控制在mN(毫牛)级。记者在坤维科技网站看到一款用于灵巧手的指端传感器,其灵敏度可达1mN。

不同类型的力传感器(图片来源:坤维科技)

其二是触力感知

霍尼韦尔技术支持工程师王海军向记者介绍了以触力传感器探测机器人指尖力大小的解决方案。他表示,霍尼韦尔可以检测触碰到的地方的力的大小。触力传感器和压力传感器的工作原理比较类似,区别在于,触力计算出来是力的大小,压力传感检测出来的是压强。例如汽车刹车系统是通过液压的方式感知,如果需要,再通过计算转化为力的大小。王海军表示,触力传感器的适应的量程数值较小,一般在25N以下,精度可达到1%左右,因此能够适应人形机器人用机械手抓取精细物品的需求。该技术现已在医疗手术机器人等领域实现应用。

其三是柔性微压力感知

与压力感知类似,柔性微压力传感器同样感知的是传感器表面受到的压力。而区别在于,柔性传感器采用更轻薄的薄膜材料,可更灵活地配置在机器人表面,并实现对来自不同方向的压力的感知。

汉威传感器研究院副院长刘建钢在接受《中国电子报》记者采访时表示,柔性微压力传感器也能够实现阵列功能,也就是说,能够实现特斯拉二代机器人在视频中展示的——呈现机器人指尖不同位置感受到的不同压力值的功能。


拆解取蛋动作:毫秒间的多轮信号交换

但对于机器人取蛋这个动作而言,精细化感知只是这个复杂系统中非常微小的一步。

取蛋——将鸡蛋放置到另一只手中——再放置到特定容器内,在特斯拉发布的Optimus Gen2宣传视频中,整个过程仅耗时10秒。

但如果将这个过程的技术流程拆解开,我们看到的在几秒钟的时间内发生的取蛋、传蛋、放蛋的过程,背后经历了非常长的技术流程:首先,机器需要通过视觉判断待抓取的物体的物理位置、表面材质和大小,以此选定抓取物品所需力量的初步参数;此后,机器人需要调动机械手靠近物品,并放慢速度进行抓取;抓取过程中,机械手首先需要缓慢抓握物体,同时感受过程中物体的力反馈,并将该信息传递给上位处理器,以此判断是否要继续施力;经过抓握、力反馈、信号处理,再将机械手执行指令信息传回到手指的多轮信号交换之后,机械手最终确定抓握力度,抓住物体并移动。放置鸡蛋的动作,背后同样有很长的计算流程:从判断放置点位置,到机械手松开的幅度调试,其中又将经历获取视觉信息、获取力反馈信息等多轮信息交换。

“这个过程听上去很复杂,需要很长的时间去描述。但其实机器的每一次计算都是毫秒级的,可能几秒钟的时间机器已经做了几百次判断的循环。”刘建钢在接受《中国电子报》记者采访时表示。

这种抓取物体的信息处理过程,在工业领域就简单得多。在一套工业流程中,如果确定了某只机械臂需要完成的任务,则该机械臂的各项工作参数都相对固定。

图为桌面工业机器人

而人形机器人,必须经历多次的“判断”和“计算”来完成拿取动作。原因就在于:以服务人类、成为人类工作和生活助手为目标的人形机器人,其面临的应用场景、面对的工作环境与人类的生活环境高度类似:人手接触的物体多种多样,其表面质地、大小、质量都各不相同,而非标准化的工业物件,人每一次拿取背后,其实都蕴含着复杂的经验——这是人类从婴幼儿时期逐渐培养起来的。

而人形机器人,正在学习人类的感知过程。

就像抓取一枚鸡蛋:力气太小,鸡蛋会滑落;力气太大,鸡蛋会被捏破。捏取鸡蛋这样一个简单的工作,需要机器人进行深度学习。

“要训练机器人取鸡蛋,一般来说是通过先给机械手预设一系列数值,再在机器人抓取鸡蛋的过程中对参数进行调整。”超感科技(北京)有限公司研发部经理刘洋分析称,“如果鸡蛋滑落,需要施加更大的力;如果鸡蛋被捏破,就需要降低力度。”刘洋同时表示,如果算法写得好,这个训练过程可以由机器自行完成;否则,判断机器加大力度还是降低力度的工作还需要人员参与。

这是机械手抓握物体的基本原理。特斯拉发布的视频中只展示了抓握鸡蛋的能力,但实际上,要使机械手能够灵活且适当地抓握不同物品,需要反复地对其进行不同物品的抓握训练。以此为基础,为机器人建立庞大的数据库。这样一来,在遇到不同物品时,机器人便能调用该数据库,确定该用哪条函数处理问题,并执行。

“对于机器人而言,任何一个在人们看来很简单的动作,都是一个复杂场景,需要机器人具备多维度数据感知能力与算法模型支撑,还需要完整的时序控制软件设计,多项技术相互协同的基础上瞬间输出运算结果形成‘指令’,才呈现出机器人在视频中表现的流畅动作。”北京理工大学前沿技术研究院首席专家郭源生表示。

人体的手部与皮肤是一个精妙的系统,对物体的感知包含粗糙度、硬度、导热性、温度、湿度、锐利性、振动、触觉力、触觉压力等诸多维度。而对于人形机器人而言,要模仿人类的行为举动,就要将上述人类对物体的感知转化为物理参数指标,经过机器人多次与物体接触、反复验证,最终将这些物理参数转化为机器人不断学习,修正模型的基础数据。

“从技术上来看,软硬件协同能力是关键。”郭源生表示。


除了特斯拉,谁还能做?

为什么特斯拉能做?

除了特斯拉,谁还能做?

当把二代擎天柱捏鸡蛋的动作拆解开,会发现,虽然过程复杂,但其中涉及的技术,都是眼熟的“老伙计”:视觉识别、深度学习、柔性传感……这些技术如果分开看,很多都已经形成了颇具规模的行业应用:扫图识物、环境感知、货物分拣……

图为ADI基于飞行时间的三维物体测量展示

HTC企业发展全球副总裁汪丛青在接受《中国电子报》记者采访时表示:“人形机器人的功能创新,不一定需要太多新的硬件,机器人需要的中央处理器可能与汽车不会差太多,有独立游戏电脑相似规模的环境,应该就可以支持了。”

既然如此,为什么只有特斯拉实现了精细化的机器人手部动作?我国要想发展人形机器人,还差什么条件?

郭源生认为,我国发展人形机器人,最为欠缺的,是行业内资源整合的能力。

“做传感器的企业只是在做更好的传感器,做算法的只做算法研究。要做好像人形机器人这样的复杂系统,不是看分离状态下各种技术的水平有多高,而是要看产业协同的整体水平和功能。”郭源生表示,“现在的问题就在于,许多技术国内都具备,但是,谁来牵头整合这些资源要素?谁能整合这些处于分散状态的技术能力?谁能组织起处于不同行业领域和不同单位地域的人员?这些问题不解决,人形机器人很难发展得起来。”

从常规的商业逻辑来看,企业做的事情都是需求带动的。企业的投入,是基于某项技术未来可能具有的商业价值。但如果这项技术的商业应用场景不明晰、巨大的投入难以带来可见的回报呢?

这就是我国发展人形机器人面临的问题。

刘建钢告诉记者,该企业柔性皮肤从研发成功到现在已经有十年的时间,但一直没有找到合适的落地场景。刘洋告诉记者,他们企业自主研发的PVDF薄膜材料,能够实现对极小压力的灵敏感知,但也长期没有找到合适的下游应用场景。究其原因,不外乎商业落地形态不清晰,缺乏市场应用动力。

但人形机器人落地,本身就需要长时间高投入;如果在市场商业逻辑的语境下,短期内难以出现合适的商业带动主体,那么人形机器人研发工作该由谁来承担?

对于包括传感器企业在内的诸多类型企业而言,其能力难以触及下游开发等场景。人形机器人的功能研发及商业场景的摸索,需要能够整合多种市场资源的主体。这样的市场主体,既需要把各零部件企业整合起来,又需要协调各方力量,促进技术创新、寻找商业落地场景。

今年8月,工信部办公厅发布了《关于组织开展2023年未来产业创新任务揭榜挂帅工作的通知》,其任务,就是“面向元宇宙、人形机器人、脑机接口、通用人工智能4个重点方向,聚焦核心基础、重点产品、公共支撑、示范应用等创新任务,发掘培育一批掌握关键核心技术、具备较强创新能力的优势单位,突破一批标志性技术产品,加速新技术、新产品落地应用。”

记者看到,在工信部此次发布的附件《人形机器人揭榜挂帅任务榜单》中,对揭榜挂帅企业需要完成的任务进行了拆解,其中包括全身动力学控制算法、电机驱动器、力传感器、MEMS姿态传感器、触觉传感器等等;并发布了发展人形机器人领域待开发的重点产品。

今年9月,工信部宣布组织开展2023年未来产业创新任务揭榜挂帅工作,其中人形机器人仍为四个重点方向之一。

若此项工作顺利开展,“挂帅”主体能够有效发挥作用,则将为我国发展人形机器人凝聚产业力量、调动产业链能力提供有效助力,极大加快我国人形机器人研发进程。

关于人形机器人的未来发展,产业人士也提出了自己的期待。“实用性”是发展的关键词。

刘建钢表示:“希望噱头少一些,并能带来真正的产品销量。”

郭源生认为,要推动应用创新向实用创新转变。也就是说,搞创新、搞研发,不能停留在“别人做过的我们才能做”的程度,而是需要在明确的战略定位和顶层设计的基础上,以问题为导向,将产业内的人才、资金、技术、设备等资源充分调配起来,搭建成具有人才稳定性、技术连续性、应用持续性的创新平台,带动产业链全面升级、不断迭代、走向尖端,从而实现具有基础技术创新性的高质量发展。