“要去和擎天柱散散步了”。北京时间1月31日,马斯克在社交平台X晒出了特斯拉旗下人形机器人Optimus(擎天柱)行走的视频,再次掀起智能机器人的话题热度。就在日前,马斯克还曾在特斯拉的财报会上透露,人形机器人最终可能成为特斯拉的最大业务,擎天柱或将在明年实现交付。

人工智能浪潮席卷,其中,大模型作为应用层最具代表性的明星产品,过去一年可谓狂飙突进。但其实,AI+机器人、AIPC、AI手机也是重要的应用方向,且有望带来产业的革命性时刻,甚至走入新一个春天。

过去数年,人形机器人的发展一直受限于技术与应用的双重局限,但随着AI技术越过山丘,AI加持下的智能机器人产业,奇点已至。

用一个比喻来形容,对于能够执行精细且复杂物理操作的智能机器人来说,AI相当于大脑,机器人运动控制器相当于小脑,机器人就是躯干,三者组合,才意味着完整的机器人系统。

多家研究机构指出,人形机器人正是AI的具身化载体,也是实现通用人工智能最有效的载体。高盛在分析中表示,最理想情况下,预计2035年人形机器人市场空间有望达1540亿美元。

千亿美元产业蓝海就在眼前,科技巨头们争先恐后入局。

除了特斯拉这条“鲶鱼”,其他参与方也在AI机器人的研发方面热情满满,如谷歌与斯坦福推出了AI机器人Mobile ALOHA, OpenAI积极支持机器人企业1X的融资。大模型迭代升级,人形机器人应用场景不断拓展,让实际落地不再遥遥无期。国内人形机器人头部玩家优必选也已于2023年底在港交所上市,成为我国“人形机器人第一股”。

但与此同时,AI机器人行业的发展仍面临着制造成本高昂、训练泛化难度高、场景应用受限等问题,这给AI机器人投入量产和大规模应用带来了考验。


AI 机器人各显“贤惠”

近段时间,AI机器人领域颇为热闹,叠衣服、炒菜、煮咖啡,大有承包家务的势头。

马斯克在X上晒出的Optimus(擎天柱)自主行走视频显示,该款智能机器人已经可以模仿人类的自如行走,步态轻盈自然。视频中,擎天柱去掉了外壳,内部电机、电线等构成清晰可见,但行走动作并不呆滞,拟人化特征相当高。

就在不久前,马斯克还公布过擎天柱叠衣服的视频,其可以顺畅地将一件衬衫从洗衣篮中拿出,并在台面上折叠好,手臂与手指应用灵活。谷歌DeepMind与斯坦福团队共同推出的Mobile ALOHA,展示了煮虾、擦桌子、洗盘子等功能;来自中国的机器人创企MagicLab则展示了人形机器人煮咖啡的过程。

而在刚刚结束的2024年美国消费电子展(CES2024)上,国产开普勒人形机器人亮相,可以实现多场景应用,包括教育科研、自动化生产线、智能搬运、复杂环境巡检、应急救援、户外安全作业、危险环境检测、安全隐患排查等。

CES2024上,三星公布了新版本的Ballie机器人管家,能够与智能家居联动;LG展示了双足家庭机器人助理Moving Smart Home Hub;亚马逊投资的创企Embodied也在CES上展示了教育机器人Moxie AI,可以与儿童进行眼神交流及语音对话。

在研发速度上,新兴科技企业也在不断突破。

成立于2022年的Figure,于1月7日发布了一段人形机器人Figure 01“煮咖啡”的视频,号称仅10小时内便教会人形机器人此项技能。前谷歌DeepMind研究员、同时也是该机器人的开发人员Corey Lynch称这是通过端到端人工智能训练实现的,所有行为(包括矫正)都是自主的,并没有使用远程操控。而在2023年10月,Figure 01才被正式推出,到如今实现“10小时教会机器人煮咖啡”的突破只用了3个月的时间。

此前,根据特斯拉在2022 AI Day中披露的细节,特斯拉人形机器人Optimus的制造耗时6个月,实现行走和手臂摇摆动作分别用了8个月和12个月。相较而言,Figure的研发速度还要更胜一筹。

不过,并非所有AI机器人的家务活都是自主行为,谷歌与斯坦福的Mobile ALOHA所展示的煮虾、坐电梯、擦桌子、与人击掌、洗盘子、整理桌椅等任务,其中部分行为由人类远程操控完成。

擎天柱叠衣服被网友质疑与斯坦福机器人“炒菜”类似,是通过遥操作系统实现的。对此,马斯克并没有正面回答,只是承认机器人自主叠衣服尚且需要时间。


AI机器人元年

2023年,OpenAI发布了大模型ChatGPT,这是一种生成式人工智能,有较强理解与生成对话能力。ChatGPT的诞生,奏响了大模型爆火的乐章,也间接摁下了AI机器人快速演进的按钮。

早在1986年,日本本田公司就公布了全球首个商业用途人形机器人ASIMO,具备完整的身体运动能力,之后也有企业相继开始了人形机器人的研发业务并取得了一定成效,但由于过去大规模刚需应用场景不足、技术复杂以及成本过高等问题,机器人难以成熟落地。

从整个机器人发展历程来看,智能机器人已经迭代到了第三代。与历代机器人相比,人形AI机器人有更高的感知、运动控制和交互能力,可以应用于多个场景。例如在工厂中进行仓储物流管理、上下楼梯移动货物等,在家庭里陪伴教育、充当医疗助理协助老人生活、照顾孩子、做饭等;能够替代人类进行高危工作,如救火、有毒物质清理等。

如今有了AI加成, 又出现了End-to-end端到端模型,让以往复杂的场景理解和建模过程可以被简化,机器人通过海量的训练数据可以直接训练,智能程度不断提升,技术上的难点得以突破。

业内人士举例说明,以前,机器人的人机交互方式从编写代码到示教拖拽式,总归存在一定的使用门槛,但通过大模型结合机器人的操控,使得以后可以借助自然语言驱动机器人,这个过程无论是对普通人控制机器人,或是企业研发,都极为有帮助。

中信证券方面认为,随着AI迅速发展,人形机器人奇点已至,机器人在AI的加成下逐步由“功能”走向“智能”。

2023年不仅是大模型元年,也是人形机器人相关产业的元年,机器人、家电、车企等各界玩家进入赛道,有了实质性的成效。

聚焦到国内,在政策上,2023年11月,工信部发布《人形机器人创新发展指导意见》,北上深等各地方政府陆续发布机器人相关支持性政策,为AI机器人行业的发展保驾护航。同时,以拓普集团、三花智控为代表的上游零部件企业也在加速研发布局。

2023年3月,追觅科技扫地机器人、送餐机器人、四足机器狗、人形机器人等亮相机器人大会;康复机器人企业傅利叶于2023年7月发布通用人形机器人GR-1,并开启预售和量产交付;2023年8月,宇树科技发布首款通用人形机器人Unitree H1,这是国内第一台能跑的全尺寸通用人形机器人;2023年8月,智元机器人发布智能机器人远征A1,展示了拧螺丝、底盘装配、家庭陪伴、危化品实验等多场景应用。

2023年10月,小鹏汽车展示了自研的人形机器人PX5,双手仿人灵巧,可以进行类人的双足行走。未来可以实现工厂生产、巡逻,甚至是帮忙卖车。小鹏汽车董事长何小鹏曾公开表示,汽车公司的未来,将是AI汽车和机器人的结合。

表1:各公司人形机器人要素对比

在AI机器人商业化层面,2023年12月,九号公司纪亚飞称其研发生产的AIBOX已经装入美团街头跑的无人车,能够对路面情况迅速甄别并做出反应;Figure于今年1月18日宣布与汽车巨头宝马达成协议,正式将人形机器人引入宝马的汽车制造工厂。机器人将在接受特定任务培训后,在未来12-24个月内逐渐整合到车身车间、仓库等制造流程中;智元机器人稚晖君表示远征 A1 将首先用于新能源制造等场景,目前正在与头部企业进行对接;傅利叶GR-1、开普勒人形机器人的量产交付计划也已经提上日程。


机遇与挑战并存

不可否认,AI机器人领域的潜力巨大,但目前仍然存在不少难点和挑战。

首先是成本造价依然高昂。中信证券分析师根据海外Digit等人形机器人的售价25万美元预计毛利率约为25%,推测当前人形机器人的造价在十几万美元左右。有专业人士分析,硬件上的零部件成本占大头,仅高性能控制器的价格就高达上万元。

而根据特斯拉2022 AI Day2披露的信息,未来特斯拉人形机器人的售价将会降到2万美元(折合人民币14万元左右);开普勒计划将人形机器人计划将价格控制约为2-3万美元(折合人民币14-21万元)左右。在智元机器人发布会上,智元机器人预估未来其首款人形机器人远征A1的制造成本将会被控制在20万元以内。如果真的能将成本造价“打下来”,或许能突破人形机器人大规模应用的瓶颈。

其次是机器人在各场景的实际应用。

人能够掌握“默会知识”,在实际生活中并不只依赖于经验总结,而是能够形成自己解决问题的逻辑,但是这对于传统的编程机器人不太可能完成,因为环境变量太多、过于复杂,机器人难以应对。

随着大模型出现和发展,能提高机器人对人类指令的理解能力,解决此问题的方式由针对单一任务建立一个通用预测模型进行“举一反三”,到现在变成借助多模态神经网络融合实现,能够集视觉、触觉、运动、关节控制等为一体,解决更加复杂和多元化的问题。

最近,瑞士苏黎世联邦理工学院在一项研究中借助图神经网络(GNN)的模型,通过收集大量合成图像和在真实环境中捕获的布料图像进行预训练,已经让机器人能够有效判断整个布料的形状、位置和可见度。这与特斯拉人形训练机器人叠衣服的行为不谋而合,机器人“保姆”或许在不久的将来就会诞生。

钱江机器人孔民秀对ChatGPT大模型在工业机器人上的使用提出了不同意见,认为大数据模型的可靠性存在提升空间,且在智能焊接,智能搬运等方面,大模型的成本过高。也就是说,如何将AI大模型技术与机器人更好地融合,是一个难点。

除此之外,人形机器人的算法系统和算力也是研发过程中需要重点关注的板块。前者与机器人行走、行为协同操作息息相关,后者决定了机器人的续航和散热。解决这些问题,AI机器人的道路才能越走越宽。