具身智能风起,人形智能机器人有望成为 AI 的 终极载体

过去,人形机器人难以实现规模化发展,主要受限于三方面:

1)技术上的限制,人形机器人是技术难度最高的智能机器人,是机械设计、运动控制、人工智能等领域高精尖技术的综合体现;

2)AI 落地的能力,即 AI 需要与应用场景共振,以适应不同的应用场景需求;

3)制造成本仍然是限制人形机器人推广的关键掣肘。

如今,随着 AI 通用大模型的发展,具身智能或已具备应用场景基础。

年初以来微软、OpenAl、Engineered Arts、特斯拉等公司相继推进 AI+机器人布局,且已有人形机器人投入实际使用,如 1X Technologies 披露其人形机器人 EVE 自今年 4 月以来已在美国和欧洲投入实际工作(担任保安)。

英伟达创始人黄仁勋表示具身智能有望成为下一波人工智能浪潮,具身智能机器人则有望成为 AI 的终极载体。谷歌发布机器人控制技术的新模型 RT-2,泛化和推理能力进一步提升。

在应用场景方面,结合过去已开发的各款人形机器人使用情况来看,基本都集中在某些专用领域。

我们认为,在 AI 赋能下,人形机器人技术路线融合及产业化有望迎来加速,从而助力人形机器人从专用领域到通用领域,最终走向家用大市场。

当前产业链持续推动降本,国产供应链有望充分受益。

在成本端,各家主机厂均持续推动人形机器人降本,其中以特斯拉为代表,或将引领人形机器人商业化进程。

过去高昂的成本是制约人形机器人大规模量产的关键因素,降本将是人形机器人商业化推广的必由之路。

过去一台 Atlas 造价高达 200 万美金,这也导致其至今难以走出实验室、走向商业化。

后续的 Valkyrie、优必选科技 Walker、小米“铁大”、特斯拉 Optimus、智元机器人远征 A1、傅利叶智能 GR1 等人形机器人均采用稳定性、性价比更高的电机驱动方案。

在电机驱动方案中,伺服驱动器将位置、速度、扭矩传输给伺服电机,伺服电机将接收到的电压信号转换为扭矩、转速,虽然扭矩密度远低于液压驱动,但电机驱动可以通过搭配减速器来加以补足,其现有技术已能满足机器人的多数运动需求,同时拥有能量转化效率、易维护、低成本、零件规整等优势。

马斯克表示,特斯拉人形机器人 Optimus 最终量产化的定价将在 2 万美元/台,我们认为,持续降本结合通用化属性将助力人形机器人走向家家户户,有望创造广阔市场空间。


国产人型机器人头部企业巡礼

达闼机器人:国产人形机器人云端大脑解决方案先行者

达闼机器人成立于 2015 年,创新性地提出“云端机器人”架构(“云脑+安全网+机器人”)并成功实现云端机器人的商业化。

软件方面,云端大脑通过人工增强、多模态融合 AI 和数字孪生等先进技术,实现智能机器人的自我学习、不断进化与成长。各种类型的服务机器人通过移动内联网(MCS)和标准化机器人控制器(RCU)安全连接到云端大脑,获得智能语音、智能图像、智能行动等能力。

硬件方面,达闼开创性地研发了集通信、计算、传感于一体的机器人智能柔性关节 SCA,解决了机器人硬件在标准化、集成化及产业化方面的局限,降低了机器人准入门槛、加速产业生态形成。

2022 年 7 月,国家科技部正式批复支持达闼建设“云端机器人国家新一代人工智能开放创新平台”,这标志着达闼成为国内第一家围绕人工智能和云端机器人建设新一代人工智能开放创新平台的“国家队”企业。

此前,已有百度、阿里、腾讯、科大讯飞等 15 家企业先后获批建设国家新一代人工智能开放创新平台。截至2022年12月,达闼已经拥有超1600+项专利申请,在云端机器人领域专利数全球第一。

具体来看,MINTA SCA(Smart Compliant Actuator)智能柔性关节是达闼自主研发的一种高集成化、高性能的智能柔性关节。

SCA 集成新型伺服电机、底层伺服驱动、高精度编码器、高精度减速器于一体,体积仅为传统伺服系统的十分之一;具备高度集成、总线控制、大扭矩输出、低成本及易使用性等特点,是大多数机器人最核心的运动关节。

其硬件组成具有以下优势:

1)高性能驱动器:采用高集成芯片,拥有过压、过流、过温、短路、堵转、欠压等多重保护;采取总线控制,通过一根综合线缆完成机器人多自由度运动控制的动力和信号传输;三闭环控制+优化算法,低成本实现阻抗控制,达到柔性控制功能。

2)高扭矩密度外转子电机:优化外转子无刷伺服电机,优化后的电机扭矩密度更高,在体积小的情况下可以输出更大的扭矩,同时进行了优良的散热设计。

3)高精度减速器:新型法兰式输出,可以抗侧向力,传递大扭矩,具有扁平化结构。优化后的减速器既保证了传动精度和承载力,也满足了低噪音及轻量化的要求。在运动的过程中,运动更平稳、抗冲击和振动的能力也更强。

4)高精度编码器:执行器采用 14 位高精度磁性编码器,具有防尘、防油、抗振动等特 点,低功耗多圈编码器,结构简单、低成本、集成度高,功耗低至 0.046mW,线性补偿算法使低成本编码器性能可媲美昂贵的高端编码器。

软件方面,海睿 AGI 平台是达闼研发的全球首个支持多 GPT 服务的通用人工智能平台,也是未来有望实现具身智能的优秀方案。

海睿 AGI 支持多种 GPT 产品,实现机器人由单任务向多任务、从单模态向多模态,让机器人完成非常复杂的各种操作运行。

此外,海睿 AGI 支持用户私有化部署、支持定制调优大模型、支持训练自己的大模型。

同时,达闼推出了机器人多模态人工智能大模型 RobotGPT,有效支持了机器人发展通用性人工智能。现在国际或国内的 GPT 模型无法有效支持机器人的多模态行为控制,其核心原因是缺乏有效数据。

RobotGPT 是为实现机器人在复杂应用场景下的多模态行为而提供的交互生成型 AI 模型。它以多模态 Transformer 为基础,在海睿数字孪生世界中进行机器人行为训练,让机器人拥有自主认知、智能决策等行为表现,同时它能基于人工反馈的强化学习不断进行提示学习并快速智能跃进,使得接入云端大脑的机器人除了可以像人一样对话交流,还可以像人一样工作,如迎宾接待、导览引领、物品递送、自动巡逻、互动交流、陪护照看、人机协作等,甚至艺术创作(如编写歌曲、诗词、舞蹈动作等),有望助力智慧城市、智慧农业、智慧康养、高端智能制造、智慧教育等行业应用的发展。在 RobotGPT 的支持下,云端机器人有望成为通用人工智能的优秀载体。

RobotGPT 赋能下,公司人形机器人已在多种场景开展运用,包括“咖啡大师”、“灌篮高手”、“舞蹈演员”等等。

目前海睿操作系统已与国内上百家机器人公司、实验室、高等院校、机器人厂商、智能设备商等合作,如中国移动、百度、科大讯飞、阿里、鹏城实验室、北京大学、清华大学、同济大学、优艾机器人、智行者等,覆盖医疗健康、物流、能源巡检、农业等应用领域,初步建立机器人产业生态。

目前公司智能服务机器人已迭代到第二代,Cloud Ginger 2.0 在 1.0 基础上,实现了七大核心能力的提升:采用了智能柔性关节 2.0、灵巧手与灵活抓取、硬件可扩展接口、多模态融合交互、千变脸、多角色情感人机交互、自主学习。

Cloud Ginger 2.0 身高 158cm,体重 89kg,续航超过 12 小时,可加载第二块电池,具备 41 个柔性执行器,抓取能力达 5kg,可广泛应用于迎宾导览、教育科研、清洁打扫、康养陪护、直播卖货、卖场促销等场景。

8 月,公司正式发布双足人形机器人 “七仙女”。七仙女身高 165cm,体重 65kg,是一款达闼云端大脑赋能、面相全场景应用的全尺寸、全功能通用人形双足机器人。

➢ 自由度目前处于行业领先水平。其全身大量采用了轻质高强度的碳纤维复合材料,拥有 60 多个智能柔性关节,在行业处于领先水平。

➢ 腿部驱动方案具有特色。七仙女腿部目前采用并联驱动结构和高扭矩密度电机,单腿峰值扭矩高达 600Nm,爆发力强,可高灵敏、高动态运动。

➢ 接入云端大脑、RobotGPT 等工具,初步实现具身智能。通过多模态大模型 RobotGPT 赋能,具备多模态融合感知、认知、决策和行为生成能力,可以以解决人类智慧的能力开展工作。基于数字孪生的深度强化学习完成自主智能训练,生成机器人多种步态和动作,实现平衡站立等动作。

总体来看,达闼机器人作为国内人形机器人领先企业之一,其集成了 RobotGPT 云端大脑架构的人形机器人是国产人形机器人发展道路上的重要探索。

未来随着硬件架构和软件技术不断取得突破,公司国产人形机器人有望持续取得突破。


智元机器人:引入反曲膝等新型结构,硬件+软件体现综合控制能力

近期智元机器人发布第一台通用具身人形智能机器人远征 A1。

硬件与形态方面,远征 A1 身高 175cm、体重 5kg,步速可达 7km/h,单臂最大负载达 5kg。同时,A1 总体包含 49+个自由度,包括谐波一体化关节、直线推杆、无刷行星伺服及空心杯电机等,并提出反曲膝设计结构。

➢ 关节电机:自研 PowerFlow 关节电机,采用径向磁通外转子无刷电机方案,且添加液冷循环系统+矢量控制驱动,峰值扭矩达 350Nm,重量达 1.6kg。

➢ 膝盖:采取了反曲膝设计,以实现更大的操作空间,防止环境干涉。

➢ 灵巧手:包含 12 个主动自由度及 5 个被动自由度,除了使用空心杯电机,指尖集成视觉传感器,通过视觉闭环设计降低电机精度要求,可进一步分辨操作物颜色、形状、材质等。灵巧手可以支持人形机器人自主更换,成本有望降至 1 万元以下。

➢ 此外,远征 A1 搭载一系列的感知元件(RGBD 相机、激光雷达、IMU 及麦克风阵列等)及 AI 算力(约 200 teraflops)。

公司提出人形机器人的具身智能架构。

运控使用强化学习,算法经过多次迭代,运控算法能力处于行业前列。

公司致力于实现人形机器人低成本量产运用,通过 AI 大脑、大 模型(语言、图像)等实现机器人自主感知、语义理解、图像识别、逻辑推理、编排任 务等能力,从而推动人形机器人的能力泛化到更通用的场景,而不用针对性地对每个任 务调制部署。

基于此,公司提出具身智能 EI-Brain 框架,分为云端超脑、大脑、小脑和脑干分别对应机器人任务级、技能级、指令级、伺服级的技能。云端超脑、大脑与小脑、脑干互相解耦,上层大模型聚焦具体感知决策和计划生成而不依赖于具体机器人载体硬件。

下层视控模型和运控算法聚焦底层特定动作执行而无需统筹整体任务。在大模型综合运用下,远征 A1 将拥有庞大的先验知识库、强大的通识理解能力和复杂语义多级推理能力,将原有能力泛化到更通用的场景。


傅利叶智能:立足康复领域,人形机器人赛道布局加速

傅利叶智能成立于 2015 年,致力于攻克高性能机器人的核心技术。

公司基于力反馈技术、柔性控制技术、5G 远程康复技术等全栈自研的核心技术,打造覆盖康复全周期、全系列、全功能的智能产品。

目前康复机器人产品体系相对丰富,包括上肢(腕关节、手功能等)康复机器人、下肢康复机器人、运动与平衡解决方案等。

目前公司康复机器人已经在康复行业形成规模化应用,在新加坡、马来西亚、墨尔本等地设立全球区域总部和研发中心,并在北京、上海、广州、长沙、合肥、珠海、苏黎世、芝加哥等 8 个城市形成研发、生产、销售生态网络,将产品出口销售到全球 40 多个国家和地区,实现业务的全球覆盖。

在康复机器人赛道的积淀,公司积累了一体化执行器、模块化设计、机械仿生结构等底层技术,在智能康复场景的创新和应用,为人形机器人的发展奠定基础。

2019 年,公司 开启人形机器人立项。目前公司已发布通用人形机器人 GR-1、GR-Pro、GR-1 Lite 等 系列产品并于 2023 年 9 月开启预售。GR-1 身高 1.65 米,体重 55 公斤,全身有 44 个关节执行器,实现扭腰、跑步、跳跃、 转头、抓取等拟人化动作。

对关节执行器拆分看,头部执行器有 3 个,腰部执行器有 3 个,手臂执行器数量 14 个(7x2),腿部执行器 12 个(包含大腿+小腿+脚踝,6x2),手部执行器 12 个(6x2)。

最大关节模组峰值扭矩达 300NM,具备快速行走、敏捷避障、稳健上下坡、抗冲击干扰等运动功能,步速可达 5 公里/时,在工业、康复、居家、科研等多种应用场景均可运用。由此,傅利叶智能也从专用康复机器人公司升级为通用机器人技术平台公司。

除关节执行器,GR-1 硬件体系包括力传感反馈、运动传感器、Realsense 视觉传感器系统及 Jetson、Xilinx 等系统处理器&解决方案和采用脑机接口(OpenBCI)、自研伽利略系统等。软件平台开发性高,支持二次开发及功能扩展。

傅利叶智能成为国内率先开启人形机器人产品商业化落地的第一批企业之一,产业化进展相对迅速。目前公司已完成多轮融资,每轮融资数千万到数亿元不等。


小米机器人:CyberDog2 推出市场,人形机器人有望迭代

2022 年 8 月,小米发布 Cyber One 人形机器人,智能化及机械能力由小米机器人实验 室全栈自研完成。Cyber One 身高 177cm、体重 52kg,机身自由度达 21 个,配置高性 能电机能实现实时响应,模拟人的各项动作。

➢ 电机:上肢关节电机自研高效电机,峰值功率密度可达 96Nm/kg,可以实现手握 1.5kg 重物、反向拖动上肢复现运动等功能。在行走方面,髋关节主要电机瞬时峰值扭矩可达 300Nm,配合复杂人形机器人双足控制算法,步态更加平稳。

➢ 具身智能:

1)视觉方面,搭载自研 Mi-Sense 深度视觉模组,结合 AI,具备三维空间感知能力且能够识别人物身份、手势识别、表情识别等;

2)在语义识别方面,搭载自研 MiAI 环境语义识别引擎和 MiAI 语音情绪识别引擎,能够实现 85 种环境音识别和 6 大类 45 种人类情绪识别。

目前 Cyber One 的研发涉及仿生感知认知技术、生机电融合技术、人工智能技术、大数据云计算技术、视觉导航技术等各领域尖端技术。未来应用场景落地或包括工业机器人、家庭陪伴机器人、公共服务机器人等多个方向。

目前公司处于起步第一阶段,积极推动 人形机器人技能学习优化。

2023 年 8 月,小米正式推出 Cyber Dog 2 四足狗系列。从形态上,对比上代,体积缩小 16%,重量减轻近 40%,但大小、体重均接近真实小型犬。运控方面,小米四足狗拥有 1 个大脑(NX 芯片、21 TOPS 超高算力)及两个小脑(双协处理器),拥有 12 个四肢自由度,奔跑速度可达 1.6m/s。

Cyber Dog 2 实现能看、能听、能感知,支持手势互动、语音控制、人脸识别及跟随避障。其中图像识别主要有深度摄像头、AI 交互摄像头、RGB 摄像头、鱼眼摄像头等多个摄像头配合。距离感知应用 TOF、激光、超声波传感器。

触觉感知应用触摸传感器。整体上看,Cyber Dog 2 传感器数量高达 19 个,用以 构筑知觉功能和反应能力。

同时,通过产业链协同,公司推出 CyberGear 微电机,定价 499 元。

公司自研的 CyberGear 微电机兼顾扭矩(电机峰值扭矩密度 37.65Nm/kg)、控制精度及响应速度等多方面性能并控制成本。当前四足狗单腿需要 3 个 CyberGear 微电,总计 12 个。

协同内核开源代码+AI 自主训练,四足狗已增加了包括芭蕾、滑板等更高精度的动作支持, 并以 3 万只机器狗的并行训练作为优化运控的基础,真正推动具身智能的实现落地。


宇树科技:四足狗老牌厂商进军人形机器人赛道

公司是老牌的四足狗厂商,产品体系已包括消费级产品及行业级产品,并延伸至四足狗机械臂及激光雷达感知系统等附加产品。

公司四足狗行业领先,在全球最早公开零售高性能四足机器人,历年全球销量处于行业前列。

通过全自研电机、减速器、控制器、激光雷达等机器人关键核心零部件和高性能感知及运动控制算法,公司四足狗已经可执行跳跃、伸懒腰、握手、扑人、坐下等多种动作姿态。

其中,消费级四足狗产品曾受邀参加 2021 牛年央视春晚、2022 冬奥会开幕式、2023 Super Bowl(美国春晚)赛前表演,实现行业“出圈”。同时,在行业级解决方案方面,公司中大型四足狗机器人针对电力智能巡检的一系列危险、紧急、重复性任务提出解决方案,在消防救援等领域发挥重要作用。

2023 年 8 月,公司正式进军通用人形机器人领域,发布旗下首款通用人形机器人产品 H1。H1 人形机器人采用轻量化材料设计,整体质量 47kg,拥有 19 个自由度,总体采 用了相对简单的架构。

拆分来看,单腿有 5 个自由度,主要为髋关节 3 个、膝关节 1 个、踝关节 1 个;单手臂自由度 4 个(注:可选配灵巧手),腰部自由度 1 个。

通过自研大扭矩关节电机 M107,人形机器人 H1 的膝关节扭矩可达 360Nm,髋关节扭矩可达 220Nm,手臂关节扭矩可达 75Nm。

目前公司关节单元的核心部件包括伺服电机、减速器、控制器均为公司自主研发且对比一般关节电机和直线执行器结构,公司关节电机模组质量更轻、最大扭矩、最大扭矩密度较行业平均水平更优。

公司结合机器视觉+AI,致力于实现全场景通用化应用。

在机器视觉方面,H1 搭载 3D 激光雷达+深度相机,逐步实现自主避障和定位导航功能。

目前,H1 通过自主计算机来完成行走和平衡,根据宇树科技公众号,H1 在行走时遭遇背面和侧面冲击能够及时调整姿态,显示出较强的抗冲击能力。

同时,公司正结合通用 AI,赋能工业、服务业等全场景应用,机器视觉+导入 AI 有望进一步提升 H1 的智能化水平。


追觅(Dreame):从家电产品拓展到人形机器人

追觅成立于 2017 年,专注于智能生活家电,公司在高速数字马达、流体力学、机器人控制机 SLAM(即时定位与地图构建)等方面有较好技术储备,并立足于核心技术,在扫地机器、吸尘器、洗涤剂、吹风机等一系列智能家电做创新运用。公司分别于2018 年、2019 年、2021 年推出吸尘器、吹风机和扫地机等家电产品。

根据公司官网,公司目前拥有伺服电机的设计开发以及生产制造能力,伺服电机集成电机、驱动器、减速器及双编码器,最大输出力矩可达 32Nm,最大转速 220RPM,上电直接获取绝对位置,具备快速响应能力,力矩带宽>1kHz,能够实现对机器人关节力度和精度的精准控制。底层算法突破 SLAM、ToF 激光雷达、结构光等核心技术并增强场景识别和语义理解能力。核心部件及算法技术储备下,公司拓展“广义机器人生态”,相应技术在四足狗和人形机器人研发上实现复用。

公司 2021 年推出四足狗产品 Eame One,2023 年 3 月推出最新的通用人形机器人产品和 Eame One 二代产品,各具特色。

➢ Eame One 二代:具备 15 个自由度,搭载 12 组伺服电机及多种传感器,实现语 音、视觉、触觉等多模人机交互,能够完成爬坡、上楼梯、跨越障碍、跳舞等高难 度动作,并可判断地形及适应复杂环境。此外,公司四足机器狗具有头部结构。

➢ 通用人形机器人产品:身高 178cm,体重 56kg,全身 44 个自由度。其中单腿 6 自由度,可以完成单腿站立。

交互方面,配备了深度相机可以完成室内三维环境的建模,结合先进步态控制算法+多种传感器,能够适应不同路面,实现自主避障。

2023 年 7 月追觅通用人形机器人已可脱离实验室环境,在市内室外场景中展示招手互动、行走等动作行为,当面对外界重力拍打、拳击之后,可保持稳定行走。

风险提示

1、技术发展不及预期的风险。

人形机器人是技术难度最高的智能机器人,是机械设计、运动控制、人工智能等领域高精尖技术的综合体现,目前产业技术尚未成熟,尽管目前全球科技和机器人公司正在加速布局 AI+机器人,政策端也有所支持,但研发进展存在不确定性。

2、规模化降本不及预期的风险。

目前全球人形机器人造价较高,而下游应用场景尚未完全开发,终端承受能力有限。目前已有国产人形机器人厂商逐步开启量产并实现商业化应用,但行业整体仍需进一步降本方能推动渗透率提升。