近日,75岁“AI教父”GeoffreyHinton离职谷歌后,再次下场AI,官宣加入机器人公司VayuRobotics咨询委员会,帮助开发AI机器人解决方案。迪士尼推出的酷似“瓦力”的机器人,扁扁的脑袋、四方的身体,不仅会蹦蹦跳跳,还能表达情感,更是吸引一众网友纷纷表示,要把它带回家!

迪士尼推出的机器人IROS在与人互动

机器人正一步一步向人类靠近,但它会取代我们吗?

在特斯拉发布的一段视频里,人形机器人“擎天柱”精准运用各个关节,流畅完成机械臂的搬运、装配任务,实现“自己造自己”。近期,“擎天柱”再进化,不仅能靠“看”分类物品,还能单腿做瑜伽。相比其他机器人,应用场景本就更通用的它,这一次更是打破工厂、家用壁垒,商业化落地预期进一步加强。

而去年10月,初次亮相的“擎天柱”,线束、电路板还裸露在外。“就这?!”一众科技发烧友直言失望,称其上台、全靠人抬。即便是马斯克自己,也生怕首次没系牵引绳、自主行走的它,会一头栽进观众席,摔在某个“幸运儿”脸上。

“擎天柱”在“自己造自己”图源:特斯拉官方社交平台

如今,我国人形机器人也迎来了集中爆发期:小米的“铁大”、宇树科技的H1、浙江大学控制学院机器人团队的“悟空-4”等十余款国产人形机器人扎堆现身,或走、或跑、或演示抓握、或与人对话。

这一切是如何发生的?大家缘何看好人形机器人?它又将如何改变现有产业,以及我们的生活?


梦想成真

去往杭州宇树科技有限公司的路上,记者不止一次对导航产生怀疑:偏僻的街区、老旧的白楼……这里似乎嗅不到一丝“高科技”的气息。

然而,在电梯门打开的一刹那,仿佛一张通往科幻之城的虚拟门票“叮咚”入账:明亮的灯光、空旷的展厅、赛博朋克式装修直击瞳孔,四面八方充斥着四足机器人踏步、跳跃时关节运动发出的声响。

屋里楼外,恍若两个世界。

成立于2016年的宇树科技,主攻四足机器人,不到万元一台的价格,历年销量领先。而今,趁着特斯拉“擎天柱”的东风,推出首款通用人形机器人H1,一经发布便火爆全网,OpenAI创始成员、前特斯拉AI总监AndrejKarpathy都特别转发官方推文,高呼“想要”。

如此H1,魅力何在?

H1示意图(受访者供图)

乍一看,高约1.8米、重47公斤,“网红”H1是个瘦高个。除了作为“半年成果预演”,还没来得及做双手,手臂末端接着小块软垫,H1已然“人模人样”。

人形机器人,亦称“仿生人”。但其长得像不像人,并不是最重要的。“更多技术栈指向运动能力,以及‘手’的操作能力。动起来像人、能用‘手’灵活操作外部事物,才是真正意义上的人形机器人。”宇树科技创始人王兴兴说。

而在“动”的模块,作为四足机器人领军企业,宇树科技具有先天优势。

在55秒的演示视频里:H1底盘稳健、步伐流畅,不仅可以大踏步向前走,还能小步快跑。根据官方数据,其行走速度大于1.5m/s,与成人步速相当,潜在运动能力在5m/s以上,是国内首台能跑的全尺寸通用人形机器人。

此外,视频也再现了当年波士顿动力机器人受到的“暴力”挑战——被人从侧面、后面踹一脚,H1稍作踉跄后,便能迅速找到新的平衡。甚至还学会预判,提前快闪,避开飞踢。

H1部分演示视频(受访者供图)

这,是人的寻常操作。但对于人形机器人来说,越“像人”的动作背后,支撑的技术越是复杂。

“难点主要有两方面。”据相关工作人员透露,无论是整机硬件结构系统设计,还是运动控制算法,都是挑战——人形机器人,主要靠两条“腿”交替与地面支撑,实现连续运动。而每条“腿”,相当于一个6自由度的机械臂,其中还既有串联又有并联,结构复杂。同时,为了走得更稳、跑得更快,“这12自由度的机械臂要足够紧凑,重量足够轻,且要满足整个人形机器人奔跑跳跃时,‘腿部’承受的冲击载荷”。此外,人形机器人关节数量多,这意味着对机器人系统精确建模,也是件难事。“在一个关节内部便集成双编码器”,在此算法框架下,还需投入大量资源实验和采集运行数据,不断调整控制参数,反复迭代,实现稳定运动的效果。

半年迅速达成如此成就,工作人员告诉记者,这与宇树科技四足技术的迁移不无关系。据悉,H1在关节电机、电控系统、控制算法等方面,很多都沿用、借鉴了积累的四足技术。

技术路线虽相通,但与“专才”四足机器人不同,“通才”人形机器人是更高维的存在,“从四足向人形的‘进化’,还有很多技术瓶颈需要突破。”颇多业内人士坦言,国内的人形机器人,还很基础。

波士顿动力人形机器人Atlas(图源:波士顿动力官网)

那么,为何众人纷纷跳出舒适圈,卷进人形机器人大战场?

“通用人形机器人,一直被认为是人类机器人技术的最终极形态。几乎每个热爱科技的人,或多或少都有过搞人形机器人的念头。”2010年,尚读大一的王兴兴便尝试过做人形机器人,“但那是200元的简易版,至今记忆犹新。”

一梦13年,H1也可以说是一种梦想成真。


厚“机”薄发

人形机器人,并非新概念。

从1927年西屋公司粗糙的HerbertTelevox到如今特斯拉“擎天柱”原型机,人形机器人的探索之路走过了近百年。这其中既寄托了人类对“造物者”身份的迷恋,也承载了人类对科技的终极想象。

但日前,囿于人形机器人动辄几十万一台的成本,以及技术上存在的困境,一直不是机器人行业的主要形态。

为何今年,人形机器人会异军突起,备受资本喜爱?

“AI大模型的普及,补全了人形机器人缺失的一块核心拼图。”业内人士纷纷表示,此前的技术,根本没法驾驭人形机器人如此复杂的机器人形态,“AI大模型让大家看到了‘1-100’的阶段不再那么难。若行业解决‘0-1’阶段机器人本体的问题,人形机器人落地的闭环便可以预知了。”

浙江大学控制学院机器人团队的“悟空-4”在2023世界机器人大会上的展示

在一场线下研讨会中,也有嘉宾提及,未来,就像大模型在各个行业裂变出行业大模型一样,搭载行业大模型的人形机器人,也会随之进入各个行业。

与此同时,记者在与人形机器人创业团队的交流中获悉:目前,人形机器人行业大部分零件已经可以做到国产化替代,“眼下,芯片也不是大问题,国产的够用了。”研发人员补充道。

以浙江为例,视觉传感器上,海康威视、浙江大华等已接近世界先进水平;自然语言处理和应答上,阿里巴巴、杭州一知智能等也有多年累积;核心零部件,如中科院宁波材料所的伺服电机、双环传动的精密减速器等,都属于业内的佼佼者。

在第八届中国机器人峰会上,相关责任人告诉记者,以“机器人智谷小镇”为中心的余姚机器人生态圈已逐步形成,核心区入驻企业100余家,83家机器人产业链上下游相关企业在周边落户,“上下楼就是上下游局面逐步呈现,这,可以说是余姚机器人产业全链式发展的缩影。”

第八届中国机器人峰会(图片来源:新华社)

且近些年来,硬件技术的发展,使得在保持人形机器人性能足够高、足够敏捷的同时,把成本降下来。以“远征A1”为例,天才少年稚晖君出走华为、创造智元团队半年后,对标“擎天柱”造出的这一人形机器人,成本将拉至20万元以内。虽比马斯克预测“擎天柱”量产后2万美元(约14.57万元)的价格,还是高出许多。但这个数字,远低于波士顿动力200万美元/台,也正好落入不少大学机器人实验室的预算范围。对于科技公司买家来说,更是便宜的价格。

技术能力是前提,现实需求则是重要推力。

如今有了大模型的加持,人们不再满足于机器人只是一个通过代码控制的“专才”,而是希望它能通过自我学习掌握各项技能,以更自然更智能的方式与周边环境交互,完成各种任务,成为真正有意识的智能形态。

EngineeredArts公司的人形机器人Ameca在展示其丰富的面部表情

科技部副部长、中国科学院院士吴朝晖在2023中关村论坛上表示,以ChatGPT为代表的自然语言大模型,并不是AI大模型的最终形态,比它更高级的是多模态的具身智能。“人工智能的下一波浪潮是具身智能。”英伟达首席执行官黄仁勋也在今年在一次演讲中这样预测道。

“这类产品的需求,未来将远远超过特斯拉汽车,达到100-200亿台”,马斯克的这番言论,更是给人形机器人市场注入更多想象。据美国知名投资银行高盛预测,到2035年,人形机器人市场或将达到1540亿美元,成为继智能驾驶电动车后的又一AI落地场景。

面对“具身智能”这一新风口,今年初,国家工信部等十七部委印发了《“机器人+”应用行动实施方案》。随后,北京、深圳、上海等地方政府也纷纷出台政策,鼓励人形机器人零部件与整机产品的研制与批量落地。

技术推动,资本热潮,政策扶持,2023年,在人形机器人这条赛道,各家公司纷纷入局,各方资本尽数涌来。其中,“远征A1”除了吸引到高榕、高瓴、经纬等资本入局,还有李彦宏的私募基金、抖音和地方国资的身影,可谓“资本的宠儿”。


落地难局 

和热闹的创投景象形成鲜明对比的是,人形机器人的产业发展依然有其难以解开的桎梏。

就像稚晖君在发布会上所言,要想让机器人像人类大师般去下棋是相对容易的,但是要让机器人像1岁的小朋友一样去行动,去感知,相当困难。

新的机会来了,但旧的问题仍然在。学界和产业界研究了数十年人形机器人,进展一直很缓慢——很长时间内,“如何平稳走路”仍是核心议题之一。近期,美国人形机器人公司AgilityRobotics的首席技术官JonathanHurst在采访中表示:“它现在只是一个两岁半的孩子。”

同时,虽等来了机器人“大脑”的升级,底层技术的高速进化让整个世界看到了将人形机器人大规模商业化的可能。但国内大模型研讨沙龙中,业内人士指出,现在尚无法用大语言模型,把语言直接“翻译”成机器人的运动指令。用中国科学院沈阳自动化研究所副所长刘连庆的话,简单来说,即“想用ChatGPT直接给机器人长个脑子,现在还做不到”。

清华大学交叉信息研究院助理教授、星动纪元CEO陈建宇便对此中细节也表示了担忧,在他看来,用AI大模型唤醒钢筋铁骨,存在人形机器人的泛化性和任务操作控制的精巧性这两者无法兼顾的技术瓶颈。

一位机器人从业人员告诉记者,目前全球范围内,人形机器人都还处于研发阶段,几乎都完全没法实际落地应用。

2023世界机器人大会现场

此外,高昂的成本,也是人形机器人面临的另一个巨大挑战。

国金证券曾对特斯拉人形机器人做了全身拆解——实现智能感知,需要3个摄像头、1个毫米波雷达、1块AI芯片,以及价值1.4万元的其他传感器,共计2.54万元,而这只占到总成本的14.55%。其中最核心的执行器,需要14个,价值3.43万元,占总成本的19.64%。初步推算,一个人形机器人,光材料成本就大约需要17.5万元。

颇多机器人创业团队坦言,做人形机器人和以前的创业不一样:互联网时代做个APP,可能几个人就够了,所以那时候能听到很多个人英雄主义的故事。但现在几个人的小公司,可能连电费都付不起。这个行业的参与者,要么是谷歌、微软等不差钱的科技巨头,要么是头部的创业公司,抑或是传统工业巨头、高校研究所。

但正如美国加州大学洛杉矶分校机器人与机械实验室创始人DennisHong所言,“如果你问我什么时候机器人才能在我们的生活中真正使用起来,三年前我可能会说,如果我这辈子看见就不错了,但是现在我不这么认为。”如此发展势头下,马斯克所言“3~5年完成量产”有些乐观,但也并不是不可能。


至于人形机器人会取代我们吗?

坐在记者对面的余姚“机器人智谷小镇”相关负责人,顿了顿,反问道:“漫漫科技长河中,所有划时代的新技术,哪样没取代一些劳动力岗位?”在他看来,这是人类必须经历的“成长痛苦”,“尚不论第一批人形机器人,替代的是那些危险、无聊、重复的工作。技术迭代取代岗位的同时,一些新岗位正被创造。”

2022年,小镇实现工业总产值50.98亿元的数据进一步印证了他的说法,“人形机器人是下一步,机器人行业,乃当之无愧的风口,未来一片蓝海”。

人形机器人正踏浪而来,身处浪潮中的你,准备好了吗?