打造出跟人类本身具有相同形象的机器人,一直是人类的梦想。毕竟,在很多人第一印象里,机器人应当是类似于人形的机器。尤其是20世纪中叶,科幻作品中大量出现“仿人机器人”的形象,形塑了人们对于机器人的想象。这种机器人往往被设计为拥有四肢、躯干、头部,甚至五官,与人类尺寸相当。

当然,由于人形机器人技术上的困难,在实际生活中,我们看到的或者是用到的机器人,大部分并非人形。而ChatGPT的爆火,给了人形机器人一次新的机会。当前,人形机器人领域正呈现一片热闹非凡的景象,并朝着真正意义上的“人形”一路奔去。


为什么需要人形机器人?

相较于其他形态的机器人,人形机器人具有特殊的意义。

一方面,人形机器人能够更好地充当人类的劳动力,马斯克不止一次强调,人类文明所面临的最大风险之一就是人力短缺,人类更应该将精力放在脑力劳动而不是体力劳动上。然而,要让机器人更好地充当人类劳动力,就需要让机器人也适应我们人类的生活。因为我们的社会是根据人类本身来设计的,而一个像是人类的机器人,就能够很好满足这一条件。

比如,我们之所以把机器人做成人形,不用轮胎而用双脚行走,正是为了适应移动时的环境。人类希望机器人的活动范围不被局限于路面上——为了方便直立行走的人类,我们周遭尽是楼梯和门扉,生活空间中存在着许多可以在步行过程中跨越的高低差。尽管如今全社会都为了照顾轮椅使用者而努力推广无障碍设施,但人的行动范围里仍免不了存在障碍物。因此,对于机器人来说,仅仅像扫地机那样避开地板上的障碍物显然是不够的,机器人还要时不时上下楼梯。

人形机器人能够对应我们的社会而生,才能实现最高效率的劳动力。也就是说,把机器人做成“人形”的理由之一,就在于机器人执行任务时所处的环境其实是迁就人类的体型建造起来的。衣服、桌椅、杯子、手机、汽车等等,人们眼中的这个世界,全都是为了方便人类这种“人形”生物才如此设计的。如果出现了新形态的机器人,人们就必须重新设计一套机器人能够适应的全新环境。

另一方面,则是需求所致。在很多领域,机器人作为服务者,只有人类的外表才更容易被接受。比如,产后护理、幼儿陪伴、老人看护等——人类与人形机器人更容易产生情感上的交流,这就是“恐怖谷”效应的第一段曲线上升部分。“恐怖谷”效应由日本现代仿真机器人教父森政弘于1970年提出:当仿真机器人的外观与动作相似,但并非完美拟合时,人类作为观察者会产生厌恶反应。

比如,我们对人形机器人或玩偶的好感度,会随其仿真度提高而增加,当仿真度达到一定比例时,当我们看到既不像人类也不像典型机器人的仿真机器人时,情感会突然逆转,本能觉得不正常并产生厌恶和恐惧等回避反应。只有当仿真度继续提高,我们的情感反应才会再度回转。

举个例子,当我们听到走廊里传来家人的脚步声时,往往会立刻知道“是谁回来了”。有时,我们能隔着老远就认出朋友的身影。人的行走步态看似相近,但其实大相径庭——身高和体重各不相同,各年龄段的肌肉量也有所差异。我们区分谁是谁,凭借的可不仅仅是脸型、体型等静态外观。我们不仅能通过静态的肢体特征认人,还能通过肢体的运动特征认人。

从这个角度来看,比起用轮胎滑行的机器人,用双足走路、会发出脚步声的机器人更容易被人注意到,从而更让人有安全感。


人形机器人为什么难做“人”?

二十一世纪,AI技术的快速发展曾让人形机器人获得了一次质的跃迁,但当AI的技术进展放缓之后,人形机器人的发展也逐渐慢下来,甚至可以说举步维艰。

从技术角度来看,一个人形机器人身上集合了超过200种不同的技术:它必须会听、会看、会移动、做动作、抓取物体、开门、爬楼梯,必要时还要背起人类或帮助人类走动。所以,这意味着在考虑赋予它何种类型的智能之前,要先掌握光学、力学、水力学、电子学、材料学、齿轮传动和驱动系统。其中,最迫切的问题之一是平衡:人类因为有内耳,所以总能保持平衡,一旦发生平衡障碍,内耳会进行矫正。人形机器人没有这种工具,它必须能够自主控制驱动它的力量。

于是,庞大的研发成本,让不少机器人公司都陷入了财政危机。Pepper、ASIMO、Atlas作为人形机器人行业先驱,或告别市场,或找不到合适的应用场景。

由于缺乏商业价值,本田在2018年逐步停止了人形机器人的研发工作,曾经风靡一时的Asimo机器人也开始慢慢退役,不再进行演出和展览。停止研发的原因,主要是缺乏商业性,庞大的研发成本使公司无法赚取足够的利润。而对于大部分人来说,人形机器人表演已经失去了新鲜感。

虽然近年来,产研界关于人形机器人的动作明显增多,但对于人形机器人来说,依然缺少一个重大突破推动人形机器人的发展进入下一个阶段。当前的人形机器人不仅价格高昂,而且实际的产品体验往往欠佳。

一方面,当前的人形机器人在硬件层面所牵涉到的很重要的一个问题,就是灵活性。由于机器人是由机械零部件组装而成,而这些机械零部件跟人体的骨骼与神经控制系统有很大不同,要想让人形机器人到达类人这样的灵活度,或者说至少要让人形机器人看起来像个人,那么要达到这样的效果,在硬件层面还需要很长的一段路要走。

另一方面,是当前的人形机器人只能对标准化问题的程序进行回复,跟智能几乎没有什么关系,超出标准化的问题,人工智能就不再智能,而变成了“智障”。也就是说,当前的AI,在很大程度上还只能做一些数据的统计与分析,包括一些具有规则性的读听写工作,还不具备逻辑性、思考性,而在控制整个硬件躯体方面更是处于起步阶段。

因为人体的神经控制系统是一个非常奇妙系统,是人类几万年来训练下所形成的,显然,当前的人形机器人不论是在单纯的AI思考性方面,还是在与机器人硬件的协调控制方面,都还只是处于起步阶段。


人形机器人的新拐点

当然,不论我们是否接受,人与机器人共同生活与协作,都将是未来社会的一种常规模式。这也是为什么科技巨头烧钱都要进入这个行业的原因。

比如,以家电产品“出圈”的戴森就进入了人形机器人领域,目前,戴森已发布的是一款能拿起漂白剂、夹起盘子的机械臂。而戴森的愿景是,在未来10年内推出可以做家务的人形机器人。凭借在扫地机器人、吹风机和吸尘器等产品在家庭服务领域积累的经验和技术,戴森计划以自己的优势技术来打造一个家用保姆人形机器人。

再比如汽车大厂比如特斯拉,2022年,特斯拉带来了Tesla Bot人形机器人“擎天柱”原型机的全球首秀。在发布环节中,人形机器人从幕后缓缓走上前台,并向台下观众挥手致意,做出多个简单动作。马斯克表示,特斯拉机器人最初的定位是替代人们从事重复枯燥、具有危险性的工作,但远景目标是让其服务于千家万户的日常工作。事实上,机器人“擎天柱”有明确的生产目标,就是成为特斯拉工厂的生产力。因此公司在大规模量产的同时也在控制成本。为了达成这个目标,特斯拉引入了大量的造车经验,用在该产品的生产上。

此外,还有以优必选科技和波士顿动力等为代表的纯机器人公司。其中,近期,深圳优必选科技就向港交所提交招股说明书、冲刺人形机器人第一股。现在,ChatGPT的横空出世,人工智能被认为迎来了继AlphaGo之后再次实现质的突破。随着AI赋能愈发强大,人形机器人或许也将迎来应用加速落地的新拐点。

ChatGPT的爆发为人形机器人解锁了更多场景,比如ChatGPT背后的大模型技术,结合后将进一步提升机器人的智能程度——根据研究人员做的心智测试,结果发现,ChatGPT已经拥有9岁小孩的心智了。从智能的本质来看,人类心智与人工智能只不过是这个世界的两套智能,而这两套智能的本质都是通过有限的输入信号来归纳、学习并重建外部世界特征的复杂“算法”。

因此,理论上来看,只要我们持续地对人工智能进行教育,用庞大的数据训练人工智能,人工智能迟早可以运行名为“自我意识”的算法。

人工智能能够通过心智测试并不意外,今天的ChatGPT虽然只有9岁小孩的心智,但在更庞大的数据的训练下,在未来,人工智能将拥有真正与人类相似的思考和心智。人形机器人的应用领域也将从教育及娱乐进一步拓展到健康养老、消杀、物流等赛道,机器人从自动化到自主化智能的转变将带来重大发展机遇。

如果说,作为自动执行工作的机器装置,近年来,随着人工智能交互技术的应用,人形机器人的智能化程度有了显著的提升。那么现在,全世界瞩目的ChatGPT则为人形机器人加了一把火,或许,随着ChatGPT的到来,人形机器人也将迎来一个新的发展拐点。