机器人与人类的比例未来可能超过 1:1。”马斯克在上海举办的世界人工智能大会上,通过视频连线“隔空”表达了他对人形机器人的笃信与狂热。

特斯拉机器人“擎天柱”(Optimus)此次也首登国内,亮相在世博展览馆的公共展区,现场吸引了大量的围观与打卡合影。这款5英寸8英尺(173cm)、体重 73kg的特斯拉人形机器人未来会在3-5年内量产,目标是百万台,单台价格也会降至2万美元。

在马斯克的量产蓝图中,数亿计的人形机器人将抵达的是通用人工智能(AGI)的终极形态——具身智能。未来的通用人工智能不仅要能思考、做推理,还应该有灵活的四肢和身体、有敏锐而灵活的感官,以具备更深层交互的能力。届时,未来地球上机器人的数量将会超过人类的数量。机器人算力远超生物算力,从而去帮助人类去完成重复的、危险的、人类不愿意做的工作。

ChatGPT横空出世后,机器人公司纷纷出要寻找AI大模型与硬件的结合点,沿着具身智能的路径生产出更聪明、更像人的机器人。达闼机器人当天发布的机器人多模态大模型RobotGPT、云深处研发的能跑能跳、能空翻的机械狗,以及场馆中处处可见的各种机器人元素,都显示出了行业积极不愿错过技术浪潮的决心。

业界普遍还处在接触大模型的兴奋期,但对于大模型在机器人上的优先落地场景、具身智能距离有多远、机器人解放人类劳动的未来,理想与现实中间有更多冷静的声音。

机器人行业中一直存在一个经典悖论——物理世界中最难解决的“容易”问题。如蹲下、起身、跳跃、转圈等等,对机器人来说,这些简单的动作都需要极为复杂的机械控制系统来实现。而现实生活中常见的简单任务,如做饭、冲咖啡、搬货,把流程分解成每一个动作,并且要做到“不走形”。这一类“容易”问题层层累加,难度是指数级递增的。

精密运动控制方面的进展远远落后于语言模型的进展。OpenAI曾在早期专门设立机器人部门探索通用人工智能,研发出了单手拧魔方的机械臂机器人,最后还是因数据不够丰富、实现难度大在2021年宣布关停转型。OpenAI联合创始人 Wojciech Zaremba在播客中讲到,如果OpenAI是一家机器人公司,或许机器人的探索会继续下去。“构建 AGI 来看,机器人目前目前还有所欠缺。当创造机器人时,我们以为可以凭借自主生成数据和强化学习走得很远。”

现场一位大模型公司的CEO告诉界面新闻,与基于软件平台的“对话机器人”的逻辑推理、或者更高层次的“生成式涌现”不同,目前活跃在一线的商业机器人、工业机器人整体走的还是自动化控制路线,需要解决的更多是机械控制问题。要解决这些问题,算法是有边界的,大多数研发与工程瓶颈被卡在传感器、控制器这一类硬件单元上,软硬件的智能融合处于非常早期探索阶段。

中国科学院院士、图灵奖得主姚期智在世界人工智能大会上发表演讲,将具体智能视作ChatGPT爆火后的下一个方向,但他同时承认强化学习的速度还无法满足能思考、能行动的具身功能要求。大模型目前最容易想到的垂直落地场景、可以帮助人类的还是文书工作。

智能机器人在物理世界中投用需要面对复杂多变的环境问题,环境是决定机器人去向何方的关键挑战。以色列智能机器人合作委员会主席约西·拉哈达(Yosi Lahad)提出,无论是用于运输的叉车机器人、还是工业生产的协作机器人,精益生产原则都要求机器人都必须在不同工作环境中兼具灵活性与稳定性。

根据高盛先前发布的报告统计,预计全球将有3亿个工作岗位被生成式AI取代,其中律师和行政人员所受影响最大,对体力要求较高的职业或户外职业受影响较小,例如建筑和维修工作。

按照机器人发展的传统思路,技术含量不高的重复性制造业工种最容易被大规模的机器人设备所取代。而联合国在《机器人与发展中国家的工业化》报告中分析发展国家将是变化的首发地,近三分之二的工作将被代替,且以体力劳动者为主。

当下,机器人密度正在不断提高。2021年每1万名制造业工人的机器人引进数量相比2015年翻了一番。中国是机器人密度上升速度最快的国家,2015年中国工业机器人密度仅为49台,低于世界平均值,2021年就达到每万人322台,增长近13倍并首次超越美国,排名世界第五。按照国家战略目标,到2025年这一数字要达到每万人482台。

未来无疑需要更多的机器人,但更聪明的机器人究竟会以什么样的形态出现,具身智能的理想与现实之间还缺少一个奇点时刻。大模型的爆发点燃了兴奋的火苗,行业将继续出发寻路。