之前,机器人技术和AI技术之间是分开做的,实际上没有完全像人类一样,我们的大脑之间是相互控制、相互连接的。

在近日由璞跃中国举办的“迈入机器人新时代: 具身智能”Global Tech Network上,优必选语音技术科学家黄东延谈道了大模型对于具身智能研发的巨大影响。

以ChatGPT为代表的大模型,及迅速发展的多模态模型,让人形机器人负责思考的“大脑”与负责运动的“小脑”真正可以连接起来,也正因此,以人形机器人为代表的具身智能,成为大模型“百家争鸣”之后的下一个热门风口。

那么,2024年,会是人形机器人的爆发“元年”吗?人形机器人又面临哪些产业难点?


90%的“研”与10%的“发”

2023年,“小贝4.0双足人形机器人”在世界人工智能大会正式亮相,即刻吸引了行业内外的广泛关注。上海理工大学机器智能研究院执行院长李清都教授正是小贝4.0研发团队的核心负责人。在他看来,在未来,人形机器人会如同现在的智能手机一样普及,具有通用属性的人形机器人加上某种学习的技能,就如同现在智能手机搭载了某款特定的APP,“一个技能就能替代我们某个行业里面的工作。”

但也正因为人形机器人“像”人,其技术研发上存在着诸多难点。“我们讲汽车研发,research的部分只有5-10%,再加90%左右的development,但是机器人,我们发现几乎是倒着的。”

前小鹏机器人产品设计负责人孙兆治谈道,“其实每一步都有大量的难题,我认为我们今天的机器人,很多技术还停留在实验室阶段,只有一部分走出来了。”

在技术上,人形机器人尚存有哪些难点?李清都认为,“小脑智能”是最难的,目前,大脑和肢体很多人在做,但小脑则是连接起大脑和肢体的桥梁,起到了承上启下的作用,如何让机器人和人一样具备自主学习运动技能、完成技能迁移的能力?这是李清都团队目前正在攻克的方向之一。

此外,李清都重点谈道了肢体的技术路径选择中,肌腱驱动或许是一个非常好的方向,尤其是灵巧手和表情方面,“因为我们一个人大概几百多块肌肉,每个肌肉都要进行控制,如果机器人灵活性达到一定程度,动态性能上去的话,可能肌腱驱动是非常好的方向。”

AI大模型的出现或许是打破人形机器人“大脑”“小脑”“肢体”分立的关键。黄东延分享道,“计算机视觉语言交互、人机交互、伺服驱动器、机器人运动规划及控制……在AI 2.0时代,我们会看到它们之间可以直接通过大模型连接,一方面做‘大脑’,另一方面通过具身智能进行‘小脑’的开发。”

在某种意义上来说,人形机器人更像是大模型感知物理世界的一个载体,“大模型作为‘大脑’,是没有与外界物理世界的直接交互的。人形机器人可以帮助AI大模型进行感知物理世界,而且可以理解物理定理,可以操作环境上下文,利用多模态感知控制自己的身体,完成复杂的任务。”黄东延介绍道。


安全性与经济性是产业难点

按照特斯拉CEO马斯克的预测,在未来,假设人形机器人与人口比例为2:1,人形机器人需求量有望达到100亿~200亿台,人类对其需求甚至会远远超过汽车。

不过,尽管技术难点有望借助大模型得以突破,但在产业化的过程中,人形机器人也依然“雄关漫道真如铁”。

对于产业化来说,人形机器人能在哪些场景率先应用落地,是各方关注的焦点。孙兆治认为,人形机器人的“终局”会落在“人居环境”上,“全无人的场景对于人形需求反而没有那么强。”孙兆治谈道,人形机器人的优势恰在于“人形”本身可以解决人本身移动跟操作的对于空间的要求,并提供更多的亲和力。但从最先落地的角度来说,结构化或半结构化的产线或工业环境可能是最优选。

场景落地需要哪些关键要素?上海机器人产业技术研究院主任周梅杰谈道,在某个场景落地的关键是“价格一定要低”,而这也就意味着需要对技术研发平台、开发者平台,甚至是教材,做好一定的长期储备工作。而打下价格的另一个关键则是供应链。“如果要降低成本,一个是大批量生产;第二要采用国产自研或者我们自研的传感器、伺服电机等关键零件。”黄东延表示。

除了经济性问题外,安全性问题也同样是落地需要关注的焦点。李清都认为,安全性问题可以分为两个层面,其一为是否会造成直接伤害,因为“人形机器人它最大应用场景一定是跟人机协作,在人的环境下面工作。”而另一方面则是信息安全,作为如同手机一样的信息终端,人形机器人具有实体,信息安全更为重要,“晚上睡觉的时候,机器人被远程操作,是我们不可想象的。”

AI的产业化应用进入长跑期,无论是积极入局的企业,还是“及时雨”般的政策扶持,都在为人形机器人时代序幕的开启积淀新的力量。璞跃中国表示,在2024年,璞跃中国也将继续为全球科技创新力量搭建活跃的、高质量的交流平台,期待与更多合作伙伴携手见证人形机器人产业化、商业化迎来破晓时刻。