近日,首届中国具身智能大会(CEAI 2024)在上海举行。作为人工智能领域的前沿热点,具身智能正逐步从理论走向实践,从“实验室”走向“应用场”。

什么是“具身智能”?有行业人士将其概括为“是有物理载体的智能体”。事实上,“具身智能”不是一个新概念。此番“具身智能”再次成为学界和产业讨论的焦点,离不开大模型的火热。

从深度学习到ChatGPT、Sora等大模型横空出世,人工智能正在迈向通用智能的路上不断探索。大模型首次展示出可以解决跨领域多任务的能力,且拥有满足人类需求的交互能力。但这种交互仍局限于数字世界。“我们希望也能在真实物理世界中实现交互,这意味着要让人工智能拥有实体,让它们像人类一样具备感知、思考和行动能力,也即具身智能。”中国工程院院士、同济大学蒋昌俊教授表示。

有了大模型的加持,具身智能将成为会思考的机器人,有好奇心,有自主学习能力,能不断自我进化。过去我们谈到机器人、机器狗时,很难用“栩栩如生”这个词来形容。而今,情况在变化。

在大会展区,记者了解到,腾讯MAX2.0机器狗的动作和运动状态展现出很高的灵活性,快跑越障、快跑跨栏已经不在话下,甚至能表现出像“真狗”一样的捕猎和追逐姿态。傅利叶智能展出的一款高1.65米的人形机器人,可实现快速行走、敏捷避障、稳健上下坡,并结合认知智能,与人协同完成动作。

中国具身智能大会上,展商带来的“机器狗”正在演示“双腿双轮”站立。(受访者供图)

腾讯Robotics X实验室智能体中心负责人韩磊介绍,机器狗之所以显得越来越有“灵性”,是因为他们在收集了很多动物姿态数据后,用生成式模型进行预训练学习,以控制机器狗的运动姿态越来越像动物。未来,实验室还将基于多模态大模型,让机器狗更智能,能听懂人言,完成人类的各种指令和复杂任务。

中国具身智能大会上,展商带来的“人形机器人”。(受访者供图)

谈及未来,随着人工智能向通用智能发展,行业期盼机器人能真正从“专才”走向“通才”。清华大学交叉信息研究院助理教授弋力解释道,所谓“专才”,是说当下机器人更多是在特定的环境中完成特定的任务。而“通才”意味着机器人能在开放环境中执行开放任务。

一旦成为“通才”,具身智能机器人将有着巨大应用空间。中国工程院外籍院士张建伟介绍,在物流服务、救援服务、自动驾驶服务、现代农业服务、家庭服务等场景中,具身智能与产业的结合已经有了雏形。

不过,学界和产业界也坦言,具身智能还有不少关键技术待突破。作为多学科技术交叉行业,具身智能对产业协同创新也有迫切需求。大会上,上海具身智能产业与创新联盟正式成立,初始成员包括具身智能产业链上下游企业、高校、研究机构等单位。

人形机器人已被列入上海重点产业链细分赛道。记者了解到,上海将以“应用牵引、场景驱动”为导向,深化本体、具身智能大模型技术攻关,加快突破电驱动关节、灵巧手等关键零部件技术。