“人工智能拥有了身体,人形机器人拥有了大脑。人形机器人是具身智能的最佳实践。”3月30日,来自中电科机器人有限公司的机器人中心主任王春雷在2024中国具身智能大会“大模型与具身智能”论坛上分享道。当前,大模型和具身智能已成为了推动人工智能未来发展的关键力量。大模型,依托于大规模数据和强大算力,已经开启了人工智能的新纪元,为理解复杂数据提供了前所未有的能力。而具身智能,强调智能体在真实物理环境中的身体存在,通过与环境的直接交互学习,显著提高了机器对物理世界的理解和适应能力。这两大技术领域的结合,预示着一个更加智能化、互动化的未来。

那么具身智能到底是什么?它对实际生活产生什么影响?能应用到哪些场景?具身智能其实是像人一样通过观察、移动、沟通,并与周围环境感知交互,从而能够自主决策并完成一系列任务的机器人,具有外观上类人型形态、反应能力强人工智能、应用方式强交互互动、适用环境多元复杂的特点。正如王春雷在论坛中提到的“具身智能强调与环境感知的实体,以及自主规划决策的智能,而人形机器人具备最具仿生科学性的实体,同时具备最泛化、最全面的智能”。

当前,国内人形机器人具备完善的工业产业链,为其提供了强大的制造和技术支持。与日益增长的市场需求相结合,国内人形机器人在巨大的需求优势下拥有广阔前景。中国电科此次带来了最新研究成果“电科机器人一号”人形机器人,全身拥有39个关节,通过控制系统采用自适应的步态识别算法,实现高稳定性平衡步态,并融入视觉感知与智能规划算法,实现双臂灵巧操作。“双臂协同控制可以实现人形机器人双臂之间的协同作业与精准控制,通过大模型则可以实现人形机器人机械臂的通用语言控制。”

而位于徐汇的上海人工智能实验室作为国家新型科研机构与重要科技力量,对大模型与具身智能领域开展了长期布局与深入研究,现场也带来了具身智能的前沿技术。

实验室青年科学家赵斌团队首创无人机“对话式”交互新范式驱动自主集群技术革新,聚焦于大模型与具身智能的深度融合,在无人机集群领域实现了前所未有的协同控制水平。通过引入先进的人工智能大模型,团队不仅赋予了单个无人机强大的自主决策能力,更关键的是,他们设计出一套独特的“对话式”交互系统,使得集群中的无人机能够像一个团队一样进行实时沟通和协作。

这种创新的“对话式”交互机制,允许无人机之间通过模拟自然语言交流的方式传递位置、状态、目标信息以及应对复杂环境变化的战术策略。每架无人机均搭载了高度优化的大模型,以实现高效的信息处理和反应,犹如拥有了可以实时“交谈”的智能大脑。实验结果显示,运用此新范式的无人机集群能够在面对复杂、动态环境任务时表现出卓越的适应性和执行效率,显著提升了整体系统的智能化程度和任务完成度。例如,在模拟搜救、环境监测等应用场景下,集群展现高效协调能力和自我组织效能。

实验室青年研究员翟少鹏为大家介绍了新推出的多模态交互智能体框架OpenPAL,这是一种具备环境自适应能力的具身智能框架。研究人员以大语言模型为基座,将视觉、环境信息、策略空间等通用多模态知识融入OpenPAL中,使其具备了真实世界理解能力。在此基础上,通过联合训练方法,OpenPAL面对未知环境时,可通过自我探索学习实现“进化”,同时,相较于传统智能体框架,其部署成本更低,将为人类提供更友好、更可靠的“AI队友”支持,实现“人机共智”。