2023年11月2日,工信部在官网公布《人形机器人创新发展指导意见》,提出人形机器人集成人工智能、高端制造、新材料等先进技术,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,将深刻变革人类生产生活方式,重塑全球产业发展格局。中国计划,到2025年,人形机器人创新体系初步建立,“大脑、小脑、肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。整机产品达到国际先进水平,并实现批量生产,在特种、制造、民生服务等场景得到示范应用,探索形成有效的治理机制和手段。


一、人形机器人简史

人形机器人是指外形和人类相似的机器人。它们可以通过模仿人类的外貌、动作和表情来与人类进行交互和沟通。人形机器人通常具备视觉、听觉、语音、触觉等多种感知能力,并且能够通过自主决策和学习来适应不同的环境和任务。人形机器人的发展历史可以追溯到古代,但真正的发展始于20世纪。以下是人形机器人发展的一些重要里程碑:

(1)1920年代:最早的人形机器人问世。1921年,捷克作家卡雷尔·恰佩克的戏剧《罗瑟姆的万能机器人》中首次提到了“机器人”一词,剧名中的“Robota”一词被用来形容一种经过生物零部件组装而成的生化人——为人类服务的奴隶。这个词后来演化成了 Robot,成为人造人、机器人的代名词。该戏剧引发了人们对于机器人概念的关注。

(2)1950年代:人类工程学研究的兴起。随着工业技术的进步,人们开始研究如何设计机器人来模仿人类的外貌和动作。这个时期的机器人主要用于工业生产线上的简单任务。

(3)1960年代:日本机器人产业的崛起。日本成为人形机器人研发的领先国家之一。在这个时期,能够模仿人类行走和举起物体的机器人开始出现。

(4)1980年代:机器人技术的飞速发展。随着计算机技术的进步,机器人的智能程度得到了提高。这个时期出现了一些具备人工智能和语音识别功能的机器人。

(5)2000年代:专用机器人的发展。除了工业和科研领域之外,人形机器人也开始应用于其他领域,如医疗、教育和娱乐等。这些机器人能够和人类进行更复杂的互动。

(6)2010年代以来:人形机器人成为研究的热点。人形机器人在科研和技术领域的研究得到了广泛关注。一些具备高度复杂动作控制和情感交流能力的人形机器人开始问世。

目前,人形机器人的发展正在不断向前推进。随着人工智能和机器学习等领域的不断进步,人形机器人的智能程度和逼真程度将会不断提高,为人类生活带来更多的便利和创新。

在中国古代,并没有像现代科技中的机器人概念。然而,古代中国的工艺技术卓越,曾经有些能够以人形为模型的自动化机械器械,其中的例子有西周周穆王时的倡优跳舞机器人、唐朝倒酒机器人等。虽然这些古代的机械器械不被称为机器人,但它们展示了中国古代人们对于自动化机械的兴趣和创造力。这些机械不仅仅是艺术品或娱乐工具,更是古代科技与文化的结晶。最近,国内一些公司如小米、优必选、达闼、傅里叶、追觅、智元都在积极布局人形机器人,均普、字节跳动也拟入局机器人,探索把AI大模型能力用到机器人上。


二、人形机器人的三大关键技术及挑战

(1)伺服控制。人形机器人需要具备精准的动作和姿态控制能力,以模拟人类的运动和动作。伺服控制技术可以实现对人形机器人的关节和身体部位的精细控制,使其能够进行各种复杂的动作,如行走、跑步、跳跃等。

(2)人工智能。人形机器人需要具备人工智能的能力,以能够感知和理解周围环境,并做出相应的反应和决策。通过使用机器学习、深度学习等技术,人形机器人可以学习和适应不同的环境和任务,从而实现更加智能化的行为。

(3)运动控制。人形机器人的运动控制技术是实现其复杂动作和灵活移动的关键。运动控制技术可以确保人形机器人的稳定性和平衡性,使其能够在不同的地形和环境中保持平衡,并进行各种动作和运动,如躲避障碍、攀爬等。为了实现高效的运动控制,通常采用传感器和算法来监测和调整机器人的运动状态。

上面这三大问题,进一步可分解为人形机器人研究和开发面临的6个主要挑战:(1)动力和能源管理。人形机器人通常需要大量的能量来驱动各种电动关节和传感器,因此如何实现高效的能源管理是一个重要挑战。(2)机械设计和运动控制。人形机器人需要具备复杂的机械结构和精确的运动控制能力,以模仿人类的运动和动作。解决这些问题需要解决动力学、运动学和控制理论等复杂问题。(3)感知与感知处理。人形机器人需要能够感知周围环境和自身状态,例如使用视觉传感器、触觉传感器和声音传感器。同时,还需要处理这些感知数据来做出适当的决策和行为。(4)智能决策与规划。人形机器人需要具备智能的决策和规划能力,能够在不同的环境中做出正确的选择和行为。这涉及到机器学习、人工智能和运动规划等领域的研究。(5)人机交互与安全性。人形机器人通常是为了与人类进行交互和合作而设计的,因此需要能够理解人类的语言和行为,并能够与人类进行安全的互动。确保人形机器人的安全性和用户体验是一个重要挑战。(6)成本和可用性。人形机器人的研究和开发成本通常较高,并且目前尚未有普及的消费市场。解决这些挑战需要降低成本、提高可用性,并推动人形机器人技术的应用和商业化。


三、人形机器人感知、理解、决策的瓶颈

人形机器人感知、理解、决策的瓶颈主要包括感知能力、语言理解、决策能力和社交交互能力等方面的限制,为此,人形机器人需要建立准确的环境模型,并能够对场景进行分析和理解。这需要借助于机器学习和推理技术,让机器人能够根据历史数据和先验知识,对当前的环境状态和可能的动态变化进行预测和推测。人形机器人感知、理解、决策的瓶颈具体表现为:(1)感知能力有限。人形机器人需要能够感知周围环境的各种信息,包括视觉、听觉、触觉等。然而,目前机器人的感知能力还远远不及人类,无法像人类一样从复杂的场景中获取准确的感知信息。(2)理解语言和上下文。人形机器人需要能够理解人类的语言和上下文信息,并从中抽取出关键信息。然而,自然语言理解在处理复杂的语义和语用信息时仍存在困难,机器人往往不能准确地理解人类的意图和需求。(3)决策能力不足。人形机器人需要能够根据感知和理解的信息做出合理的决策。然而,在面对复杂、不确定的环境时,机器人往往难以做出准确且适应性强的决策。这涉及到机器人的推理和规划能力的提升。(4)社交交互能力有限。人形机器人需要具备良好的社交交互能力,能够理解人类的情感和意图,并以适当的方式与人类进行交流。目前机器人在这方面的能力仍然有限,无法像人类一样进行情感交流和社交互动。综上所述,提高人形机器人的态势感知能力需要结合传感器技术、机器视觉算法、数据融合和处理、环境建模和场景分析以及实时决策和规划等多种关键技术,这些技术的不断发展和创新将为人形机器人的态势感知能力提供更大的提升空间。


四、人形机器人的自主与协同

人形机器人的自主与群体协同竞争是指机器人可以在独立执行任务的同时,在团队中与其他机器人进行协同配合,以实现更高效的工作。

首先,人形机器人的自主竞争能力是指机器人具有独立决策和执行任务的能力。机器人可以根据感知到的环境信息和任务目标,自主选择行动策略,并实时调整策略以适应不同的情况。例如,在一个工厂生产线上,人形机器人可以根据传感器获取的数据进行分析和判断,自动完成装配、搬运和包装等工作,而无需人工干预。这样可以提高工作效率,降低劳动力成本。

其次,人形机器人的群体协同竞争能力是指多个机器人在一起工作时,能够相互合作和协调,实现更复杂的任务。机器人之间可以通过无线通信、传感器共享等方式进行信息交流和协作。例如,在一个物流中心,多个人形机器人可以根据指令分工合作,实现快速搬运和仓储管理。机器人之间可以根据彼此的位置和负荷情况进行任务分配,避免冲突和重复工作,提升整体工作效率。

在自主与群体协同竞争中,人形机器人需要具备先进的感知、决策和执行能力。感知能力可以通过视觉、听觉、触觉等传感器实现,以感知环境中的障碍物、目标物体和其他机器人。决策能力可以通过机器学习和人工智能算法实现,以分析感知数据,并生成相应的行动策略。执行能力可以通过运动控制和力触反馈等技术实现,以实现准确和灵活的行动。

人形机器人的自主与群体协同竞争将会在工业生产、物流配送等领域发挥重要作用。通过提高机器人的自主决策能力和协同合作能力,可以提高工作效率,降低人力成本,推动社会产业的发展。人形机器人的自主程度可以分为以下几个级别:

第一级零自主,机器人完全依赖于外部控制,无法独立决策和执行任务。它们仅根据预先编程的指令进行动作,无法适应环境变化或处理复杂任务。

第二级有限的自主,机器人能够通过传感器获取环境信息,并根据预先设定的规则和算法做出相应的决策。它们可以执行一些简单的任务,但对于复杂的情况仍然需要人类的监督和指导。

第三级部分的自主,机器人能够感知环境,分析和理解复杂的信息,并基于自己的判断做出决策。它们可以在一定范围内独立执行任务,并具有一定的适应性和学习能力。然而,它们仍然需要人类的指导和干预来解决更复杂的问题。

第四级高度的自主,机器人具有高级的感知和认知能力,能够全面理解环境和任务要求,能够根据不同情况灵活地决策和行动。它们可以在不同环境中自主执行各种任务,并能够适应变化和学习新的知识和技能。它们可以独立解决复杂的问题,而不需要人类的直接干预。

需要说明的是,目前人形机器人的技术仍然在发展中,大多数机器人仍处于有限自主或部分自主的阶段。高度自主的人形机器人仍然是一个挑战性的目标,需要更多的研究和技术突破才能实现。


五、人形机器人的测试与评价

总体来说,评价人形机器人需要综合考量其交互能力、动作控制能力、感知能力、决策能力以及用户体验等方面的表现。同时,可以借鉴人形机器人的应用场景,对不同的任务和环境进行定制化评价。具体而言,人形机器人的测试与评价可以从以下几个方面来考量:

(1)人机交互能力

人形机器人是否能够与人类进行自然、流畅的交流,包括语音识别、语义理解、语音合成等能力。测试可以通过与机器人进行对话、提问、指令等方式进行。

(2)动作控制能力

人形机器人是否能够准确地完成各种动作与姿势,如走路、跑步、跳跃、抓取物品、握手等。测试可以通过观察机器人的动作执行情况来评价。

(3)感知能力

人形机器人是否能够准确感知周围环境的人和物体,包括识别人脸、物体、声音等。测试可以通过模拟各种场景来评估机器人的感知能力。

(4)智能决策能力

人形机器人是否能够根据周围环境和任务需求做出智能决策,包括路径规划、任务分配、问题解决等。测试可以通过给机器人不同的任务或情境来考察其决策能力。

(5)用户体验评价

人形机器人的外观、声音、交互方式是否符合用户需求,是否能够给人带来愉悦和舒适的体验。可以通过用户调查、反馈等方式进行评价。


总而言之

人形机器人可以被视为一个典型的人机环境生态系统,包括人形机器人、人类用户和周围的环境。人形机器人作为机器人智能化技术的体现,通过传感器、处理器和执行器等技术来感知、处理和响应环境的变化。它可以与人类用户进行交互,通过语音识别、图像识别、姿势识别等技术进行沟通和理解人类的意图。人形机器人还可以与环境互动,通过移动、抓取和操作等方式来完成任务。人形机器人和人类用户的交互是人机环境生态系统的重要组成部分。通过与人形机器人的交互,人类用户可以向其传达指令、提供信息,并从中获取服务和反馈。人形机器人可以根据人类用户的需求和意图来做出相应的行为,提供相关的服务和支持。周围的环境也影响着人形机器人的行为和性能。环境中的物体、场景和其他人类用户的存在都会对人形机器人的感知和决策产生影响。同时,人形机器人也可以通过与环境互动来获取信息和执行任务。因此,人形机器人可以被视为一个典型的人机环境生态系统,其中机器人、人类用户和环境之间相互作用,共同构成一个复杂且动态的生态系统。