当机器人遇上ChatGPT，会擦出怎样的火花？

编辑:我爱机器人发布于:机器人技术2023-06-113089

ChatGPT设计出首个机器人。

人工智能发展史上的一个新的里程碑惊现于世。

近日，研究人员借助ChatGPT的帮助，设计并研制出了一款番茄收割机器人。

在这项的案例研究中，来自荷兰代尔夫特理工大学和瑞士联邦理工学院的研究人员向ChatGPT-3寻求帮助，让其参与了机器人的设计和制造。

让我们来看一下研究过程。

首先，研究人员问，“人类未来面临的挑战有哪些？”ChatGPT-3回答：食物供应、人口老龄化和气候变化。研究人员选择了食物供应作为机器人设计的方向，然后问ChatGPT-3一个番茄收割机器人应该具备哪些特征？ChatGPT-3表示：一个由马达驱动的夹子，用于从藤蔓上拽下成熟的番茄。

一旦确定了大致设计，研究人员就可以进行设计细节的决定，包括使用什么材料和编写什么控制代码。目前，语言模型还不能生成完整的计算机辅助设计（CAD）模型、评估代码或自动制造机器人，所以这一步需要研究人员扮演“技术员”的角色，协助完成这些方面，优化语言模型写出的代码，完成CAD并制造机器人。

根据ChatGPT-3提供的技术建议，研究人员制造了他们的机器人夹子，并在现实世界中进行了测试，用它来采摘番茄，结果很成功。他们的案例研究展示了人类和语言模型之间的协作在改变设计过程方面的潜力。

在设计阶段，ChatGPT告知他们哪种作物在自动化方面最具经济价值。在实施阶段，ChatGPT也提出了有用的建议：用硅胶或橡胶制作夹具，以避免压碎番茄；Dynamixel电机是驱动机器人的最佳方式等。人类和人工智能携手合作，最终研制出了一个可采摘番茄的机械臂。

研究人员发现，人工智能和人类的合作积极且高效。在最极端的情况下，人工智能为机器人设计提供了所有输入，而人类则盲目地遵循它。而在本案中，ChatGPT充当研究员和工程师，人类则充当管理者，负责明确设计目标。

与此同时，ChatGPT也给国内机器人市场掀起了一阵浪潮。

越疆工程师们经过一番研究，将ChatGPT与协作机器人结合，在物理世界做出了应用实践。

在越疆机器人调酒项目中，工程师们将ChatGPT巧妙融入其中，让机器人成为了一名优秀的调酒师。据介绍，越疆前期对ChatGPT进行了训练，详细告知它应该扮演的角色，各式鸡尾酒的配方、口感等内容。经过训练后，机器人调酒师变得可靠又贴心，拥有更多自主判断能力。

当你提出需要一杯能让心情好起来的鸡尾酒时，ChatGPT会推荐一杯“蓝色夏威夷”，酸酸甜甜的口感，有助于恢复心情。

若你表示酒比较酸，ChatGPT会根用现有材料椰奶来中和酸味，而普通AI大概率会因为这种模糊需求不知所措，发出“我不明白您在说什么”的感叹。

更重要的是，在被授予越疆协作机器人控制接口信息后，ChatGPT会根据不同鸡尾酒的特点，为机器人生成摇酒轨迹和代码，然后机器人调酒师就能帅气地制作各式各样的鸡尾酒。

其实，在ChatGPT发布之前，就有一家国外机器人公司 Engineered Arts将其人形机器人Ameca接入GPT3，实现其人形机器人可以自由地跟工程师对话。Ameca曾因丰富且超逼真的人类表情而引起了大量的关注。

ChatGPT以其强大的信息整合和对话能力惊艳了全球。它可以对各种提示和问题生成符合人理解的响应，用于生成文本、翻译信息……微软在OpenAI上投入了数十亿美元，还将ChatGPT集成到必应搜索引擎中，把ChatGPT的功能扩展到控制机械臂和空中无人机。

早些时候，微软进行了一项研究，探索如何使用OpenAI的新AI语言模型ChatGPT来使自然的人机交互成为可能。

这项研究的目标是看ChatGPT是否可以超越文本思考，并对现实世界进行推理，以帮助机器人完成任务。研究的关键挑战在于教会ChatGPT如何通过考虑物理定律、操作环境以及机器人运用肢体动作改变周遭环境的方式来解决问题。研究者希望以此便利人们与机器人的互动，而不需要学习复杂的编程语言或机器人系统的细节。

事实证明，ChatGPT本身可以做很多事情，但它仍然需要一些帮助。论文中描述了一系列可用于指导语言模型解决机器人任务的设计原则，包括但不限于特别prompt结构、高级API和通过人类文本反馈。他们认为，这项工作只是开发机器人系统的转变的开始，并且希望通过这项研究激励其他研究人员加入这个有趣的研究领域。

写在最后

尽管语言是人类表达意图的最直观的方式，但此前很长一段时间，人们仍然严重依赖手写代码来实现对机器人的控制。不过，当ChatGPT出现之后，这种情况将发生改变。

目前机器人的操作流程是从工程师开始，需要他们将任务需求转换为系统代码。工程师会处于工作流程的回路中，他们需要不断编写新的代码和规范来纠正机器人的行为，缓慢、昂贵且低效。

但ChatGPT开启了一种新的机器人模式，允许潜在的非技术型用户参与到回路之中，在监视机器人性能的同时向大型语言模型（LLM）提供高级反馈。通过遵循研究的设计原则，ChatGPT可以为机器人场景生成代码。在没有任何微调的情况下，利用LLM的知识可以控制不同的机器人形状来完成各种任务。

未来，机器人＋ChatGPT又将达到什么程度？我们不妨拭目以待。