2023年是大模型占据科技热门话题榜单绝对C位的一年。国际上,在掀起ChatGPT热潮之后,OpenAI投资了挪威一家人形机器人公司1X Technologies,让大模型与具身智能的融合成为风靡世界的科技新风口。

斯坦福大学AI实验室主任李飞飞教授团队在今年7月公开一项具身智能研究项目,项目中接入大模型的机器人可以根据人类发出的语言指令,完成各种动作。谷歌旗下DeepMind团队随后也发布了名为Robotics Transformer 2的视觉-语言-动作模型。


一时之间,大模型加持下

具身智能机器人成科技界新风向标

国内方面,在大模型和机器人技术的加持之下,具身智能机器人也成为重要的布局方向。刚刚过去的亚运会,宇树科技研发并投入使用的机器人在会场格外吸睛,“中国智造”力量在亿万人瞩目的大舞台上绽放光彩。

科大讯飞也于近期升级了机器人超脑平台,亮相大模型+具身智能人形机器人。科大讯飞董事长刘庆峰表示,星火大模型的推出将让AIBOT赋能机器人发展进入到一个全新的阶段,人形机器人对复杂任务的拆解、开放场景的物体寻找明显提升,在强化学习泛化抓取、仿人行走的复杂地形运动能力上都比主流系统有一个非常大的提升。“下一步我们将以人形机器人为牵引,来推动‘视觉-语言-动作’多模态具身大模型,能够更好的助力机器人脑力升级”。

据了解,2022年初,科大讯飞发布了“讯飞超脑2030计划”,提出要让懂知识、善学习、能进化的机器人走进每个家庭。去年1024全球开发者节上,讯飞机器人超脑平台AIBOT发布,把认知智能、具身智能和运动智能的多模态感知能力结合起来,已为工业、教育、服务、特种等领域372家企业提供服务。


机遇挑战并存

中国智造创新未来更多可能

对于具身智能研究和机器人开发来说,趋势一路向好,但挑战也同样空前巨大。目前智能机器人的核心技术还存在一定局限,系统集成门槛高、算法开发困难、进化能力匮乏、硬件选型和适配困难、上下游生态不完善等问题限制了机器人生产力的释放。

同时,智能机器人涉及大量的数据收集与处理,对数据的安全与隐私保护也提出了更高的要求。智能机器人的普及和应用也势必会涉及法律和伦理问题,对于全社会而言,能否完善相关法律和伦理准则,保障社会稳定和人类权益,将是一个无法回避的挑战。

但正视问题本身,其实就是找寻答案的最佳路径。在技术层面上,科大讯飞具身智能人形机器人借助讯飞星火大模型的多模态能力,已经能够实现指令理解和跟随,细节表达上也有了一定的提升,这让机器人能够在复杂场景中很好地发挥作用。

此外,科大讯飞还联合华为团队在半年时间内通过孵化大模型融合算子、多维度分布式并行、算-网-存系统级的智能运维,以及基于CANN联合深度优化,实现了讯飞星火大模型训练和推理效果的翻番,为中国科技进一步深入具身智能的研究创造了更多可能性。

将认知大模型与具身智能、运动智能结合起来,进一步助力我国机器人进入高阶智慧时代,让科技触达更加美好的生活,科大讯飞正努力为我们带来了一份全场景、全业态、全智能的全新生活方案,“科技抵达终点是亿万家庭幸福”的梦想终将未来可期。