近期国内多家企业在“大模型+机器人”已实现技术突破。

业内认为,随着技术的不断进步和应用场景的扩大,多模态大模型与机器人的需求将会不断增加,为企业提供了广阔市场空间。此外,与其他行业的合作也将为多模态大模型与机器人的发展带来新机遇,例如与医疗、制造等行业的合作,可实现更广泛的应用场景和商业价值。


多模态机器人实现技术突破

截至12月13日收盘,步科股份、埃夫特、绿的谐波等多只机器人概念股涨超4%。消息面上,特斯拉发布Optimus-Gen 2(第二代擎天柱)人形机器人视频,其搭载由特斯拉设计的执行器与传感器,行走速度提高30%,平衡力及全身控制均得到提高。

“多模态”AI是指能处理文本、音频、图像、视频和代码等多种形式内容的大模型。随着多模态大模型快速迭代,国际大厂不断关注其在机器人领域的应用,并在机器人规划、控制、导航等主要任务上进行了探索。

止于至善投资总经理何理告诉《证券日报》记者:“多模态大模型融合视觉、语音和传感器数据处理技术,极大丰富了机器人认知和决策层面。该技术在机器人中的应用,有望使机器人在复杂交互、自然语言理解和环境适应等领域迈出重大进步,激发其作为高度自主助手或劳动力的无限可能性。”

国内已有企业在此领域抢先布局。12月12日晚,奥比中光发布大模型机械臂1.0产品,可通过语音Prompts作为输入,利用多种大模型的理解能力和视觉感知能力,生成空间语义信息,让机械臂理解、执行动作。在其同步披露的视频中,机械臂成功完成了一系列语音口令,包括“把绿色方块放到黄色框中”“请恢复最开始的状态”等。

奥比中光联合创始人、CTO肖振中告诉《证券日报》记者:“公司希望通过工程化研究,使大模型机械臂在实际场景落地,包括提升机械臂自动绕开复杂障碍物来完成人类指令的能力,解决大模型+机械臂的泛化性问题,最终实现通用场景落地。”

据不完全统计,中科创达(300496)、亿嘉和(603666)等上市公司亦于近期相继披露了基于多模态大模型的机器人研发进展情况。


商业大规模应用仍需时间

我国机器人行业已具备一定产业基础。头脑聪明、四肢灵活得多的模态机器人正成为多方竞逐未来产业的新赛道。

何理认为,在国内市场,企业已积极投入关键技术环节的研发和生产,尤其是在传感器、精密机械部件、执行器以及创新材料和轻量化结构件领域,展示了蓬勃发展势头。

谐波减速器是工业机器人的核心零部件。绿的谐波披露,已较早完成工业机器人谐波减速器技术研发并实现规模化生产,在该领域率先实现了对进口产品的替代,极大降低了国产机器人企业的采购成本及采购周期。其推出的新一代Y系列谐波减速器,通过数理模型创新,轴承设计及加工工艺优化,其刚度指标较现有其他产品提升了一倍。

不过,部分业内人士认为,“多模态+机器人”还处于发展阶段,实现商业化落地仍面临不少挑战。

“首先,技术成熟度较低,存在技术瓶颈。例如模型的可解释性、稳定性、安全性等方面还需进一步提升;其次,大模型和机器人的研发和生产成本较高,维护和运营成本也相对较高,需投入大量人力、物力资源。”郭涛说。

肖振中对此表示认同,他告诉《证券日报》记者:“大语言模型(Large Language Model,LLM)结合视觉传感,会让各类机器人、机械臂落地到更多场景中,如工业制造、柔性物流、商用服务等。目前大模型跟实际数据的结合还存在一定差距,大模型运行消耗的算力也偏大,应用需要三五年的时间逐步落地,业务成熟可能需要更久。”

“但公司坚信这是正确的方向,前景广阔。”肖振中表示,奥比中光正搭建机器人及AI视觉中台,通过多模态视觉大模型及智能算法研发,结合机器人视觉传感器,形成自主移动定位导航和避障的完整产品方案,积极迎接智能机器人时代。