论文

ATG-MoE：用于装配技能学习的混合专家自回归轨迹生成

柔性制造要求机器人系统能够适应不断变化的任务、对象和环境。然而，传统机器人编程劳动密集且缺乏灵活性，而现有的基于学习的装配方法往往存在位置泛化能力弱、多阶段设计复杂、多技能集成能力有限等问题。为此，本文提出 ATG-MoE，一种端到端自回归轨迹生成方法，采用混合专家架构从示教中学习装配技能。该方法建立从多模态输入（包括 RGB-D 观测、自然语言指令和机器人本体感知）到操作轨迹的闭环映射，融合多模态特征以实现场景与任务理解，采用自回归序列建模以生成时间连贯的轨迹，并通过混合专家架构实现统一的多技能学习。与将视觉感知与控制分离或独立训练不同技能的传统方法不同，ATG-MoE 直接将视觉信息融入轨迹生成，并支持在单一模型内高效集成多技能。我们在减压阀装配任务中的八项代表性装配技能上对方法进行训练与评估。实验结果表明，ATG-MoE 在仿真中表现强劲，平均抓取成功率为 96.3%，平均整体成功率为 91.8%，同时展现出强泛化能力和有效的多技能集成。真实世界实验进一步验证了其在多技能工业装配中的实用性。项目页面见 https://hwh23.github.io/ATG-MoE