论文
HandelBot:通过灵巧机器人策略快速适应实现真实世界钢琴演奏
数十年来,使用多指灵巧手掌握灵巧操控一直是机器人学领域的重大挑战。尽管潜力巨大,高精度任务中高质量数据收集的困难仍是主要瓶颈。强化学习与仿真到现实的迁移虽前景可期,但在要求毫米级精度的任务(如双手钢琴演奏)中,迁移策略常告失败。本文提出HandelBot框架,通过两阶段流程结合仿真策略与快速适应:首先以结构化精修阶段,依据物理 rollout 调整横向指关节以修正空间对齐;随后采用残差强化学习自主习得细粒度修正动作。在五首公认曲目的广泛硬件实验中,HandelBot成功实现精准双手钢琴演奏,系统性能比直接仿真部署提升1.8倍,仅需30分钟物理交互数据。