论文

用于潜在规划的时间拉直

学习良好的表征对于基于世界模型的潜在规划至关重要。尽管预训练视觉编码器能产生强大的语义视觉特征,但它们并未针对规划进行定制,且包含与规划无关甚至有害的信息。受人类视觉处理中感知拉直假说的启发,我们引入时间拉直以改进潜在规划的表征学习。通过使用曲率正则化器鼓励局部拉直的潜在轨迹,我们联合学习编码器与预测器。我们表明,以此方式降低曲率可使潜在空间中的欧氏距离更好地逼近测地距离,并改善规划目标的适定性。实验表明,时间拉直使基于梯度的规划更稳定,并在一系列目标到达任务中显著提高成功率。

发布时间 Mar 12, 2026

来源 Robotics Core

会议 / 平台 arXiv

作者 Ying Wang, Oumayma Bounou, Gaoyue Zhou, Randall Balestriero, Tim G. J. Rudner, Yann LeCun, Mengye Ren

世界模型
查看原文