论文

潜在颜色子空间:高维混沌中的涌现秩序

文本到图像生成模型进展迅速,但实现生成图像的细粒度控制仍然困难,主要由于对语义信息如何编码的理解有限。我们针对 FLUX.1 [Dev] 的变分自编码器潜在空间,提出一种颜色表征的解释,揭示其结构反映色相、饱和度与明度。通过展示该潜在颜色子空间(LCS)解释既能预测又能显式控制颜色,我们在 FLUX 中引入一种完全无需训练、仅依赖闭式潜在空间操作的方法。代码见 https://github.com/ExplainableML/LCS。

发布时间 Mar 12, 2026

来源 Manipulation and Humanoids

会议 / 平台 arXiv

作者 Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata

操作
查看原文