
Lumos-Custom 是阿里巴巴DAMO 學院的開源影片定制研究合集,把三個子項目整合在同一個儲存庫,方便研究者各自取用。三個子項目分別對應不同的影片生成難題:身份與屬性定制、打光控制,以及結合推理的統一生成。
其中最受關注的是 Lumos-Nexus (arXiv 2605.31603)。它解決了一個長期痛點:把大型高保真生成器放進統一訓練迴圈成本太高,改為訓練一個輕量的連接器對齊理解模組,再用「Unified Progressive Frequency Bridging (UPFB)」在推論時把任務交接給預訓練的高容量生成器,既省訓練資源又保留視覺品質。為了補足推理類影片生成的評測空白,作者還發布了 VR-Bench。
第二個項目是 LumosX,已被 ICLR 2026 接收。它的切入點是「多主體個性化影片生成」:先用字幕與 MLLM 抽取的先驗建構關係結構,再透過 Relational Self-Attention 與 Relational Cross-Attention 編碼主體與屬性之間的依賴。評測資源集中在 LumosX/benchmark/,權重已上傳 Hugging Face。
第三個項目是 UniLumos(NeurIPS 2025),專注於圖像與影片的統一重新打光,採用 RGB 空間幾何回饋配合 flow-matching 主幹,適合需要控制光影的研究與應用場景。
總結要點:
- ** DAMO 是 Discovery, Adventure, Momentum and Outlook
- Lumos-Nexus:輕量訓練搭配 UPFB 頻率交接,兼顧推理品質與視覺保真度
- LumosX:以關係式注意力處理多主體個性化生成,附 benchmark 與 Hugging Face 權重
- UniLumos:統一圖片與影片重新打光,採用 flow-matching 與幾何回饋
- VR-Bench:補上推理驅動影片生成的評測缺口
- 子項目獨立部署:每個子項目都有獨立 README,支援單獨安裝與重現
這個項目適合研究影片生成、多模態統一模型與個性化生成的研究者與工程師。如果你想驗證 Lumos-Nexus 的推理影片效果,可進入 Lumos-Nexus/ 跟隨 README 取得 OmniVideo 權重並跑批次推論;想評測打光則可參考 UniLumos 提供的流程。
✧ Repository layout ✧
Lumos-Custom/
├── README.md # This file: umbrella overview
├── LumosX/ # ICLR 2026 · personalized multi-subject video generation
│ └── README.md
├── UniLumos/ # NeurIPS 2025 · unified relighting + LumosBench/
│ ├── README.md
│ └── LumosBench/
└── Lumos-Nexus/ # arXiv preprint · reasoning-driven unified video generation + VR-Bench
├── README.md
└── vr_bench_eval/
GitHub: https://github.com/alibaba-damo-academy/Lumos-Custom








