DIRECT：可調 3D 角度的物件插令合成更自然

DIRECT（Decomposed Injection for Reference Composition and Target-integration）是一個用來把參考物件放入背景圖片的生成項目，重點不是單純補圖，而是加入明確的 3D 控制。網頁內容指出，現有 diffusion-based 方法多數把這類工作當成 2D inpainting，畫面雖然好看，但物件角度與空間位置較難精準控制。

DIRECT 先把參考物件提升成可互動的 3D proxy，讓使用者在目標場景內直接調整姿態，再把調整後的結果渲染成 geometry guidance。之後，生成器會同時接收參考物件的 appearance guidance、3D proxy 提供的 geometry guidance，以及背景圖片的 context guidance，合成最終插入效果。

它的核心創新在於 decomposed injection，把不同條件分開經由獨立路徑注入，而不是混在一起處理。這樣可減少 feature entanglement，較有機會同時保留原物件外觀、跟隨指定姿態，並令物件更自然融入目標場景。

重點可先留意以下幾點：
– 支援 pose-controllable object insertion，可直接調整物件姿態
– 以 reconstructed 3D proxy 提供明確幾何引導
– 把 appearance、geometry、context 三種訊息分開處理
– 附有 automated data construction pipeline，以提升訓練資料多樣性與質素
– 頁面表示在 geometric controllability 與 visual quality 上優於以往方法

這類項目特別適合影像合成、視覺生成、商品展示與內容製作等場景，當你需要指定物件朝向、位置感與場景一致性時會較有用。若你想跟進研究與重現結果，頁面已提供 Paper、Code，Model 與 Dataset 則標示為 soon。

GitHub： https://github.com/Gong1130/DIRECT

項目： https://gong1130.github.io/DIRECT/