Aurora：把影片編輯指令講清楚的 AI 代理

Aurora 是一個面向影片編輯的 AI 項目，重點不只是「生成畫面」，而是先理解你想改甚麼。它把使用者一句較口語、甚至有點含糊的要求，整理成較明確的編輯計劃，再交給影片模型處理，目標是減少「講唔清、改唔準」的情況。

這個項目想解決的核心問題，是影片編輯要求經常不完整。你可能只說想「換走背景」、「刪除路人」或「改成某種風格」，但未必提供參考圖，亦未必指出遮罩範圍；Aurora 會嘗試補回這些缺口，例如用圖像搜尋找參考，或用分割方式找出需要修改的位置。

它較有新意的地方，在於把多種影片編輯工作放進同一個框架，而不是每種效果各自一套模型。根據目前資料，這個項目支援替換、移除、風格轉換，以及根據參考內容插入元素，背後並結合了工具增強的視覺語言模型代理，以及統一的影片 diffusion transformer，也就是影片 DiT。

動手了解這個項目時，可先把它當成「會先幫你整理需求的影片編輯助手」。現階段儲存庫內容顯示官方實作仍在準備中，所以較適合先閱讀論文與項目頁，理解它如何把原始要求拆成指令、任務標籤、圖像搜尋查詢與遮罩描述四部分，再留意之後公開的程式。

對內容創作者、影像研究人員，或者關心人機協作編輯流程的人來說，Aurora 特別值得留意。它未必是即刻可用的成品，但從設計方向看，這個項目著重的不是單次炫技效果，而是令影片編輯指令變得更完整、更可執行。

GitHub： https://github.com/yeates/Aurora

Paper： https://arxiv.org/pdf/2605.18748