PresentAgent-2：將查詢變成影片簡報

如果你曾經試過為一個新題目做簡報，就會知道最花時間的往往不是排版，而是先找資料、定重點、再把內容講清楚。PresentAgent-2 想處理的，正正是由一句自然語言提問開始，逐步變成一段有旁白的簡報影片，而不是假設你一開始已經有一份完整文件。

這個專案的流程相當清晰：先把模糊問題收窄成較聚焦主題，再整理候選來源，抽取文字、圖片、GIF 甚至影片素材，之後才規劃簡報結構、生成投影片與講稿，最後合成音畫對齊的影片。對一般用家來說，可以理解為把「搜集資料、寫大綱、做 slides、配音」串成一條自動化工作流。

較有意思的是，它不只做單一講者式內容，還支援多講者討論，以及有根據的互動問答三種形式。另一方面，動態素材會盡量保留為 GIF 或影片，而不是全部截成靜態圖，這令最後成品更接近真正可觀看的解說片，而不只是會動的投影片。

如果你想了解它是否適合自己，較合用的情境包括教學短片、研究題目導讀、產品介紹，或需要快速把一個概念講清楚的內容製作。現階段它更像研究型框架，較適合 AI、多模態內容生成、代理式工作流的開發者與研究者參考，而非即開即用的普通消費工具。

相關模型方面，倉庫資料提到以 VLM 參與評估，扮演觀眾回答問題及進行評分，但公開資訊未見完整列出所有底層模型名稱。若你關心的不是單一模型，而是「怎樣把多個能力串成可交付影片」，PresentAgent-2 的參考價值會比單看文字或圖像生成工具更高。

網址： https://github.com/AIGeeksGroup/PresentAgent-2