免費 AI 工具拍攝史詩電影![ComfyUI 教程 + 免費工作流程]」

影片作者 Mickmumpitz 展示如何利用 ComfyUI,以及幾個開源 AI 影像模型 (例如 Co video x, LTX Video, Machi 1, Hyan),將自家拍攝的影片轉化成具有電影感的史詩級畫面。影片重點在於如何使用這個 AI 工作流程,包含設定、模型選擇 (不同模型各有速度與畫質的優劣)以及控制網路 (Control Net) 的應用,以達到精準控制影像生成的目標,例如保留演員表情和動作,或轉換角色外貌。影片也提供免費及付費兩種工作流程,付費版本提供更進階的功能,例如臉部替換和更精細的畫面調整。最後,作者展示了一部以這個方法製作的短片,說明其應用實例。

Shoot EPIC MOVIES with this FREE AI Tool! [ComfyUI Tutorial + Free Workflow]
Categories: ComfyUI, 教學

從零開始構建一個 AI 代理

SwirlAI 電子報發表了一篇教學文章,旨在從零開始構建一個 AI 代理程式,無需任何框架。文章的核心在於說明如何讓 AI 代理程式使用工具 (Tools),並以一個貨幣轉換器為例,逐步演示整個過程。 作者首先定義了什麼是 AI 代理程式,並強調了系統提示 (system prompt) 的重要性,它包含了工具的定義和預期的輸出格式。文章亦詳細介紹了如何將 Python 函數包裝成工具,以及如何構造有效的系統提示,最後實現了一個能夠規劃並執行動作的 AI 代理程式類別,展示了如何讓 AI 代理程式根據用戶提問,自動選擇並使用工具完成任務。整個過程強調了基礎概念的理解,而非依賴現有框架。

Categories: 教學, Agent

ComfyUI 上使用 Hunyuan 影片模型

騰訊開源模型 Hunyuan (混元) 能生成高品質 AI 影片,具有出色的動作穩定性、場景切換和逼真的視覺效果。ComfyUI 官網介紹了如何免費使用「Hunyuan Video」模型首先必需安裝幾個主要檔案:

模型亦支援生成靜態圖片,只需將影片長度設定為 1 即可。最後亦提供了一個 JSON 格式的工作流程範例,方便使用者快速上手。

Categories: ComfyUI, 視頻模型, 教學


AI Agent A-Z 英語詳解

一場關於建構 AI 研究代理程式的研討會。主要目的在於介紹 AI 代理程式的基本概念,並讓參與者獲得端到端構建代理程式的實務經驗。講者首先解釋何謂 AI 代理程式,並將其與大型語言模型 (LLM) 互動的方法,例如簡單提示和檢索增強生成 (RAG),進行比較,強調 AI 代理程式在處理複雜任務和個性化回應方面的優勢。接著,講者深入探討了 AI 代理程式的幾個關鍵組成部分:規劃與推理 (包含 Chain of Thought 和 React 等設計模式)、記憶體 (短期和長期記憶體) 和工具。最後,研討會的實作部分引導參與者利用 Langchain 框架,結合 Fireworks 模型和 MongoDB,一步步建構一個可以提供研究協助的 AI 代理程式,其中涵蓋了工具的建立、代理程式的設計,以及記憶體的添加。

Build an AI Research Agent: Apoorva Joshi
Categories: 教學, Agent

ComfyUI + Live Portrait 教學

短片說明如何在 ComfyUI 中使用「Live Portrait」,將靜態人像圖轉換成具有動態表情的動畫。 教學涵蓋了安裝及設定自訂節點、建立工作流程、以及微調動畫以達到寫實或風格化效果等步驟,並詳細解釋如何調整臉部設定(眨眼、嘴部動作、俯仰角度等),以及如何使用預錄影片或手動設定來製作動畫。 此外,也提供了影像及影片素材的選擇建議,以及處理解析度和裁切等常見問題的方法,目標是讓使用者能有效地將靜態圖片轉換成生動的動畫人像。 最後,還以指令範例說明如何設定動作的播放時間與間隔。

ComfyUI Tutorial Series Ep 26: Live Portrait & Face Expressions

Categories: ComfyUI, 教學

LayoutLM 文件理解和資訊提取

Categories: 教學, 模型

Word2Vec詞嵌入技術

將文字轉換成電腦可理解的數值向量的方法。Word2Vec 有兩種主要模型:連續詞袋模型 (CBOW) 和跳字模型 (Skip-gram),透過反向算法,根據上下文預測目標詞或反之,從而學習詞語間的關係。訓練後的詞向量具有語義相似性的特性,相似的詞彙在向量空間中距離較近,並能透過向量運算進行類比推理,例如「國王-男人+女人=王后」。Word2Vec 應用廣泛,例如搜尋引擎、推薦系統和機器翻譯,但其局限性在於每個詞只有一個固定向量,無法處理多詞片語的語義。

Word Embeddings: Word2Vec
Categories: 教學, Embedding, 軟件

詞嵌入 (Word Embeddings) 的概念及其應用

詞嵌入將文字轉換成數值向量,讓機器學習模型能夠處理文字資料。相似的詞彙在向量空間中彼此靠近,距離和方向代表詞彙間的語義關係。 片中說明了詞嵌入在自然語言處理 (NLP) 中的關鍵作用,例如文字分類、命名實體辨識和問答系統等。接著,解釋了兩種主要的詞嵌入方法:基於詞頻的方法 (例如TF-IDF) 和基於預測的方法 (例如Word2Vec, GloVe),並比較了它們的差異。最後,介紹了更先進的基於上下文的方法 (Transformer 模型),它能根據上下文調整詞彙的向量表示,進一步提升 NLP 的效能。這視頻旨在說明詞嵌入技術如何有效地將人類語言轉換成機器可理解的數值形式,從而推動自然語言處理的發展。

What are Word Embeddings?
Categories: 教學, Embedding

RAG 向量中的文件分割策略

文件分割策略對於大型語言模型(LLM)的資訊檢索效能影響。現有資訊檢索基準測試通常以整篇文件的相關性評估效能,忽略了文件分割策略的重要性。RAG 文件分割(Text Chunking) 基於字元/詞(Token) 的分割、遞迴式分割、語義分割等,以找出最適合用於後續基於檢索增強生成(RAG)應用的最佳方法。

The BEST Way to Chunk Text for RAG
Categories: 教學, Embedding, RAG

Page 4 of 13
1 2 3 4 5 6 13