Infer News

CAG – RAG 的替代方案

CAG (Cache-Augmented Generation ) 挑戰了目前廣泛使用的 Retrieval-Augmented Generation (RAG) 方法。RAG 方法透過即時搜尋外部知識庫來增強大型語言模型 (LLM) 的能力，但存在延遲、搜尋錯誤以及系統複雜度高等缺點。CAG 則利用具有長上下文窗口的 LLM，預先將所有相關資源載入模型的上下文並預計算關鍵值快取 (KV cache)，從而在推理過程中無需即時搜尋即可直接回答問題。透過實驗比較 CAG 和 RAG 在 SQuAD 和 HotPotQA 兩個問答數據集上的效能，結果顯示在知識庫規模有限的情況下，CAG 在效率和準確性上均優於 RAG，尤其在處理長篇文本時，CAG 的速度大幅提升。在特定應用場景下，特別是知識庫大小可控的情況下，CAG 提供了一個更簡潔、高效且準確的替代方案。

Goodbye RAG - Smarter CAG w/ KV Cache Optimization

Watch this video on YouTube

Categories: RAG

bolt.diy 生成式網頁設計

bolt.diy 允許使用者使用任何大型語言模型 (LLM) 來建立、執行、編輯和部署全端網頁應用程式。它支援多種 LLM，例如 OpenAI、Anthropic 和 HuggingFace 等，並具備可擴展架構以支援更多模型。這裡包含專案的安裝說明、使用方法、支援的 LLM 列表、以及社群參與和未來發展規劃等資訊，目標是提供一個方便易用且高度彈性的 AI 程式碼輔助工具。

🎯 Let’s Hack Bolts! | Optimize Bolt.diy Using Prompt Engineering 🚀

Watch this video on YouTube

MAC Image

Categories: Gemini, LLaMa, Ollama, 教學

Hunyuan 影片生成詳解

Fast Video Framework 大幅提升本地 AI 影片生成速度，同時維持高畫質。透過 LCM 取樣和 LoRA 整合，讓 Hunyuan Video 和 Mochi One Preview 等模型在一般家用電腦上也能快速運作，並減少資源消耗。片中以 ComfyUI 為例，逐步示範如何設定與使用，包含壓縮儲存、整合 LoRA 模型等步驟，讓使用者能輕鬆高效生成各種風格的影片。

Hunyuan Video In ComfyUI With FastVideo Framework To Optimize Performance For Local AI Video Model

Watch this video on YouTube

Categories: ComfyUI, 影像處理, 教學

ComfyUI Flux 模型換衫教學

它能利用兩個新的 Flux 模型（Flux Fill 和 Flux Redux）將衣服穿戴在人物模型上。能精準且智慧地將各種服飾，例如襯衫、褲子、鞋子、眼鏡和帽子等，甚至多件服飾同時，完美地套用到圖片中的人物身上，實現以往難以達成的穿衣效果。

REVOLUTIONIZE Online Shopping with FLUX's ComfyUi!

Watch this video on YouTube

Categories: ComfyUI, 教學

免費 AI 工具拍攝史詩電影！[ComfyUI 教程 + 免費工作流程]」

影片作者 Mickmumpitz 展示如何利用 ComfyUI，以及幾個開源 AI 影像模型 (例如 Co video x, LTX Video, Machi 1, Hyan)，將自家拍攝的影片轉化成具有電影感的史詩級畫面。影片重點在於如何使用這個 AI 工作流程，包含設定、模型選擇 (不同模型各有速度與畫質的優劣)以及控制網路 (Control Net) 的應用，以達到精準控制影像生成的目標，例如保留演員表情和動作，或轉換角色外貌。影片也提供免費及付費兩種工作流程，付費版本提供更進階的功能，例如臉部替換和更精細的畫面調整。最後，作者展示了一部以這個方法製作的短片，說明其應用實例。

Shoot EPIC MOVIES with this FREE AI Tool! [ComfyUI Tutorial + Free Workflow]

Watch this video on YouTube

Categories: ComfyUI, 教學

Meta 推出「大型概念模型」(LCM)

突破傳統以單詞為單位的 LLM，LCM(Large Concept Model) 直接處理句子級別的語義表示，即「概念」。研究人員利用 SONAR 嵌入空間，訓練 LCM 進行句子預測，並探索了多種模型架構和訓練方法，最終在 1.6B 和 7B 參數規模的模型上取得了優異的多語言零樣本泛化能力，尤其在摘要和摘要擴展任務上表現突出。該研究成果及程式碼皆已公開釋出。

Jepa (Joint Embedding Predictive Architecture) 是一種在嵌入空間中預測下一個觀察表示的方法，V-JEPA (Video-JEPA) 是 Jepa 的一種伸延，加入影像作為一種自我監督的方式來學習影片的表示。

Experts are STUNNED! Meta's NEW LLM Architecture is a GAME-CHANGER!

Watch this video on YouTube

實戰：

Experimenting With LCM Models (Meta's Alternative To LLM Models)

Watch this video on YouTube

Colab 測試

Categories: 新聞

OpenWebUI 0.5.2 更新

更新包括：

🖊️ 頻道輸入指示器：準確了解誰在您的頻道中即時輸入，從而增強協作並保持每個人的參與。
👤 使用者狀態指示器：透過點擊頻道中的個人資料圖像來快速查看使用者的狀態，以獲得更好的協調和可用性見解。
🔒 可設定的 API 金鑰驗證限制：靈活配置 API 金鑰驗證的端點限制，現在預設為關閉，以便在受信任的環境中更順利地進行設定。

MAC Image

Categories: API, Ollama, RAG, 開源

GraphRAG 平台大戰對話框架

聊天機器人/GraphRAG框架，可以根據社交平台用戶評論創建多個 LLM 代理，並讓他們就特定主題進行辯論。

B站知乎微博，谁更讨厌彩礼？

Watch this video on YouTube

Categories: 新聞, 模型, 開源

Performer、Longformer 和 Reformer ?

2017 年夏天，一群 Google Brain 研究人員悄悄發表了一篇將永遠改變人工智慧發展軌跡的論文。這份 “注意力就是你所需要的一切” (Attention Is All You Need) 的學術論文。當時人工智慧研究界之外很少有人知道這一點，但這篇論文將為你今天聽說過的幾乎所有主要生成式人工智慧模型奠定基礎，從 OpenAI 的 GPT 到 Meta 的 LLaMA 變體、BERT、 Claude、Bard 等。

新的架構於 2020 年已經出現，例如 Performer、Longformer 和 Reformer，旨在提高超長序列的注意力效率。目前其他人正在嘗試混合方法，將 Transformer 區塊與其他專用層結合。這個領域絕非停滯不前。展望未來，每一項新提案都將受到審查、興奮，甚至恐懼。

一文搞懂 Transformer（總體架構 & 三種注意力層）

Categories: 新聞

從零開始構建一個 AI 代理

SwirlAI 電子報發表了一篇教學文章，旨在從零開始構建一個 AI 代理程式，無需任何框架。文章的核心在於說明如何讓 AI 代理程式使用工具 (Tools)，並以一個貨幣轉換器為例，逐步演示整個過程。作者首先定義了什麼是 AI 代理程式，並強調了系統提示 (system prompt) 的重要性，它包含了工具的定義和預期的輸出格式。文章亦詳細介紹了如何將 Python 函數包裝成工具，以及如何構造有效的系統提示，最後實現了一個能夠規劃並執行動作的 AI 代理程式類別，展示了如何讓 AI 代理程式根據用戶提問，自動選擇並使用工具完成任務。整個過程強調了基礎概念的理解，而非依賴現有框架。

Categories: Agent, 教學

Page 30 of 65

« Previous 1 … 28 29 30 31 32 … 65 Next »