admin

FaceFusion 3.2.0 GPU 詳細安裝教程

💥 FaceFusion 3.2.0 更新不僅帶來了全新的GPU加速，還提升了不少效能與真實感！

🔍 新功能
1️⃣ YOLO NSFW過濾
2️⃣ 多GPU支援
3️⃣ FLAC音訊輸出
4️⃣ 臉部選擇增強

NEW FaceFusion 3.2.0 GPU Installation – Boost Realism & Performance Like Never Before!

Watch this video on YouTube

Categories: 開源, 教學, 影像模型

基本定義與原理 MCP（Model Context Protocol）模型上下文協議MCP 是一個由 Anthropic 開發的開放標準協議，目的是讓語言模型（LLM）或 AI 助手能標準化地連接到外部資料來源、工具與服務。可以把它想成是 AI 的「USB-C 接口」──讓 AI 模型可以即插即用地讀取即時資訊、存取資料庫、調用外部工具。MCP 的設計理念是解決資料孤島問題，讓 LLM 可以取得最新的、動態變化的資訊，提升回答的相關性與正確性。MCP 是雙向、模組化、安全的設計：每個外部服務是一個小型的 MCP 伺服器，只暴露必要的能力，並由 LLM 應用端（host）控制存取範圍。 A2A（Agent-to-Agent Protocol）代理對代理協議A2A 是 Google 在 2025 年推出的開放標準協議，專門設計來讓不同 AI 代理（Agent）之間能互相通訊、協作與委派任務。A2A 是 MCP 的補充：MCP 解決「模型接資料源」的問題，A2A 則解決「多個代理人互動」的問題。A2A 基於現有網路標準（HTTP、JSON、SSE），注重安全性與長時間任務協調，支援多種互動模式（文字、表單、音訊、影片）。每個 Agent 透過公開的「Agent Card」（JSON 格式）宣告自己的能力與 API，便於其他代理人發現與互動。架構、通訊機制與流程 MCP 架構 Client-Server 架構：LLM 應用（如 Claude Desktop、IDE 插件）是 […]

Categories: MCP

LTX-Video 0.96

LTX-Video 是第一個基於 DiT 的視訊生成模型，可以即時產生高品質的視訊。它可以以 1216×704 的分辨率生成 30 FPS 的視頻，比觀看這些視頻的速度還快。該模型在多樣化影片的大規模資料集上進行訓練，可以產生具有逼真和多樣化內容的高解析度影片。模型支援文字轉圖像、圖像轉影片、基於關鍵影格的動畫、影片擴充（正向和反向）、影片轉影片以及這些功能的任意組合。

Categories: 開源, 視頻模型, 影像模型, 影像處理, 多模態模型

SkyReels-V2 生成無限長度影片

Skywork 是一個創新的研究團隊，致力於推動法學碩士和多模式理解。它們的使命是透過視覺和語言開發並實現無縫互動的尖端模型和資料集來突破人工智慧的界限。模型支援文字到視訊（T2V） 和圖像到視訊（I2V） 任務，並且可以在同步和非同步模式下進行推理。

影片長度限制的突破：雖然像 LTXV 和 HuanYun 等模型在速度或品質方面表現出色，但它們通常限制生成約 5 到 10 秒的短片。Frame pack 可以生成高達 60 秒的高品質影片，但 60 秒是其最大長度。Skyreels V2 透過其稱為「擴散強制 (diffusion forcing)」的技術，可以讓您生成長達 60 秒甚至可能更長的影片。技術上，擴散強制模型可以透過不斷訓練一個擴散強制取樣器並在最後組合每個結果來無限延長影片長度。

Skyreels V2 - Best Video Model for High Quality Infinite Length

Watch this video on YouTube

Categories: 開源, 推理引擎, 影像模型, 多模態模型

MiniMax MCP server

MiniMax 模型上下文協定 (MCP) 伺服器，可與強大的文字轉語音和視訊/圖像生成 API 進行互動。此伺服器允許 MCP 用戶端（如 Claude Desktop 、 Cursor 、 Windsurf 、 OpenAI Agents 等）產生語音、複製聲音、產生視訊、產生影像等。

Categories: 開源, MCP

GitHub 官方 MCP 伺服器

GitHub MCP 伺服器是一個模型上下文協定 (MCP) 提供與 GitHub API 無縫整合的伺服器，為開發人員和工具提供自動化和互動功能。提供一鍵安裝。完成後，切換代理模式，伺服器將會自動啟動。

建立與 GitHub 生態系統互動的 AI 驅動工具和應用程式

Introducing the GitHub MCP Server: AI interaction protocol | GitHub Checkout

Watch this video on YouTube

Categories: 開源, MCP

FramePack 6Gb vRAM 出 60 秒影片

FramePack 是一種新的視頻擴散設計，用壓縮上下文令工作量不會隨著影片的長度而增加，只需一張圖片，就可以令你的 6GB vRAM 的電腦透過 13B 模型生成每秒 30 格影片的 60 秒影片。而用 RTX 4090 的話，最快速度為每格 1.5 秒。

作者 Lvmin Zhang

FramePack Run In Gradio & ComfyUI - Generate Long Length image2Video AI Video - Installation Guide

Watch this video on YouTube

Categories: ComfyUI, 開源, 視頻模型, 影像模型, 影像處理

Firebase Studio – 雲端 Vibe 編程

Google Firebase Studio 的目標是盡量簡化開發流程，就算你是剛剛開始學寫 App 也不用擔心。只要你有基本了解，Firebase Studio 可以透過 AI 助手 Gemini 幫你寫 Code、Debug 同埋改善效能。完成了之後，無論是全方位的應用程式，抑或 API、後台、前端同埋手機 App，佢都可以幫你自動整合發佈。測試期間，你可以擁有 3 個的免費工作空間。

Firebase Studio: 9 Must See Features (FREE to Use)

Watch this video on YouTube

Categories: Gemini, IDE, 線上服務, Agent

HiDream 文生圖模型

北京的 AI 初創公司 HiDream (智象未來)，剛剛推出了開源 170 億參數的文生圖模型，性能比 FLUX 更為出色。甚至已經在模型排行榜入面升上第二位。而由它生成出來的人物質感、結構、邏輯都非常之唔錯。甚至生成英文文字的準確性同排版能力亦相當之高。除了提供開源版本，亦提供了網上測試同商業版本。

Hi-Dream (the next Flux Killer?): ComfyUI Installation and Use (step-by-step) #ai #flux #hidream

Watch this video on YouTube

HiDream I1 - Now With Native ComfyUI Support!

Watch this video on YouTube

Categories: 開源, 影像模型, 模型

VSCode Agent + MCP

影片展示了 Visual Studio 的最新 AI 功能，重點介紹了新的 Agent 智能體代理模式，同時引入了模型上下文協議 MCP Model Context Protocol。影片亦示範了完整的應用程式開發，並通過不同的模式與 AI 進行交互：包括詢問，編輯。亦會根據項目要求自動進行修改。這些進步反映了 AI 技術在增強開發工作流程和提高效率方面的快速成長。

VS Code Agent Mode Just Changed Everything

Watch this video on YouTube

Categories: MCP, Agent

Page 12 of 58

« Previous 1 … 10 11 12 13 14 … 58 Next »