F5-TTS 文字轉語音仿真模型 2024 年 10 月 20 日 示範範例: https://SWivid.github.io/F5-TTS GitHub – SWivid/F5-TTS: 100K 小時多語言資料集上進行訓練表現出高度自然和富有表現力的零樣本能力、無縫代碼切換能力和速度控制效率。 F5-TTS (Best ElevenLabs Alternative Yet!): Easy Step-by-Step Installation + DemoWatch this video on YouTube Categories: 開源, 模型, 語音
Hello2 – 高清 LipSync 工具 2024 年 10 月 20 日 GitHub – fudan-generative-vision/hallo2: Hallo2: Long-Duration and High-Resolution Audio-driven Portrait Image AnimationHallo2: Long-Duration and High-Resolution Audio-driven Portrait Image Animation – fudan-generative-vision/hallo2 Categories: Video, Audio, 模型
RF-Inversion – 無需 ControlNet 的圖片編輯 2024 年 10 月 20 日 GitHub – LituRout/RF-Inversion: Rectified Flow Inversion (RF-Inversion)(附 ComfyUI Node)Rectified Flow Inversion (RF-Inversion). Contribute to LituRout/RF-Inversion development by creating an account on GitHub. Categories: Image, 影像處理, 模型
Diffusion – 生成 3D 遊戲的擴散式世界模型 2024 年 10 月 20 日 構成了一種以安全且樣本高效的方式訓練強化學習 💎 Categories: 軟件, 3D, 多模態模型, 模型, 新聞
diffusers-image-outpaint 零度解說 2024 年 10 月 16 日 超強AI擴圖!完全免費開源,diffusers-image-outpaint,附詳細本地安裝教程!-Diffusers Image Outpaint 是一種基於擴散模型的圖像生成方法。它根據現有圖像內容,生成圖像以外區域,使圖像看起來更自然和完整。 Categories: Image, 軟件, 工具, 影像處理, 模型
DiffSynth-Studio 擴散模型的魔力 2024 年 10 月 4 日 DiffSynth Studio 是個擴散引擎重構了文字編碼器、UNet、VAE等架構,保持與開源社群模型的相容性,同時增強運算效能。 Categories: Video, Image, 模型
Open-LLM-VTuber 2024 年 9 月 17 日 透過免持語音互動、語音中斷、Live2D 臉部辨識和跨平臺本地運行的長期記憶與任何 LLM 交談LLM 推理後端、語音辨識和語音合成器均設計為可交換。此專案可以配置為在 macOS、Linux 和 Windows 上離線運行。也支援線上 LLM/ASR/TTS 選項。 Categories: 模型
CogVideo 文字 > 影片產生 2024 年 8 月 30 日 GitHub – THUDM/CogVideo: Text-to-video generation: CogVideoX (2024) and CogVideo (ICLR 2023)Text-to-video generation: CogVideoX (2024) and CogVideo (ICLR 2023) – THUDM/CogVideo Categories: Video, 模型
GraphRAG – Llama 3.1 和 Neo4j 2024 年 8 月 25 日 本影片介紹如何使用開源模型執行 GraphRAG – Llama 3.1 和 Neo4j 作為圖形資料庫 Local GraphRAG with LLaMa 3.1 - LangChain, Ollama & Neo4jWatch this video on YouTube Categories: RAG, 模型, 教學
ComfyUI – 設計師都在用的節點式 Stable Diffusion 2024 年 8 月 25 日 一鍵進階ComfyUI目前使用 Stable Diffusion 進行創作的工具主要有兩個:WebUI 和 ComfyUI。 Categories: Stable Diffusion, 模型, 教學