高效能語言模型推論引擎
它以 Rust 編寫,支援多種模型、量化方法 (GGML, GPTQ, HQQ 等) 和加速器 (CUDA, Metal, CPU),並提供 便捷的 Python API 和 OpenAI 相容的 HTTP 伺服器。 核心功能包括 快速推論、多種量化技術 以提升效能,以及對 LoRA、X-LoRA 等模型調整技術的支援。 附詳細說明安裝、建置、模型取得和使用方法,並提供豐富的範例程式碼與效能基准測試結果。(支援 Mac M 系列)


![]()

結合擴散的圖像生成和多模態大型語言模型 (MLLM)
DiffSensei 效能超越現有模型,代表在漫畫生成領域的重大進展,實現了文本可調整的角色客製化,並公開程式碼、模型和數據集。
DiffSensei 使用遮罩交叉注意力來整合角色特徵,實現精確的版面控制,並透過 MLLM 調整角色特徵以符合面板的文字提示,從而靈活調整角色的表情、姿勢和動作。研究團隊也公開了一個大型數據集 MangaZero,包含大量漫畫頁面和標註面板,以支援此任務。實驗結果顯示。


輸出的 3D 型以 Mixamo 加入 Rigging 教學
短片說明如何在 ComfyUI 中使用「Live Portrait」,將靜態人像圖轉換成具有動態表情的動畫。 教學涵蓋了安裝及設定自訂節點、建立工作流程、以及微調動畫以達到寫實或風格化效果等步驟,並詳細解釋如何調整臉部設定(眨眼、嘴部動作、俯仰角度等),以及如何使用預錄影片或手動設定來製作動畫。 此外,也提供了影像及影片素材的選擇建議,以及處理解析度和裁切等常見問題的方法,目標是讓使用者能有效地將靜態圖片轉換成生動的動畫人像。 最後,還以指令範例說明如何設定動作的播放時間與間隔。