MimicBrush 圖像編輯
MimicBrush 的一種創新的圖像編輯方法,通過提供參考圖像來編輯圖片,而無需明確指定編輯的細節。MimicBrush 的核心思想是「模仿編輯」,只需在原始圖像中用 Brush 標記要編輯的區域,並提供一張參考圖片,模型就會自動理解參考圖像中與目標區域相關的語義,並將其應用於編輯。這種方法使用基於擴散模型的生成框架,通過從影片中隨機選取幀並遮罩部分區域來進行自行監督學習,使模型能夠捕捉不同圖像之間的語義關係,實現零樣本的圖像編輯。研究還提供了一個基準測試,旨在促進未來對此領域的研究。

whisper.cpp v.1.6.2 源碼: Speech To Text 輕量級模型
進楷優化
更快、更小的 Whisper:深入研究量化和 Torch 編譯
本文透過批次加速,增強基於 PyTorch 的 Whisper 模型性能。透過利用透過轉換器、實現靜態快取以及利用torch.compile,顯著加快模型的推理速度。此外,使用HQQ將 Whisper 模型量化為 4 位,以最小的降級保持轉錄質量,正如字錯誤率 (WER) 基準評估的那樣。

微調前後
Categories: 工具
RAGMeUp 資料集上進行 RAG
Categories: 工具
ChatTTS 對話場景設計的文本轉語音模型
chatTTS语音合成,效果真实如人类,开源免费!Windows、MacOS本地使用教程,附Windows整合包,Colab一键运行脚本。
Omost 可控 Text2Image
Instance Diffusion: AI 驅動的可控視訊動畫
[2405.15556] RobustRAG 針對檢索攻擊的第一個防禦框架
pycantonese v3.4.0 廣東話分詞工具
(英) pycantonese: 粵語語言學與自然語言處理
Cantonese Linguistics and NLP. Contribute to jacksonllee/pycantonese development by creating an account on GitHub.
Categories: 工具
Mistral 釋出首個程序(code)模型
Categories: 工具





