F5-TTS 文字轉語音仿真模型 示範範例: https://SWivid.github.io/F5-TTS GitHub – SWivid/F5-TTS: 100K 小時多語言資料集上進行訓練表現出高度自然和富有表現力的零樣本能力、無縫代碼切換能力和速度控制效率。 F5-TTS (Best ElevenLabs Alternative Yet!): Easy Step-by-Step Installation + DemoWatch this video on YouTube Categories: 開源, 模型, 語音
SenseVoice 具有音頻理解能力的音頻基礎模型 語音識別(ASR)、語種識別(LID)、語音情感識別(SER)和聲學事件分類(AEC)或聲學事件檢測(AED)在多個任務測試集上的benchmark,以及體驗模型所需的環境安裝的與推理方式。 Mac M1 上實測,廣東話夾英文一齊都好準,不過出嘅係簡體中文! Categories: 模型, 語音