Infer News

實用資源 MCP 合集 Agent 影視製作工具 最新焦點 Support 登入
  • 動畫
  • 微軟
  • 騰訊
  • 阿里巴巴
  • 安全
  • 香港大學
  • Audio
  • 視頻模型
  • Stable Diffusion
  • 香港中文大學
  • Image
  • ComfyUI
  • 工具
  • 香港科技大學
  • TensorFlow
  • 視覺模型
  • Video
  • Content Creator
  • 數字人
  • 文字轉語音
  • 開源
  • 3D
  • 聲效
  • API
  • 推理引擎
  • Gemini
  • MCP
  • Mac
  • Win
  • Linux
  • 香港
  • 影像模型
  • 影像處理
  • 多模態模型
  • 編程
  • Python
  • 庫
  • 教學
  • 深度學習
  • 模型
  • Vibe Coding
  • LangChain
  • LangGraph
  • Medical醫學
  • DeepSeek
  • AI productions
  • 音樂
  • Embedding
  • 提示詞
  • OpenAI
  • IDE
  • Discord
  • 新聞
  • 軟件
  • 語音
  • 線上服務
  • LLaMa
  • Python NLP
  • RAG
  • Clone
  • Agent
  • Ollama
  • 模型訓練
  • txt2img

StableAvatar:無限長音訊驅動的頭像影片生成

用於音訊驅動頭像視訊產生的擴散模型難以合成具有自然音訊同步和身份一致性的長視訊。基於 Wan2.1-1.3B 的 StableAvatar 音訊驅動的頭像視訊效果,是首個端到端視訊擴散變換器,無需後製即可合成無限長的高品質視訊。

https://francis-rings.github.io/StableAvatar/static/videos/case-33.mp4
Categories: 騰訊, 微軟, 數字人, 開源

Powered by InferNews