線上服務 – Page 17 – InferNews

Explorer 生成式三維世界

2024 年 12 月 20 日

Odyssey 公司開發的「Explorer」，一個能將圖片轉換成逼真三維世界的生成式世界模型，強調「故事至上」的理念，如同 Pixar 的成功經驗，科技應服務於故事和說故事的人。Explorer 利用高斯點雲 (gaussian splats) 技術建構細節豐富的場景，並能與現有 3D 創作軟體整合，實現手動編輯的功能。目前 Explorer 應用於電影、遊戲製作的虛擬製作流程中，未來目標是實現即時世界生成，並拓展更多應用，文中也提及與 Pixar 共同創辦人 Ed Catmull 的合作，突顯其在該領域的領先地位和遠大抱負。

Categories: 線上服務

MMAudio 自動配音效模型

2024 年 12 月 15 日

高品質的自動音訊合成模型

其創新之處在於採用多模態聯合訓練方法，能同時利用影音和文字資料進行訓練。模型能根據影片和/或文字提示生成同步的音訊，並包含一個同步模組確保音訊與影片畫面一致。

詳細說明了模型架構、使用方法（包含命令列和圖形介面）、預訓練模型下載和安裝步驟，以及已知限制和未來發展方向，例如訓練和評估部分仍在進行中。整體而言，MMAudio專案旨在提供一個強大且易於使用的影片到音訊合成工具。

MMAudio extra 1

MMAudio extra 1

Watch this video on YouTube

MMAudio extra 3

MMAudio extra 3

Watch this video on YouTube

MMAudio extra 4

MMAudio extra 4

Watch this video on YouTube

Categories: Audio, 模型, 聲效

Generative Omnimatte – 將影片分層並保留 RGBA

2024 年 12 月 4 日

Learning to Decompose Video into Layers

每一層都由一個完全可見的物件及其相關效果（如陰影和反射）組成。

This AI Learned to Turn a Video Into Layers

This AI Learned to Turn a Video Into Layers

Watch this video on YouTube

Categories: Video, 影像處理

CAT4D: 以 4D 形式創建任何內容

2024 年 12 月 4 日

從影片創建 4D（動態 3D）場景

CAT4D 利用各種資料集組合上訓練的多視圖視訊擴散模型，以任何指定的資訊和時間下實現新的視圖合成來實現穩健的 4D 重建。

Categories: Video, 影像處理, 模型

OpenHands 超越 Cursor 顛覆傳統編程

2024 年 11 月 15 日

超越Cursor颠覆传统编程！最强编程AI智能体框架OpenHands全方位测评实现零代码编程开发！支持ollama支持xAI的Grok模型！支持代码优化、项目分析、自动化测试，轻松构建完整应用

Categories: 線上服務, 編程

Napkin AI 一鍵圖表生成

2024 年 10 月 27 日

太强了！Napkin AI 一键生成专业图表，秒变麦肯锡风，让我的PPT档次瞬间提升10倍！| 回到Axton

Categories: 線上服務

3 個步驟即執行 🤗“Parler TTS”AI 語音

2024 年 10 月 22 日

3 steps to run HuggingFace 🤗 "Parler TTS" AI Voice on your local machine

Categories: 文字轉語音, 教學

Hello2 – 高清 LipSync 工具

2024 年 10 月 20 日

GitHub – fudan-generative-vision/hallo2: Hallo2: Long-Duration and High-Resolution Audio-driven Portrait Image Animation

Hallo2: Long-Duration and High-Resolution Audio-driven Portrait Image Animation – fudan-generative-vision/hallo2

Categories: Video, Audio, 模型

RF-Inversion – 無需 ControlNet 的圖片編輯

2024 年 10 月 20 日

GitHub – LituRout/RF-Inversion: Rectified Flow Inversion (RF-Inversion)

（附 ComfyUI Node）Rectified Flow Inversion (RF-Inversion). Contribute to LituRout/RF-Inversion development by creating an account on GitHub.

Categories: Image, 影像處理, 模型

DH-Live實時直播數字人

2024 年 10 月 16 日

DH-Live实时直播数字人，全新商用项目开源，超低显存占用，人人可用！

Categories: Video, Clone, 教學

Page 17 of 22

« Previous 1 … 15 16 17 18 19 … 22 Next »