香港中文大學

MoC 突破時空限制：AI 長影片生成

AI 不僅能創造出栩栩如生的圖片，還能生成數分鐘、甚至更長，且故事連貫、情節流暢的影片。這曾是生成式AI領域一個巨大的挑戰。然而，一項名為「上下文混合」(Mixture of Contexts, MoC) 的創新技術，正逐步將這個夢想變為現實。這項由 Shengqu Cai 等研究人員提出的最新進展，為長影片生成帶來了革命性的解決方案，有效克服了現有模型在處理「長期上下文記憶」上的瓶頸。

生成長影片的核心挑戰，在於模型必須能夠在漫長的時間序列中，保持並檢索關鍵事件，同時避免資訊崩潰或內容漂移。現有的擴散變換器（diffusion transformers）雖然在短影片生成方面表現出色，但其自注意力（self-attention）機制的二次方成本，使得處理長序列時，記憶體和計算資源的消耗變得難以承受，導致效率低下且難以優化。這意味著，隨著影片時長的增加，AI模型可能會「忘記」影片開頭的人物身份、動作或場景設定，導致影片內容的連貫性、一致性大大降低。

(more…)

Categories: 字節跳動, 香港中文大學, 開源, 影像模型

ToonComposer：簡化動畫製作

傳統的卡通/動漫製作耗時耗力，需要技藝精湛的藝術家進行關鍵影格、中間畫和上色。 ToonComposer 利用生成式 AI 簡化了這個流程，將數小時的中間畫和上色手動工作簡化為一個無縫銜接的流程。

ToonComposer: Streamlining Cartoon Production with Generative Post-Keyframing

Watch this video on YouTube

Categories: 香港中文大學, 視頻模型, 動畫, 影像模型, 影像處理

NVSpeech 處理副語言聲音

NVSpeech 用於處理副語言聲音（paralinguistic vocalizations），包括非語言聲音（如笑聲、呼吸）和詞彙化插入語（如「uhm」、「oh」）。這些元素在自然對話中至關重要，能傳達情感、意圖和互動線索，但傳統自動語音辨識（ASR）和文字轉語音（TTS）系統往往忽略它們。

Categories: 香港中文大學, 開源, 聲效, Mac, Win, 模型, 語音

HPSv3 基於視覺語言模型

HPSv3（Human Preference Score v3）是一個由 Mizzen AI、香港中文大學 MMLab、倫敦國王學院、上海交通大學及上海人工智能實驗室等機構合作開發的項目，目標是建立一個全面的人類偏好評估系統，用於評估文本到圖像生成模型的表現。

HPSv3 旨在解決現有圖像生成模型評估中與人類感知對齊的問題，現有方法常受限於數據覆蓋範圍不足、特徵提取不佳及損失函數效率低下的問題

Categories: 香港中文大學, 香港

VisionThink 智慧高效視覺語言模型

VisionThink 利用強化學習自主學習減少視覺 token。與傳統的高效 VLM 方法相比，這方法在
微粒度基準測試（例如涉及 OCR 相關任務的基準測試）上取得了顯著的提升。

由香港中文大學，香港大學，科技大學大聯合開發

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Watch this video on YouTube

Categories: 香港大學, 香港中文大學, 開源, 香港科技大學, 視覺模型, 推理引擎, 深度學習, 模型

Amphion 多功能聲頻 LLM

Amphion(/æmˈfaɪən/) 是一個用於音訊、音樂和語音生成的工具包

支持可重複的研究，並幫助初級研究人員和工程師開始音訊、音樂和語音生成研究和開發領域。

香港中文大學（深圳）、上海人工智慧實驗室和深圳大數據研究院聯合開發。

(more…)

Categories: 香港中文大學, 軟件

[免費] AnimateDiff 動畫

GitHub – AnimateDiff.

可透過 Stable Diffusion 或單獨運作

AnimateDiff 是一個由上海人工智能實驗室、香港中文大學和美國史丹福大學聯合開發的項目。它提供了一個能夠以視覺方式呈現 GitHub 倉庫差異的工具。你可以使用 Stable Diffusion 或單獨運作此工具。

安裝和使用 AnimateDiff 的詳細教程可以在以下鏈接中找到：

AnimateDiff詳細安裝和使用教程

此外，如果你更喜歡通過視頻來學習，你還可以在以下鏈接中找到中文的 YouTube 教學：

中文 YouTube 教學

希望這些資源能幫助你了解和使用 AnimateDiff。

Categories: Stable Diffusion, 香港中文大學, 軟件

「中大創新」成立助初創企業發展

逾 10 間中學試用

本地大學積極推動創科發展。中文大學昨宣布成立「中大創新有限公司」（中大創新），與8間本地企業達成合作協議，為具發展潛力的中大初創企業提供早期資金、專業知識及人脈，支援本地創科發展。逾40間校友及師生的初創企業，昨在中大創新日分享研發成果，有學生研發運用人工智能（AI）生成文憑試模擬試卷，目前已有逾10間中學試用。新成立的「中大創新」，與風險投資專家、家族辦公室等合作，建立聯合投資平台，協助大學初

Categories: 香港中文大學, 新聞