AI Directory


FMA-Net 即將推出最強模糊影片修正


Meta 已著手訓練 Llama 3


MS-Vid2Vid (Video-to-Video)高清視頻生成大模型

「MS- Video-to-Video」係一種深度學習模型,可以將一段視頻轉換成另一種風格、場景轉換、動作等操作。例如,可以將一段日本動畫轉換成中國水墨畫風格,或者將一段街頭表演轉換成動畫風格。

MS-Vid2Vid-XL 和 Video-to-Video 第一階段相同,都是基於隱空間的視頻擴散模型(VLDM),且其共享相同結構的時空UNet(ST-UNet),其設計細節延續我們自研 VideoComposer,具體可以參考其技術報告。


Civitai 推出俱樂部

Civitai 本週推出了俱樂部 —— 一個為創作者提供類似 Patreon 平台,讓為 Creator 提供以 Buzz 貨幣與用家進行交易。讓創作者分享他們的獨家創作,並討論如何充分利用這些東西。

Civitai 為提供獨家內容的創作者提供更好的體驗,並為所有人的永續發展鋪平道路。 可是,Civitai 遇到了一些障礙,也看到了一些強烈反對。

最終 Civitai 以民主方式決定未來,讓所有用戶提出一些想法,集思廣益,可以幫助創作者實現永續發展。 也許這些的結合可以成為我們未來成功的秘訣?

一旦您有機會查看這些選項,請務必投票


Google Bard 2023 12 月更新

要避免 GPT 出現越來越嚴重的錯誤內容,唯有不斷改進現有的演算法。我相信 Bard 採用 Gemini 的 Multimodol 模型就是一種新嘗試。

Google Bard 最初是基於 LaMDA,但後來轉用 PaLM 和 Gemini。

  • 2023 年 3 月:Bard 在有限的容量下推出,由 LaMDA 提供支持。
  • 2023 年 5 月:Bard 擴展到其他國家,並轉向 PaLM,另一個來自 Google AI 的強大語言模型。
  • 2023 年 10 月:Bard 採用 Gemini,這是一個針對對話任務而特別設計的更先進的 LLM。

因此,儘管 LaMDA 在早期開發中起到了至關重要的作用,但目前依賴 Gemini 的能力來生成文本、翻譯語言、創作不同類型的創意內容,以及以一種信息豐富的方式回答您的問題。

以下是總結這些模型差異的一個表格:

(more…)


Apple 開放 MLX 機器學習 API

Awni Hannun 宣怖 Apple 正式開放 ML Framework 並於 GitHub 設立模型庫及應用介面範例。各種使用MLX 框架的獨立範例。

MNIST範例是學習如何使用 MLX 的良好起點。

一些更有用的例子包括:


Gemini AI – 2023-12-13 正式上線!

從今天開始,Google Bard 將使用 Gemini Pro 的微調版本來進行更高級的推理、計劃、理解等。 這是 Bard 自推出以來最大的升級。 它將在 170 多個國家和地區提供英語版本,我們計劃在不久的將來擴展到不同的模式並支援新的語言和地點。

原生多模態(Natively Multimodel):Google Gemini 的突破

以往創建多模態大模型的方法,通常是先分別訓練文本、圖像、音頻等單一模態的模型,然後將它們拼接在一起。這樣的模型雖然在某些特定任務上表現不錯,不過面對更具概念性,或者複雜推理的任務,往往表現不太理想。

Gemini 提出了原生多模態的概念,即從一開始就對不同的模態進行整合訓練,然後用額外的多模態數據進行微調。這樣訓練出來的模型可以更好地理解不同模態之間的關係,從而提高在複雜任務上的表現。

Google 還將 Gemini 引入 Pixel。 Pixel 8 Pro 是第一款運行 Gemini Nano 的智慧型手機,它支援記錄器應用程式中的 Summarize 等新功能,並從 WhatsApp 開始推出 Gboard 中的智慧回覆功能,明年還將推出更多訊息應用程式。

在接下來的幾個月中,Gemini 將出現在我們更多的產品和服務中,例如搜尋、廣告、Chrome 和 Duet AI。

Google 已經開始在搜尋器中試驗 Gemini,它使用戶的搜尋生成體驗 (SGE) 更快,延遲減少了 40%,同時品質也提高了。

Google 谷歌 Gemini 碾压 GPT-4!人类最强 AI 模型问世,迈出 AGI 的第一步 | 回到Axton

Lyria 改變未來的音樂創作方法

從爵士樂到重金屬,從電子音樂到歌劇,音樂是一種深受人們喜愛的創意表達形式。到目前為止,由於歌詞、旋律、節奏和人聲複雜且層次豐富,創作引人入勝的音樂對於人工智慧 (AI) 系統來說尤其具有挑戰性。

今天 與 YouTube 合作,宣布推出 Google DeepMind 的 Lyria,這是我們迄今為止最先進的人工智慧音樂生成模型,以及兩項旨在為創造力開闢新遊樂場的人工智慧實驗:

  • Dream Track – YouTube Shorts 中的一項實驗,旨在透過音樂創作幫助加深藝術家、創作者和粉絲之間的聯繫。
  • 音樂人工智慧工具——我們與藝術家、歌曲作者和製作人一起設計的一套工具,以幫助加強他們的創作過程。

為了開發這些項目,我們匯集了來自 Google 各地的技術專家以及眾多世界知名藝術家和歌曲作者,共同探索生成音樂技術如何負責任地塑造音樂創作的未來。我們很高興能夠建立新技術,以增強專業音樂家和藝術家社群的工作,並為音樂的未來做出積極貢獻。

Google DeepMind,前稱DeepMind科技(DeepMind Technologies Limited)是一家英國的人工智慧公司。公司建立於2010年,在2014年被Google收購。


Page 11 of 15
1 9 10 11 12 13 15