AI Directory

Categories: 新聞


Meta 已著手訓練 Llama 3

Categories: 新聞, LLaMa

MS-Vid2Vid (Video-to-Video)高清視頻生成大模型

「MS- Video-to-Video」係一種深度學習模型,可以將一段視頻轉換成另一種風格、場景轉換、動作等操作。例如,可以將一段日本動畫轉換成中國水墨畫風格,或者將一段街頭表演轉換成動畫風格。

MS-Vid2Vid-XL 和 Video-to-Video 第一階段相同,都是基於隱空間的視頻擴散模型(VLDM),且其共享相同結構的時空UNet(ST-UNet),其設計細節延續我們自研 VideoComposer,具體可以參考其技術報告。

Categories: 工具, Video, 新聞

Civitai 推出俱樂部

Civitai 本週推出了俱樂部 —— 一個為創作者提供類似 Patreon 平台,讓為 Creator 提供以 Buzz 貨幣與用家進行交易。讓創作者分享他們的獨家創作,並討論如何充分利用這些東西。

Civitai 為提供獨家內容的創作者提供更好的體驗,並為所有人的永續發展鋪平道路。 可是,Civitai 遇到了一些障礙,也看到了一些強烈反對。

最終 Civitai 以民主方式決定未來,讓所有用戶提出一些想法,集思廣益,可以幫助創作者實現永續發展。 也許這些的結合可以成為我們未來成功的秘訣?

一旦您有機會查看這些選項,請務必投票

Categories: 新聞

Google Bard 2023 12 月更新

要避免 GPT 出現越來越嚴重的錯誤內容,唯有不斷改進現有的演算法。我相信 Bard 採用 Gemini 的 Multimodol 模型就是一種新嘗試。

Google Bard 最初是基於 LaMDA,但後來轉用 PaLM 和 Gemini。

  • 2023 年 3 月:Bard 在有限的容量下推出,由 LaMDA 提供支持。
  • 2023 年 5 月:Bard 擴展到其他國家,並轉向 PaLM,另一個來自 Google AI 的強大語言模型。
  • 2023 年 10 月:Bard 採用 Gemini,這是一個針對對話任務而特別設計的更先進的 LLM。

因此,儘管 LaMDA 在早期開發中起到了至關重要的作用,但目前依賴 Gemini 的能力來生成文本、翻譯語言、創作不同類型的創意內容,以及以一種信息豐富的方式回答您的問題。

以下是總結這些模型差異的一個表格:

(more…)
Categories: 新聞


Apple 開放 MLX 機器學習 API

Awni Hannun 宣怖 Apple 正式開放 ML Framework 並於 GitHub 設立模型庫及應用介面範例。各種使用MLX 框架的獨立範例。

MNIST範例是學習如何使用 MLX 的良好起點。

一些更有用的例子包括:

Categories: 新聞

Gemini AI – 2023-12-13 正式上線!

從今天開始,Google Bard 將使用 Gemini Pro 的微調版本來進行更高級的推理、計劃、理解等。 這是 Bard 自推出以來最大的升級。 它將在 170 多個國家和地區提供英語版本,我們計劃在不久的將來擴展到不同的模式並支援新的語言和地點。

原生多模態(Natively Multimodel):Google Gemini 的突破

以往創建多模態大模型的方法,通常是先分別訓練文本、圖像、音頻等單一模態的模型,然後將它們拼接在一起。這樣的模型雖然在某些特定任務上表現不錯,不過面對更具概念性,或者複雜推理的任務,往往表現不太理想。

Gemini 提出了原生多模態的概念,即從一開始就對不同的模態進行整合訓練,然後用額外的多模態數據進行微調。這樣訓練出來的模型可以更好地理解不同模態之間的關係,從而提高在複雜任務上的表現。

Google 還將 Gemini 引入 Pixel。 Pixel 8 Pro 是第一款運行 Gemini Nano 的智慧型手機,它支援記錄器應用程式中的 Summarize 等新功能,並從 WhatsApp 開始推出 Gboard 中的智慧回覆功能,明年還將推出更多訊息應用程式。

在接下來的幾個月中,Gemini 將出現在我們更多的產品和服務中,例如搜尋、廣告、Chrome 和 Duet AI。

Google 已經開始在搜尋器中試驗 Gemini,它使用戶的搜尋生成體驗 (SGE) 更快,延遲減少了 40%,同時品質也提高了。

Google 谷歌 Gemini 碾压 GPT-4!人类最强 AI 模型问世,迈出 AGI 的第一步 | 回到Axton
Categories: 新聞

Lyria 改變未來的音樂創作方法

從爵士樂到重金屬,從電子音樂到歌劇,音樂是一種深受人們喜愛的創意表達形式。到目前為止,由於歌詞、旋律、節奏和人聲複雜且層次豐富,創作引人入勝的音樂對於人工智慧 (AI) 系統來說尤其具有挑戰性。

今天 與 YouTube 合作,宣布推出 Google DeepMind 的 Lyria,這是我們迄今為止最先進的人工智慧音樂生成模型,以及兩項旨在為創造力開闢新遊樂場的人工智慧實驗:

  • Dream Track – YouTube Shorts 中的一項實驗,旨在透過音樂創作幫助加深藝術家、創作者和粉絲之間的聯繫。
  • 音樂人工智慧工具——我們與藝術家、歌曲作者和製作人一起設計的一套工具,以幫助加強他們的創作過程。

為了開發這些項目,我們匯集了來自 Google 各地的技術專家以及眾多世界知名藝術家和歌曲作者,共同探索生成音樂技術如何負責任地塑造音樂創作的未來。我們很高興能夠建立新技術,以增強專業音樂家和藝術家社群的工作,並為音樂的未來做出積極貢獻。

Google DeepMind,前稱DeepMind科技(DeepMind Technologies Limited)是一家英國的人工智慧公司。公司建立於2010年,在2014年被Google收購。

Categories: 新聞

Page 11 of 15
1 9 10 11 12 13 15