Wav2Lip (Lipsync 工具)

ChatGPT, Bard, Claude2 比較

[ACM Multimedia, 2020] Wav2Lip: Accurately Lip-syncing Videos In The Wild
Wav2Lip 簡介(英文)

Open In Colab

我從三個不同的 A.I. 平台嘗試找更多關於 Wav2Lip 的資料時出現如下的情況:

(more…)
Categories: 軟件, 工具

Google Bard Extensions 可連結至第三方應用程式

Categories: 新聞

港學者獲 AI 新法轉化語言 – 最佳論文獎

Categories: 新聞

「中大創新」成立助初創企業發展

Categories: 香港中文大學, 新聞

Fooocus – Stable Diffusion XL簡易版

Fooocus 使用 SDXL – Stable-diffusion XL 版作為產生圖片的核心。SDXL 是一款開源免費的 Clipdrop 技術,通過使用擴展現有的圖像處理算法,可以快速而準確地在不同設備上生成圖片

原圖
Fooocus 擴展左右
(more…)
Categories: 新聞


Google Bard 實驗更新內容

Bard 迄今功能最強大的模型

  • 改變:使用者的意見回饋讓 Bard 變得更直覺好用、更具創意,而且回應速度更快。無論你是想找個創意夥伴共同創作趣味內容、將想法翻譯成 40 多種語言、編寫複雜的程式碼,或是從不同角度探索新知,Bard 都能助你一臂之力,而且品質和準確度大大提升。
  • 原因:我們秉持快速疊代原則,努力將 Bard 最先進的技術帶給全世界。你的意見回饋幫助我們打造出迄今最強大的 Bard 版本,讓世界各地的使用者能以各種語言順暢使用 Bard。

使用新版「使用 Google 搜尋」功能,檢查 Bard 的回覆

  • 功能:[G] 按鈕讓你借助 Google 搜尋的力量,檢查 Bard 生成的 AI 回覆。此功能將從英文開始支援。如果回覆中陳述可受驗證,該段陳述在回覆中便會醒目顯示,你可以按一下查看更多資訊。

    請注意:這些連結為 Google 搜尋找到的內容,不代表 Bard 在撰寫原始回覆時曾使用這些資料來源。
  • 目的:大家使用 AI 工具,是為了以全新的方式來理解複雜的內容。使用者在 Bard 的幫助下學習新知,那麼 AI 生成內容的可信度就十分重要,讓你可以安心吸收資訊。

接續他人分享的對話

  • 功能:當別人透過 Bard 的公開連結分享功能與你分享他們的 Bard 對話,你可以在自己的帳戶中繼續對話,接續別人開啟的話題。
  • 目的:他人的作品往往能激發我們的創意,有越多點子可以參考,我們就越可能發想出真正創新的點子。因此我們推出此功能,讓你能夠輕鬆使用其他人分享的對話,由此展開你的創意探索。

更多功能將於所有支援的語言中推出

  • 功能:不管使用何種支援語言,你都可透過 Google 智慧鏡頭上傳圖像、在回覆中顯示 Google 搜尋圖像,並修改 Bard 的回覆,讓回覆更簡潔,或將回覆加長、縮短,甚至改用更專業或更隨性口語的語氣。
  • 目的:修改回覆功能可讓你依照需求調整回覆,對自己的創作過程更有掌控權。將圖像加入提示中可激發更多創造力,而在回覆中顯示圖像也能幫你把想法化為具象。
Categories: 新聞

Google 開發的機器學習庫 TensorFlow Hub

TensorFlow Hub 是一個由 Google 開發的機器學習庫,它提供了許多預訓練的機器學習模型和資源,讓開發者能夠輕鬆地使用這些模型來解決各種機器學習任務。你可以在 TensorFlow Hub 上找到許多先進的模型,包括圖像分類、自然語言處理、聲音識別等等。

使用TensorFlow Hub,你不需要從頭訓練一個模型,而是直接使用經過大量訓練的模型來進行預測或特徵提取。節省大量的時間和資源。TensorFlow Hub 還提供了一個便於使用和共享模型的平台,讓開發者能夠輕鬆地找到和使用最適合自己任務的模型。

對於想要使用機器學習的開發者來說,TensorFlow Hub 是一個非常有用的工具,它能夠加速模型開發和部署的過程。

例如:有興趣訓練支援中文的模型,可以參考 Universal Sentence Encoder

classic

Categories: TensorFlow

VALL-E X: 多語言文本到語音合成與語音克隆 🔊

ALL-E X 是一個強大而創新的多語言文本轉語音(TTS)模型,最初由微軟發佈。雖然微軟最初在他們的研究論文中提出了該概念,但並未發佈任何代碼或預訓練模型。我們認識到了這項技術的潛力和價值,復現並訓練了一個開源可用的VALL-E X模型。我們很樂意與社區分享我們的預訓練模型,讓每個人都能體驗到次世代TTS的威力。 🎧更多細節請查看 model card.

Categories: 新聞

SDXL LoRA 培訓指南(英文)

這份簡報提供學習如何製作LoRA 模型的寶貴資訊。在這份簡報中,你將找到以下指導方針:

  • 將最大解析度設定為至少 1024×1024,這是SDXL的標準解析度。
  • 使用至少 12GB 內存的 GPU 進行 LoRA 模型的訓練。
  • 我們強烈建議在 SDXL LoRA 訓練過程中使用 --train_unet_only 選項,以避免因SDXL中的雙文本編碼器而造成無法預料的訓練結果。
  • PyTorch 2 比 PyTorch 1 使用的 GPU 內存較少。

此外,簡報還提供了一個使用 Adafactor 優化器的示例配置,該優化器具有固定的學習率,並使用了常數加溫策略。以下是示例配置的代碼片段:

optimizer_type = "adafactor"
optimizer_args = [ "scale_parameter=False", "relative_step=False", "warmup_init=False" ]
lr_scheduler = "constant_with_warmup"
lr_warmup_steps = 100
learning_rate = 4e-7 # 這是SDXL的標準學習率

請點擊這裡查看完整的簡報內容。希望這份簡報能夠幫助你更好地了解如何製作LoRA模型。

Categories: 教學

Page 60 of 65
1 58 59 60 61 62 65