VALL-E X: 多語言文本到語音合成與語音克隆 🔊

ALL-E X 是一個強大而創新的多語言文本轉語音(TTS)模型,最初由微軟發佈。雖然微軟最初在他們的研究論文中提出了該概念,但並未發佈任何代碼或預訓練模型。我們認識到了這項技術的潛力和價值,復現並訓練了一個開源可用的VALL-E X模型。我們很樂意與社區分享我們的預訓練模型,讓每個人都能體驗到次世代TTS的威力。 🎧更多細節請查看 model card.


SDXL LoRA 培訓指南(英文)

這份簡報提供學習如何製作LoRA 模型的寶貴資訊。在這份簡報中,你將找到以下指導方針:

  • 將最大解析度設定為至少 1024×1024,這是SDXL的標準解析度。
  • 使用至少 12GB 內存的 GPU 進行 LoRA 模型的訓練。
  • 我們強烈建議在 SDXL LoRA 訓練過程中使用 --train_unet_only 選項,以避免因SDXL中的雙文本編碼器而造成無法預料的訓練結果。
  • PyTorch 2 比 PyTorch 1 使用的 GPU 內存較少。

此外,簡報還提供了一個使用 Adafactor 優化器的示例配置,該優化器具有固定的學習率,並使用了常數加溫策略。以下是示例配置的代碼片段:

optimizer_type = "adafactor"
optimizer_args = [ "scale_parameter=False", "relative_step=False", "warmup_init=False" ]
lr_scheduler = "constant_with_warmup"
lr_warmup_steps = 100
learning_rate = 4e-7 # 這是SDXL的標準學習率

請點擊這裡查看完整的簡報內容。希望這份簡報能夠幫助你更好地了解如何製作LoRA模型。


CapCut 全能 A.I. 創意平台

CapCut 是一個由人工智慧驅動的全能創意平台,提供視頻編輯和圖像設計功能。無論你是使用瀏覽器、Windows、Mac、Android 還是 iOS,都可以在 CapCut 上進行優質的視頻剪輯和圖像設計。不論你是想在社交媒體上製作精美視頻,還是需要設計專業的圖像作品,CapCut 都可以滿足你的需求。它的智慧 AI 技術讓創作變得更加簡單和有趣,讓你能夠輕鬆地添加特效、滤鏡、字幕等,製作出令人驚艷的視覺效果。無論你是專業的影像創作者還是想體驗一下創作的樂趣,CapCut 都是你的不二選擇。儘管只需要幾個簡單的步驟,CapCut 將幫助你打造出令人難以置信的作品!現在就開始使用 CapCut,展示你的創造力吧!

CapCut 的母公司是字節跳動,一家全球領先的科技公司。字節跳動成立於2012年,總部位於中國北京,並在全球各地擁有多個辦事處和研發中心。字節跳動以創新的技術和產品聞名,致力於為全球用戶提供豐富多樣的數字內容和娛樂體驗。

作為字節跳動的子品牌,CapCut 是其在全能創意平台領域的重要產品之一。CapCut 以其強大的人工智慧技術和精緻的設計工具著稱,為用戶提供了優質的視頻編輯和圖像設計功能。公司在數字內容創作和社交媒體領域擁有豐富的經驗和專業知識,致力於打造創新的產品,提供最佳的用戶體驗。

字節跳動和 CapCut 共同致力於推動數字創意和內容行業的發展,並不斷努力為用戶帶來更多創新和有趣的工具和功能。無論是專業的創作者還是剛入門的用戶,都可以在 CapCut 的平台上發揮創造力,展示獨特的視覺魅力。作為字節跳動的全能創意平台之一,CapCut 一直以來都深受用戶的喜愛,並持續影響著數字內容和創意領域的發展。


LM Studio 探索和運行本地 LLM

V0.2.6 – 16 Sept 2023

👾 LM Studio – 探索和運行本地 LLM LM Studio 是一個強大的工具,讓您可以輕鬆尋找、下載和實驗本地 LLMs(Language Model Mixers)。

LLMs 是一種特殊的語言模型,結合了多個不同的模型來產生更加多樣和靈活的文本生成能力。LM Studio 提供了一個直觀而強大的使用界面,讓您能夠自由探索各種 LLMs 的可能性。

不僅如此,您還可以從社群中下載其他用戶共享的 LLMs,並將其應用到自己的文本生成任務中。

更棒的是,LM Studio 還提供了一個實驗室功能,讓您能夠自行訓練和調整 LLMs。您可以根據自己的需求和喜好,調整模型的參數,以獲得最理想的生成效果。無論您是專業用戶還是對語言模型感興趣的新手,LM Studio 都能夠滿足您的需求。

不要猶豫,立即開始使用 LM Studio,探索本地 LLMs 的無限可能性吧!


Narakeet 支持 4 種廣東話語音合成器

手機亦可正常操作

原文:警方新界北總區刑事部警司(行政及支援)林慶璋稱,警方發現去年第四季不少街頭暴力罪案的源頭均來自黑社會經營及操控的非法場所,例如有人在無牌酒吧「飲大咗」而碰撞;賭檔利益問題起爭拗,最後事件發酵,有人訴諸武力,釀成街頭血案等。


ControlNet SDXL 模影下載


適合初學者的 AI 工具瀏灠器 Pinokio

首先,Pinokio 完全與系統已安裝的軟件分離,獨立運作。因始完全不會影响你的操作系統。另外,它能夠提供個性化的A.I 工具瀏覽體驗。Pinokio 使用先進的人工智慧技術,根據使用者的喜好,自動安裝 A.I 工具。

Pinokio 具有以下特點:

(more…)

創意師必備的 A.I. – Ideogram

Jetpack A.I. 助手對 Ideogram 的簡介如下

ideogram.ai 是一個幫助人們提升創造力的平台。我們的目標是透過應用人工智慧技術,協助使用者在各種創意領域中取得突破性的成果。

無論您是一位設計師、作家、藝術家還是任何從事創意工作的人,ideogram.ai 都能成為您的良好助手。我們提供各種工具和資源,讓您能夠快速、輕鬆地創作各種形式的內容。

無論您需要設計一份海報、寫作一篇文章、創造一幅藝術作品,甚至是編排一個企劃,ideogram.ai 都能為您提供所需的支援。我們的平台可以快速生成各種素材、提供設計靈感、甚至是協助您將想法轉化為具體的視覺和文字形式。

開發團隊致力於不斷改進 ideogram.ai 的功能和使用體驗,以確保使用者能夠輕鬆地發揮創造力,實現卓越的成果。無論您是初學者還是經驗豐富的專業人士,都可以在 ideogram.ai 中找到合適的工具和支援。

如果您渴望在創意領域中有更好的表現,那麼不妨一試 ideogram.ai 的啟發及創造力,共同探索無限可能性!


下面圖片 Prompt(提詞): a movie poster for Simpsons, with visible prominent text in full view that spells “elBarto is the best” toddler hugging a big bottle of Coke, typography, 3d render


圖文並茂的國產 A.I. – AIdea

一款集成了主流大語言模型以及繪圖模型的 APP, 採用 Flutter 開發,代碼完全開源,支持以下功能:

  • 支持 GPT-3.5/4 問答聊天
  • 支持國產模型:通義千問,文心一言
  • 支持文生圖、圖生圖、超分辨率、黑白圖片上色等功能,集成 Stable Diffusion 模型,支持 SDXL 1.0

開源代碼:



Page 45 of 49
1 43 44 45 46 47 49