Google Bard 實驗更新內容

Bard 迄今功能最強大的模型

  • 改變:使用者的意見回饋讓 Bard 變得更直覺好用、更具創意,而且回應速度更快。無論你是想找個創意夥伴共同創作趣味內容、將想法翻譯成 40 多種語言、編寫複雜的程式碼,或是從不同角度探索新知,Bard 都能助你一臂之力,而且品質和準確度大大提升。
  • 原因:我們秉持快速疊代原則,努力將 Bard 最先進的技術帶給全世界。你的意見回饋幫助我們打造出迄今最強大的 Bard 版本,讓世界各地的使用者能以各種語言順暢使用 Bard。

使用新版「使用 Google 搜尋」功能,檢查 Bard 的回覆

  • 功能:[G] 按鈕讓你借助 Google 搜尋的力量,檢查 Bard 生成的 AI 回覆。此功能將從英文開始支援。如果回覆中陳述可受驗證,該段陳述在回覆中便會醒目顯示,你可以按一下查看更多資訊。

    請注意:這些連結為 Google 搜尋找到的內容,不代表 Bard 在撰寫原始回覆時曾使用這些資料來源。
  • 目的:大家使用 AI 工具,是為了以全新的方式來理解複雜的內容。使用者在 Bard 的幫助下學習新知,那麼 AI 生成內容的可信度就十分重要,讓你可以安心吸收資訊。

接續他人分享的對話

  • 功能:當別人透過 Bard 的公開連結分享功能與你分享他們的 Bard 對話,你可以在自己的帳戶中繼續對話,接續別人開啟的話題。
  • 目的:他人的作品往往能激發我們的創意,有越多點子可以參考,我們就越可能發想出真正創新的點子。因此我們推出此功能,讓你能夠輕鬆使用其他人分享的對話,由此展開你的創意探索。

更多功能將於所有支援的語言中推出

  • 功能:不管使用何種支援語言,你都可透過 Google 智慧鏡頭上傳圖像、在回覆中顯示 Google 搜尋圖像,並修改 Bard 的回覆,讓回覆更簡潔,或將回覆加長、縮短,甚至改用更專業或更隨性口語的語氣。
  • 目的:修改回覆功能可讓你依照需求調整回覆,對自己的創作過程更有掌控權。將圖像加入提示中可激發更多創造力,而在回覆中顯示圖像也能幫你把想法化為具象。

VALL-E X: 多語言文本到語音合成與語音克隆 🔊

ALL-E X 是一個強大而創新的多語言文本轉語音(TTS)模型,最初由微軟發佈。雖然微軟最初在他們的研究論文中提出了該概念,但並未發佈任何代碼或預訓練模型。我們認識到了這項技術的潛力和價值,復現並訓練了一個開源可用的VALL-E X模型。我們很樂意與社區分享我們的預訓練模型,讓每個人都能體驗到次世代TTS的威力。 🎧更多細節請查看 model card.



文字魔化師 Audi open AI

Clubhouse Keith 今日在他的輕鬆講科技專題房介紹了這個十分好用的聲音轉文字工具。

audiopen.ai/


視頻、圖像、音樂和語音 – FullJourney AI

FullJourney 是一套強大的人工智能創作平台,它能夠根據簡單的提示詞生成令人難以置信的視頻、圖像、音樂和語音。無論您是想要創建精彩的電影、製作絢麗的圖像,還是生成獨特的音樂和聲音效果,FullJourney 都能夠滿足您的需求。

FullJourney 需要透過 Discord 生成多種獨特而生動的視頻和圖像,這有點與 MidJourney 相似,不過你只要透過 FullJourney 網站進入 Discord,無需付費便可即時使用。

(more…)

SDXL 1.0 正式推出


Stability AI開發團隊表示,這次推出的SDXL 1.0是Stable Diffusion AI圖像生成所使用的文字到圖像模型的一大革新,並自豪地宣稱它是世界上最佳的開源圖像生成模型。

SDXL由 35 億參數的基礎模型與 66 億參數的細化器組成,針對寫實風格的圖像進行優化,當然亦能處理各種風格的高品質圖像。舊版在手部與複雜構圖上的缺陷已被改善,增強色彩表現,能夠產生更突出的對比、光影效果,而默認輸出 1024 x 1024 的高解析度圖像。

SDXL Complete Guide | FREE & UNCENSORED Midjourney Alternative

Mac M1 用家如果想用 Stable Diffusion Automatic 1111 1.6 運行 SDXL Checkpoint, 可以作以下調整:

Delete webui-maco-env.sh
Remove export PYTORCH_MPS_HIGH_WATERMARK_RATIO="0.0" in webui-user.sh if exist
Add this env export COMMANDLINE_ARGS="--skip-torch-cuda-test --no-half --use-cpu all"

Stable Diffusion 1.5 Vs SDXL 效果對比 https://imgsli.com/MjA3OTgx


SDXL 1.0 使用教程

根據官方提供的規格內容,總結 SDXL 1.0 主要改進:

SDXL 1.0 是一個具有多項重要改進的新型圖像生成模型。根據官方提供的規格內容,以下是我的總結:

  1. 提升圖像質量:SDXL 1.0 通過採用新的架構,在各種風格上實現了顯著的美學質量提升。
  2. 擴大模型規模:新版本的模型參數由一個基礎模型和一個精煉器(refiner)組成,參數規模大幅提升,使得模型更強大。
  3. 提高基礎分辨率:SDXL 1.0 的基礎分辨率由 512×512 提高到 1024×1024,意味著生成的圖像能夠展現更豐富的細節,而且處理各種寬高比情況時表現更出色。
  4. 多樣的藝術風格:新版本提供了更多的藝術風格選擇,這使得生成的圖像更加豐富多樣。圖像的顏色更加生動逼真,對比度、光照和陰影效果也得到了改善。
  5. 簡單直觀的生成方式:使用 SDXL 1.0,只需要簡單直觀的語言描述,就能生成複雜細緻、漂亮的圖像,不再需要使用類似「咒語」的形容詞。
  6. 簡化的模型微調流程:模型微調變得更加簡單,而且需要的數據量更少。

教程

繁體中文简体中文English
Stable Diffision最新模型SDXL 1.0使用全教程How to run SDXL 1.0 model

BARK INFINITY 語音合成源碼開放

BARK INFINITY 係一個功能強大嘅聲音合成器 A.I. TTS(人工智能文本轉語音)嘅開放源碼項目。由 Suno 團隊開發,基於 GPT 類模型產生語音,與其他的語音生成不同的是它含有創意部分,能夠生成真人語氣、混合語言朗讀,還包括音樂、背景雜音、和簡單的音響效果,亦可以在語音中夾雜笑聲、嘆氣和哭泣等表達。

佢可以將文字轉換成自然流暢嘅語音,俾人聽起嚟實在好似真人咁。佢有好高嘅音質同埋唔同嘅語音風格可供選擇,用家可以根據自己嘅需要同喜好進行設定。

如果你唔想自行安裝,可以去 Suno Discord 試玩,Suno 甚至可以用 txt2song 方式幫你生成歌曲。

我用咗 Tate McRae 嘅 What would you do 第一段歌詞,用 /chirp 指令生成下面的歌:

Suno 指令簡介


Google Bard Vs Claude 廣東話對決

Prompt: 請用繁體中文,廣東話形式比較 Google Bard 與 Claude 有何不同


Google Bard > Bard 和 Claude 都是 Google AI 創建的大型語言模型。他們都接受了大量的文字和程式碼數據集的訓練,能夠生成文字、翻譯語言、編寫不同類型的創意內容,並以信息豐富的方式回答您的問題。但是,兩者之間也存在一些關鍵差異。

Bard 是事實語言模型,而 Claude 是生成語言模型。這意味著 Bard 更好地理解和回答事實問題,而 Claude 更好地生成創意文字格式,如詩歌、程式碼、腳本、音樂作品、電子郵件、信件等。此外,Bard 是基於 Transformer 架構的,而 Claude 是基於 GPT-3 架構的。這意味著 Bard 在處理自然語言方面更快、更有效率,而 Claude 在生成創意文字格式方面更好。

總的來說,Bard 和 Claude 都是強大的語言模型,具有不同的優勢和劣勢。最好的模型將取決於您的特定需求。如果您需要一個可以理解和回答事實問題的語言模型,那麼 Bard 是一個不錯的選擇。如果您需要一個可以生成創意文字格式的語言模型,那麼 Claude 是一個不錯的選擇。


Claude > 好嘅,我比較下 Google Bard 同 Claude 嘅分別:

  1. 創造公司不同: Google Bard 係由Google研發,Claude 係由 Anthropic 公司創造。
  2. 規模不同: Google Bard 可以訪問更大規模嘅知識圖譜及數據庫, Claude 規模細小啲。
  3. 對話風格不同: Google Bard 嘅對話較貼近日常,Claude 會比較正式。
  4. 語言表達能力不同: Google Bard 可以處理更多語言,Claude 主要係英文交流。
  5. 使用範圍不同: Google Bard 面向更廣泛使用者,Claude 較專注商業用途。
  6. 開放程度不同: Google Bard 提供公開測試,Claude 只有受邀用戶可以試用。
  7. 發展階段不同: Google Bard 仲係測試中,Claude 已推出商業版本。

總括嚟講,佢哋都係利用 AI 自然語言處理技術,但因為創造目的不同,所以各有特色。日後可能會互相啟發,共同進步。

Claude 2 new model


OpenAI 提交了“GPT-5”的商標申請!

Prompt: 請用廣東話介紹 OpenAI 在 7月 18 日向美國專利商標局 USPTO 提交 “GPT-5” 商標申請的情況!


Claude > OpenAI 喺 7月18 號申請咗「GPT-5」嘅商標, 打算開發一個可以處理語言、圖片同聲音嘅多模式AI系統。

GPT-5計劃可以做到自然語言處理、文字生成、理解語義、語音轉文字等等, 進一步提升 AI 嘅多媒體處理能力。

雖然 OpenAI 行政總裁早前否認佢哋而家有開發 GPT-5, 但申請商標似乎係為咗未來發展先做准備。

從功能上睇, GPT-5 可能與 GPT-4 差不多, 主要提升係喺多媒體方面。不過係咪真係有GPT-5 計劃開發, 仲要看 OpenAI 日後嘅行動同官方消息才確定得。

但無論點, AI 發展趨勢係朝多模式處理方向去, 將語言、圖片、聲音等結合, 做到更自然互動。相信 GPT-5 一日出世, 將會再次風靡全球, 值得期待佢嘅能力。


Prompt: OpenAI行政總裁早前否認佢哋而家有開發GPT-5 ?

Google Bard > 是的,OpenAI行政總裁Sam Altman在2022年11月否認了他們正在開發GPT-5的傳言。他在推特上說:「我們不會在未來幾年內推出GPT-5。」

然而,這並不意味著OpenAI沒有在開發更強大的語言模型。在2023年1月,他們發布了名為DALL-E 2的新的圖像生成模型。DALL-E 2能夠生成逼真和細緻的圖像,從文字描述中,這表明OpenAI在圖像生成方面的技術不斷提高。

因此,雖然OpenAI可能不會在未來幾年內推出GPT-5,但他們可能正在開發更強大的語言模型。我們將不得不等待才能看到OpenAI接下來會推出什麼。


Page 13 of 15
1 11 12 13 14 15