Word2Vec詞嵌入技術

將文字轉換成電腦可理解的數值向量的方法。Word2Vec 有兩種主要模型:連續詞袋模型 (CBOW) 和跳字模型 (Skip-gram),透過反向算法,根據上下文預測目標詞或反之,從而學習詞語間的關係。訓練後的詞向量具有語義相似性的特性,相似的詞彙在向量空間中距離較近,並能透過向量運算進行類比推理,例如「國王-男人+女人=王后」。Word2Vec 應用廣泛,例如搜尋引擎、推薦系統和機器翻譯,但其局限性在於每個詞只有一個固定向量,無法處理多詞片語的語義。

Word Embeddings: Word2Vec

詞嵌入 (Word Embeddings) 的概念及其應用

詞嵌入將文字轉換成數值向量,讓機器學習模型能夠處理文字資料。相似的詞彙在向量空間中彼此靠近,距離和方向代表詞彙間的語義關係。 片中說明了詞嵌入在自然語言處理 (NLP) 中的關鍵作用,例如文字分類、命名實體辨識和問答系統等。接著,解釋了兩種主要的詞嵌入方法:基於詞頻的方法 (例如TF-IDF) 和基於預測的方法 (例如Word2Vec, GloVe),並比較了它們的差異。最後,介紹了更先進的基於上下文的方法 (Transformer 模型),它能根據上下文調整詞彙的向量表示,進一步提升 NLP 的效能。這視頻旨在說明詞嵌入技術如何有效地將人類語言轉換成機器可理解的數值形式,從而推動自然語言處理的發展。

What are Word Embeddings?

RAG 向量中的文件分割策略

文件分割策略對於大型語言模型(LLM)的資訊檢索效能影響。現有資訊檢索基準測試通常以整篇文件的相關性評估效能,忽略了文件分割策略的重要性。RAG 文件分割(Text Chunking) 基於字元/詞(Token) 的分割、遞迴式分割、語義分割等,以找出最適合用於後續基於檢索增強生成(RAG)應用的最佳方法。

The BEST Way to Chunk Text for RAG

PyTorch vs TensorFlow

https://www.youtube.com/watch?v=CY3OZdHm-Kg


Flux Redux 統一風格 AI 角色教學

利用 Flux Redux 及其相關工具,製作一致風格AI角色同背景教學。重點是藉 Flux LoRa 訓練保持角色面部一致性。教學詳細講解如何使用 Redux Advanced Custom Nodes 控制圖像生成,透過調整 downsampling factor 控制風格變化,並利用 mask 參考圖像控制角色服裝及背景風格。最後,示範咗點樣將生成嘅圖像導入AI影片生成工具,製作動畫短片,實現角色風格一致但服裝同背景多樣化嘅效果。 整個過程強調簡潔易用,並提供實際案例同操作步驟。

Flux Redux Consistent Style Character And Background Easily In For AI Characters

Ollama 結構化輸出

Unlocking the Power of Ollama’s Structured JSON Output

Prefixing – 簡易提升 RAG 準確度

在向量數據庫應用中,「prefixes」指的是在文本塊輸入嵌入模型之前,在文本塊前插入一段描述其目的的文本。「prefixes」是一個簡單但有效的技術,可以顯著提高向量數據庫應用的準確性達 200%。

在 Olama 官方庫中的五個嵌入模型中,只有三個支持「prefixes」,Nomic、Snowflake Arctic 和 Mixed Bread 等。

儘管傳統的 LLM 可能更大,但它們不適合生成嵌入。嵌入模型專為生成嵌入而設計,它們的速度要快得多,並且可以產生更好的結果。Prefixing」嘅簡單技巧嵌入技巧。

Don’t Embed Wrong!

手把手教你如何部署大型語言模型

如何使用 vLLM 框架部署大型語言模型。教學包含使用 8B 同 70B 兩個版本作示範,並說明如何在 NVIDIA GPU 上安裝 VLLM,以及如何處理記憶體限制。

台大資訊 深度學習之應用 | ADL TA Recitation: LLM Deployment 手把手教你如何部署大型語言模型

Ollama 簡易模型優化

您是否曾經被 AI 模型建立的複雜性所淹沒?想像一下,您站在一場令人興奮旅程的門檻上,原本令人畏懼的 AI 模型客製化任務,突然變得令人振奮。

我們探索了 Ollama 的 Modelfile 世界,這是一個強大的工具,旨在改變您與 AI 開發互動的方式。想像一下:您拿了一個普通的模型,比如 Llama3.2,並為它注入新的生命,只需幾行代碼就能定制它的行為。通過每個命令,您為您的模型解鎖新的能力,賦予它個性與目的。

但是,如果您想更深入,將一個 safetensors 模型轉換並整合到您的工作流程中呢?這才是令人興奮的部分!加入我們的旅程,穿越 AI 客製化複雜而迷人的領域。您準備好迎接挑戰了嗎?

The Path To Better Custom Models



Page 4 of 12
1 2 3 4 5 6 12