教學 – Page 13 – Infer News

RAG 整合 Streamlit 直接與你的文件交談

Chat with Documents Using LLM

Developing RAG and Streamlit chatbots with LLMs for document-based Q&A. Enhance user engagement and streamline information retrieval.

探討如何使用 RAG (Retrieval-Augmented Generation) 和 Streamlit 建立一個文件交談聊天機器人。這個聊天機器人可以回答使用者關於文件的問題，並提供相關的文件內容。

什麼是 RAG？

RAG 是一種自然語言處理 (NLP) 模型，它可以從大型文件集中檢索和生成文本。它可以用於各種應用，例如客服聊天機器人、文件摘要和文件搜尋等。

什麼是 Streamlit？

Streamlit 是一個 Python 框架，它可以用於建立交互式網頁應用程序。它可以用於資料科學、機器學習和資料視覺化等領域。

建立文件交談聊天機器人

以下是建立文件交談聊天機器人的步驟：

安裝 RAG 和 Streamlit
準備文件集
建立 RAG 模型
建立 Streamlit 應用程序
整合 RAG 和 Streamlit

結論

在這篇文章中，我們探討了如何使用 RAG 和 Streamlit 建立一個文件交談聊天機器人。這個聊天機器人可以回答使用者關於文件的問題，並提供相關的文件內容。我們希望這篇文章能夠幫助您建立自己的文件交談聊天機器人。

Categories: 教學, 新聞

用 Python 建立專業級電影推薦 – 機器學習手冊

建立學習專案概念和發展基本技能的最有效方法之一。專案讓您沉浸解決現實世界中的問題，鞏固您的知識並培養批判性思維、適應能力和專案管理專業知識。本指南將引導您建立量身訂製的電影推薦系統

(英) How to Build a Production-Grade Movie Recommender in Python

Building projects is one of the most effective ways to thoroughly learn a concept and develop essential skills. Projects immerse you in real-world problem-solving, solidifying your knowledge and cultivating critical thinking, adaptability, and project management expertise. This guide will walk you through building a movie recommendation system that’s tailored

Categories: 教學

GitHub – HIT-SCIR/huozi: 活字通用大模型

活字通用大模型. Contribute to HIT-SCIR/huozi development by creating an account on GitHub.

Categories: 教學

practicalAI-cn: 實戰中文版

GitHub – AI實戰-practicalAI 中文版

AI實戰-practicalAI 中文版. Contribute to LisonEvf/practicalAI-cn development by creating an account on GitHub.

使用 PyTorch 實現基本的機器學習算法和深度神經網絡。
🖥️ 不需要任何設置，在瀏覽器中使用 Google Colab 運行所有程序。
📦 不僅僅是教程，而是學習產品級的面向對象機器學習編程。

Categories: 教學

什麼是 RAG (Retrieval-Augmented Generation)

檢索增強生成-讓大型語言模型更聰明的秘密武器

Categories: 教學

大規模中文自然語言處理 nlp_chinese_corpus

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP. Contribute to brightmart/nlp_chinese_corpus development by creating an account on GitHub.

語料庫將會不斷擴充。。。

一期目標：10個百萬級中文語料 & 3個千萬級中文語料(2019年5月1號)

二期目標：30個百萬級中文語料 & 10個千萬級中文語料 & 1個億級中文語料（2019年12月31日）

Update：增加高質量社區問答json版(webtext2019zh)，可用於訓練超大規模NLP模型；添加520萬翻譯語料(translation2019zh)。

1.維基百科(wiki2019zh)，100萬個結構良好的中文詞條

2.新聞語料(news2016zh)，250萬篇新聞，含關鍵詞、描述

3.百科問答(baike2018qa)，150萬個帶問題類型的問答

4.社區問答json版(webtext2019zh)，410萬個高質量社區問答，適合訓練超大模型

5.翻譯語料(translation2019zh)，520萬個中英文句子對

為什麼需要這個項目

中文的信息無處不在，但如果想要獲得大量的中文語料，卻是不太容易，有時甚至非常困難。在2019年初這個時點上，

普通的從業者、研究人員或學生，並沒有一個比較好的渠道獲得極大量的中文語料。筆者想要訓練一個中文的詞向量，

在百度和github上上搜索了好久，收穫卻很少：要麼語料的量級太小，要麼數據過於成舊，或需要的處理太複雜。

不知道你是否也遇到了這樣的問題？

我們這個項目，就是為瞭解決這一問題貢獻微薄之力。

Categories: 教學

Word2vec 模型構建的實踐過程

使用 Python 構建 Wiki 中文語料詞向量模型試驗

本實例不包含原理部分，旨在一步一步的瞭解自然語言處理的基本方法和步驟。

Categories: 教學

【LLaMA-Factory】開源語言模型微調專案

方便微調各種大型語言模型｜內建WebUI　方便使用｜內建多種訓練方式讓使用者選擇

最近在GitHub上看到了一個專案，可以方便的微調LLM，正好最近要做的東西會需要用到，所以就研究了一下，今天拿出來跟大家介紹。

Categories: 教學

Krita-ai-diffusion 實時 A.I. 生成式人工智慧繪圖

開源 GitHub – krita-ai-diffusion

免費的 Krita 圖像處理軟件使用 AI 生成圖像

互動式工作流程，其中人工智慧生成僅用作繪畫時的一種協同工具。

Inpaint：使用 Krita 的選擇工具標記區域並刪除或取代影像中的現有內容。簡單的文字提示可用於指導生成。
Outpaint：擴展畫布，選擇空白區域並自動填入與現有影像無縫融合的內容。
生成：透過用文字或現有圖像描述它們，從頭開始創建新圖像。支援SD1.5和SDXL。
優化：使用強度滑桿優化現有影像內容，而不是完全取代它。這也非常適合透過繪製（粗略）近似值並以高強度進行細化來為影像添加新內容！
即時繪畫：讓人工智慧即時解讀您的畫布以獲得即時回饋。看影片
控制：直接使用草圖或線條藝術指導圖像創建。使用現有影像或 3D 場景的深度或法線貼圖。從快照傳送角色姿勢。使用分割圖控制構圖。
決議：在任何決議下都能有效率地工作。該插件將自動使用適合 AI 模型的分辨率，並縮放它們以適合您的圖像區域。
升級：將影像升級並豐富至 4k、8k 以上，而不會耗盡記憶體。
作業佇列：根據硬體的不同，影像產生可能需要一些時間。該插件允許您在處理圖像時排隊和取消作業。
歷史：並非每張圖像都會成為傑作。隨時預覽結果並瀏覽前幾代和提示。
強大的預設設定：多功能的預設樣式預設允許簡單的 UI 覆蓋許多場景。
自訂：建立您自己的預設 – 選擇穩定擴散檢查點、新增 LoRA、調整取樣器等。

[英文] 詳細教學：

This One Simple Plugin Adds Realtime AI Assistance to Krita

Watch this video on YouTube

Categories: Image, 工具, 教學, 軟件

SDXL LoRA 培訓指南(英文)

LEARN TO MAKE LoRA

這是一個很棒的簡報，內容介紹了 SDXL LoRA 的指南和訓練要求。

這份簡報提供學習如何製作LoRA 模型的寶貴資訊。在這份簡報中，你將找到以下指導方針：

將最大解析度設定為至少 1024×1024，這是SDXL的標準解析度。
使用至少 12GB 內存的 GPU 進行 LoRA 模型的訓練。
我們強烈建議在 SDXL LoRA 訓練過程中使用 --train_unet_only 選項，以避免因SDXL中的雙文本編碼器而造成無法預料的訓練結果。
PyTorch 2 比 PyTorch 1 使用的 GPU 內存較少。

此外，簡報還提供了一個使用 Adafactor 優化器的示例配置，該優化器具有固定的學習率，並使用了常數加溫策略。以下是示例配置的代碼片段：

optimizer_type = "adafactor"
optimizer_args = [ "scale_parameter=False", "relative_step=False", "warmup_init=False" ]
lr_scheduler = "constant_with_warmup"
lr_warmup_steps = 100
learning_rate = 4e-7 # 這是SDXL的標準學習率

請點擊這裡查看完整的簡報內容。希望這份簡報能夠幫助你更好地了解如何製作LoRA模型。

Categories: 教學

Page 13 of 14

« Previous 1 … 11 12 13 14 Next »