軟件 – Page 10 – InferNews

STAR 提升真實世界影片的解析度

2025 年 1 月 19 日

一種名為 STAR(Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution) 的新方法，用於提升真實世界影片的高解析度。STAR 的核心概念是將文字轉影片 (T2V) 模型整合到影片超解析度任務中，藉此改善時間一致性並提升影片品質。不同於以往僅使用靜態影像訓練的模型，STAR 利用 T2V 模型捕捉影片的動態特性。為了解決真實世界影片中複雜退化造成的瑕疵和 T2V 模型的高生成能力可能導致的保真度下降問題，STAR 提出了局部資訊增強模組 (LIEM) 和動態頻率 (DF) 損失函數，有效降低瑕疵並提升細節還原度和時間一致性，最終達成更逼真且高品質的影片超解析度結果。 STAR 也提供了與其他先進方法的比較，驗證了 STAR 的有效性。

在 STAR 的研究中，CogVideoX 是被引用的基準模型之一。研究人員來自：南京大學、字節跳動、西南大學。總括而言，時空增強是 STAR 系統的核心概念，它通過整合 T2V 模型，並引入 LIEM 和 DF Loss 來克服真實世界影片超解析度中的挑戰，實現更高質量的影片重建。這使得 STAR 能夠有效地處理複雜的退化，並產生具有良好時空一致性和高保真度的超解析度影片。

Categories: 工具, 影像處理, 模型

Crawl4AI 0.4.24x 抓取結構化網上資訊

2025 年 1 月 17 日

Crawl4AI，一個開源且配合大型語言模型的網頁爬蟲和抓取工具。其核心功能是高速、精準地抓取網頁數據並轉換成適合大型語言模型使用的格式，例如 Markdown。Crawl4AI 強調速度快、靈活性高，且易於部署，並提供諸多功能，包括支援多種瀏覽器、處理JavaScript、提取結構化數據、以及與各種大型語言模型整合等。文件詳細說明了安裝方法、使用方法、進階應用範例以及未來的發展規劃，並強調其以開源和社群驅動的方式開發維護。其最終目標是透過將數位足跡轉換成結構化數據，建立一個公平的數據共享經濟體系，並促進AI的發展。

Turn ANY Website into AI Knowledge in SECONDS with Crawl4AI!

Watch this video on YouTube

Categories: 軟件, 工具

Ollama 結構化的輸出方案

2025 年 1 月 14 日

「structured-outputs」，主要展示如何利用 OpenAI 和 Ollama 這兩個大型語言模型平台，以結構化的輸出方式驗證數獨遊戲的有效性。程式碼包含一個測試架構，示範如何使用不同的模型（例如 OpenAI 的 gpt-4o-mini 和 Ollama 的 phi4）以及相應的執行指令。專案目前只有 Python 程式碼，並有簡潔的 README 檔說明使用方法，但缺乏更詳細的專案描述和資源連結，星星數和關注度也都很低。 核心目的在於展示結構化輸出的應用，並提供 OpenAI 和 Ollama 的實作範例。

Ollama Structured Outputs with Phi4 is KILLER - Get Started NOW!!

Watch this video on YouTube

GitHub – chrishayuk/structured-outputs

Contribute to chrishayuk/structured-outputs development by creating an account on GitHub.

Categories: 開源, 工具, Ollama, 教學

ScrapeGraphAI 開啓智能數據抓取新時代！

2024 年 12 月 31 日

用AI重塑數據提取方式！ScrapeGraphAI + LangChain + LangGraph 打造最強文章採集和寫作AI智能體！讓內容創作更簡單!

ScrapeGraphAI颠覆传统网络爬虫技术！用AI重塑数据采集方式！支持ollama本地部署！LangChain+LangGraph打造最强全自动文章采集和内容创作AI智能体！让内容创作更简单！

Watch this video on YouTube

Categories: 工具, LangChain, LangGraph, 教學

Word2Vec詞嵌入技術

2024 年 12 月 13 日

將文字轉換成電腦可理解的數值向量的方法。Word2Vec 有兩種主要模型：連續詞袋模型 (CBOW) 和跳字模型 (Skip-gram)，透過反向算法，根據上下文預測目標詞或反之，從而學習詞語間的關係。訓練後的詞向量具有語義相似性的特性，相似的詞彙在向量空間中距離較近，並能透過向量運算進行類比推理，例如「國王-男人+女人=王后」。Word2Vec 應用廣泛，例如搜尋引擎、推薦系統和機器翻譯，但其局限性在於每個詞只有一個固定向量，無法處理多詞片語的語義。

Word Embeddings: Word2Vec

Watch this video on YouTube

Categories: 軟件, Embedding, 教學

Prefixing – 簡易提升 RAG 準確度

2024 年 12 月 9 日

在向量數據庫應用中，「prefixes」指的是在文本塊輸入嵌入模型之前，在文本塊前插入一段描述其目的的文本。「prefixes」是一個簡單但有效的技術，可以顯著提高向量數據庫應用的準確性達 200%。

在 Olama 官方庫中的五個嵌入模型中，只有三個支持「prefixes」，Nomic、Snowflake Arctic 和 Mixed Bread 等。

儘管傳統的 LLM 可能更大，但它們不適合生成嵌入。嵌入模型專為生成嵌入而設計，它們的速度要快得多，並且可以產生更好的結果。Prefixing」嘅簡單技巧嵌入技巧。

Don’t Embed Wrong!

Watch this video on YouTube

Categories: 工具, RAG, 模型, 教學, 模型訓練

手把手教你如何部署大型語言模型

2024 年 12 月 8 日

如何使用 vLLM 框架部署大型語言模型。教學包含使用 8B 同 70B 兩個版本作示範，並說明如何在 NVIDIA GPU 上安裝 VLLM，以及如何處理記憶體限制。

台大資訊深度學習之應用 | ADL TA Recitation: LLM Deployment 手把手教你如何部署大型語言模型

Watch this video on YouTube

Categories: 工具, 模型, 教學, 模型訓練

Screenpipe – 記錄電腦活動的 API

2024 年 12 月 7 日

擷取用戶桌面數據的 API

包括屏幕、語音、鍵盤、滑鼠同埋鏡頭錄影。內建一個基於 JavaScript 的插件系統，方便開發者建立更多功能。這項目近期獲不少關注同獎項，例如登上 GitHub 趨勢榜，獲 Founders, Inc. 支持等

Categories: 軟件, 編程

OpenVINO 2024.5 一體化智能開發

2024 年 12 月 7 日

視覺、自動語音辨識、NLP 的深度學習

OpenVINO 是一個開源工具包，用於最佳化及部署從雲端到本機的深度學習模型。它利用來自 PyTorch、TensorFlow、ONNX 等流行框架的模型，加速各種深度學習推理，例如生成式 AI、視訊、音訊和語言。轉換和最佳化模型，並在本地和裝置上、瀏覽器或雲端中的各種英特爾® 硬體和環境中進行部署。

Categories: 軟件, 工具

opik – 最佳化部署深度學習模型

2024 年 12 月 6 日

評估、測試和監控 LLM 的開源平台

追蹤開發期間所有的 LLM 調用和追蹤。透過使用 Python SDK 或 UI 記錄回饋分數來註解您的 LLM 呼叫。

Opik 旨在支援大量跟踪，使您可以輕鬆監控生產應用程式。在 Opik 儀表板中查看一段時間內的回饋分數、追蹤計數和令牌

Categories: TensorFlow, 軟件, 工具

Page 10 of 17

« Previous 1 … 8 9 10 11 12 … 17 Next »