DCI-Agent-Lite：把知識庫交給代理直接翻找，不用 embeddings

DCI-Agent-Lite是一個面向代理式搜尋的輕量實作，核心概念是讓代理直接操作原始文件，而不是先經過語意檢索器或向量資料庫。對有本機資料、內部文件或持續變動語料的人來說，這個方向很實際，因為不必先建索引，也不用把文件送到託管式檢索服務。

實際使用上，它更像是一個能讀檔、查字串、逐步驗證線索的研究助手。代理會用終端工具在本地語料中搜尋、檢視上下文、交叉比對，再整理答案；若要跑預設的 OpenAI 路線，專案資訊有提到需要 OpenAI API KEY，並點名可搭配 GPT-5.4-nano。

這個專案最有意思的創新，不只是「不用 embeddings」，而是把檢索介面改成更高解析度的檔案互動。論文脈絡指出，代理能把多個簡單搜尋動作串接起來，處理精確詞彙限制、稀疏線索組合與局部上下文驗證，減少傳統 top-k 檢索過早過濾證據的問題。

從公開描述來看，它的定位很清楚：建立在精簡的代理框架與 bash 工具之上，系統結構小、可改造性高，但仍瞄準長流程研究任務。專案也宣稱在 13 個基準上優於多種檢索式基線，涵蓋知識密集問答、代理搜尋與 IR ranking，不過實際效果仍會受語料品質、工具配置與模型能力影響。

如果你的場景是企業內部文件探索、研究資料整理、個人知識庫深查，DCI-Agent-Lite相當值得關注。相較傳統 RAG，它未必在所有大型靜態語料都占優，但在資料常更新、需要細部核對證據的任務上，這種直接互動式檢索顯得更貼近真正的研究工作流程。

Source: https://github.com/DCI-Agent/DCI-Agent-Lite