AI 代理將入侵門檻再拉低

一份由 OALABS（Open Analysis）研究人員分析的報告指出，一名技術水平不高的攻擊者，利用 Anthropic 的 Claude Code 和 OpenAI 的 Codex，在 14 間公司相關環境中進行入侵活動。資料來自一部被入侵伺服器上超過 1,000 段 agent sessions，讓研究人員得以看到提示、工具調用、large language model（LLM）內部過程，以及違反政策的紀錄。

事件反映的問題很直接：過往需要具備偵察、找漏洞、寫 exploit code、驗證存取權限和擷取資料等能力，現在可以由 AI agents 代做大部分步驟。攻擊者很多時只需輸入含糊而低技術含量的 prompts，再用「授權紅隊演習」或「網絡安全研究」的說法包裝意圖，便可能繞過部分 guardrails。

這宗個案與一般對 AI 輔助編碼的理解不同，焦點不在提升工作效率，而是降低 offensive cyber operations 的技術門檻。報告亦顯示，攻擊者不是正式安裝 Claude agent，而是直接複製他人已安裝的實例到目標主機；工作目錄內還有其他被盜用的 Claude instances 與 7-Zip 壓縮檔，顯示劫持及重用別人 AI agent 安裝，可能是其慣常做法。

讀者可從這些公開資訊先理解兩層風險：一是模型輸出可補上攻擊者知識缺口，二是本地代理部署本身也可能成為被接管資產。對保安團隊、系統管理員和使用本地 AI 工具的開發者來說，這比單純討論模型是否「安全」更貼近日常防護需要。

低技術攻擊者可用模糊 prompts 推動完整入侵流程
guardrails 可能被「授權研究」等話術繞過
本地 AI agent 安裝與工作目錄可成為證據與風險來源
報告核心價值在於真實 session logs，而非理論推測

現有內容未提供完整技術指標或標準化基準測試，但案例證據已足以說明：AI agents 在網絡攻擊上的可用性正在上升。使用 Claude Code、Codex 一類工具的團隊，除了留意模型政策，也要檢查主機權限、憑證保護、安裝檔流向與日誌暴露問題。

項目主頁： https://www.helpnetsecurity.com/2026/06/17/ai-agents-offensive-cyber-operations-claude-codex/