OpenClaw 翻車實錄 | 10 分鐘設定安全防護指南 | 防止 Indirect Prompt Injection !
減少 Compacted History
由 4 個方向落手。根據 OpenClaw 文件,COMPACTED HISTORY 係因為 session 接近 model context window,系統就會自動將舊對話摘要化,保留最近訊息繼續跑。
- 同一個 session 傾好耐
- 經常 read 大檔案/貼長內容
- 有好多工具輸出
就好容易觸發 compaction。
最有效減少出現的方法:
1. 少啲喺同一個 session 累積太多嘢
最簡單直接。
做法:
- 一個大主題開一個新 session
- 任務做完就
/new - 唔好乜都塞入同一條長命對話
適合你:
- debug 一單野開一個 session
- 寫文、做 config、查資料,各自分開
2. 減少大段工具輸出同長文灌入 context
文件講得好清楚,工具結果、讀檔內容、附件都會計入 context。
所以盡量:
- 唔好一次 read 成個超大檔
- 用較細 offset / limit 分段睇
- command output 太長時,只攞重點
- 唔好成段 log / transcript 原封不動貼入對話
即係:
- 要睇 log:先 grep 關鍵字
- 要睇 code:先讀 relevant block
- 要分析文章:先摘要,再深挖局部
3. 用 /compact 主動壓縮,而唔係等佢爆
文件建議可以手動做 compaction,而且可以加指示。
例如:
/compact Focus on API design decisions/compact 保留而家 debug 到嘅根因、已試過嘅方法同未解決問題
咁好處係:
- 你控制摘要重點
- 唔會等到 context 太滿先被動壓
- 壓完之後 session 仲可以繼續,但重點較穩
如果你知自己開始傾長咗,主動 compact 其實幾好用。
4. 把重要規則移出對話,寫入持久檔
文件區分得好清:
- context = 今次 run 送畀 model 睇嘅內容
- memory / files = 可以落地保存,之後再載入
即係話,重要但長期有效嘅嘢,唔好淨係留喺聊天紀錄。
你可以放去:
MEMORY.md- 專案說明檔
- 任務 notes
- checklist / spec
咁之後就算 compact 咗,我都仲可以由檔案重新抓返重點,而唔使靠長對話尾巴硬撐。
5. 如你成日用好多工具輸出,可以考慮 pruning
OpenClaw 文件有提:
- compaction = 摘要舊對話
- pruning = 修剪舊 tool results
如果你個問題主要係工具輸出太大,pruning 會比單純 compaction 更對症。文件甚至直接講:如果 compact 得太頻密,試下開 session pruning。
6. 檢查 workspace 注入檔案有冇太大
文件講每次 run 都會注入:
AGENTS.mdSOUL.mdTOOLS.mdIDENTITY.mdUSER.mdHEARTBEAT.md
如果其中某啲檔好大,會長期食 context。尤其 TOOLS.md、MEMORY.md 類型如果日積月累變肥,context 壓力會大。
你可以做:
- 保持呢啲檔精簡
- 長資料搬去專門 notes
- 只保留真正會每次都用到嘅內容喺 injected files
7. 如果你想從根本改善,要改 config
文件提到 compaction 相關設定喺:agents.defaults.compaction
而且如果 compaction 太頻繁,文件明講可能係:
- model context window 細
- tool output 太大
- 應考慮 session pruning
如果你想,我可以幫你再查你本機 config,睇下有冇:
- pruning 可開
- compaction keepRecentTokens 可調
- notifyUser 可開
- 甚至有冇其他 session/context 設定可以優化
我嘅實際建議排序係:
- 分 session
- 減少長輸出進 context
- 主動
/compact,加明確 focus - 重要資訊寫入檔案
- 再研究 pruning / config
Code2World 基於動作預測的 GUI 代理
Code2World 本身不是一個「GUI 設計工具」,但它可以用在「優化 GUI 設計」的流程裡,特別是幫你 驗證設計是否好操作、是否容易出錯、是否符合使用者行為預期。Code2World 以靈活的方式顯著提升了下游導航的成功率,在 AndroidWorld 導航方面,其性能比 Gemini-2.5-Flash 提升了 9.5%。
它透過產生可渲染的程式碼來模擬下一個視覺狀態。實驗表明,Code2World-8B 在下一界面 UI 預測方面表現卓越,足以媲美 GPT-5 和 Gemini-3-Pro-Image 等競爭對手。(Huggingface 模型及數據集出現 404)(圖為預測介面的結果)

PaperBanana 賦每個創意工作流程
PaperBanana 是一個開源的自動化學術圖表生成框架,由 Google Research 開發。這個工具專為 AI 研究人員設計,能夠自動生成符合出版標準的方法論圖表、代理架構和統計圖 。
PaperBanana 還擁有強大的潤色功能。您可以輸入手繪草圖或示意圖,系統會將它們精修成專業的向量圖。Google 聲稱兩星期後會提供開源實作版本,亦有第三方的版本可在 GitHub 下載使用。

OpenClaw (原名Clawdbot)
本週,網路上掀起了一股搶購 Mac mini 的熱潮,人們紛紛購買 Mac mini 來運行 Moltbot(原名Clawdbot)。 Moltbot 是一款開源的、可自行託管的AI代理,旨在充當個人助理。

Clawd 誕生於2025年11月-這是「Claude」加上「爪子」的巧妙雙關。一切都完美無缺,直到Anthropic的法務團隊禮貌地要求我們重新考慮。好吧,這很合理。
Moltbot 這個名字是接下來誕生的,它是在凌晨5點與社區成員在 Discord 上進行一場混亂的頭腦風暴後選定的。蛻皮象徵成長-龍蝦脫殼蛻皮,最終長成更大的生物。這個名字寓意深刻,但 念起來卻不太順口。
OpenClaw 就是我們的最終歸宿。這次,我們做了充分的準備:商標檢索結果清晰無誤,網域名稱已購買,遷移程式碼也已編寫完成。
短短48小時內,OpenClaw 在 GitHub 上就獲得了 12.3 萬顆星。彼得·斯坦伯格(Peter Steinberger)的周末計畫一度成為史上成長最快的開源人工智慧工具——直到安全研究人員檢查了其程式碼並發出警報。 OpenClaw 是一款開源的個人人工智慧助手,可在本地運行並連接到 WhatsApp、Slack、Discord和 iMessage 等應用程式。在2026年1月29日至31日期間,OpenClaw從默默無聞一躍成為擁有超過10萬顆星的開源人工智慧助理。開發者們欣喜若狂,終於可以擁有自己的人工智慧助手,而無需再從雲端服務供應商租用。然而,思科和 IBM 的安全專家卻稱之為 “一場噩夢”,並警告稱其存在API金鑰洩漏、提示注入攻擊和企業資料外洩的風險。
Moltbot = Clawdbot
Clawdbot 已於 2026 年 1 月 27 日更名為 Moltbot,因為 Anthropic 因商標相似(Claude)而要求變更。原 Clawdbot 是個人 AI 助理工具,支援多平台運行,現轉為 Moltbot,GitHub 移至 moltbot/moltbot,舊 clawdbot 組織重定向至新名稱。 軟體功能、程式碼與使用方式完全相同,僅品牌與帳號變更(吉祥物從 Clawd 改為 Molty)。

Clawdbot 安裝指南

Paper2Rebuttal 反駁智能體框架
REBUTTALBENCH 是第一個將反駁生成重新定義為以證據為中心的規劃任務的多智能體框架。此方法解決了目前直接處理文字方法的局限性,這些方法常常導致臆想、忽略批評意見以及缺乏可驗證的依據。我們的系統將複雜的回饋分解為原子級關注點,透過將壓縮摘要與高保真文本合成來動態建構混合上下文,並整合一個自主的外部搜尋模組來解決需要外部文獻的問題。至關重要的是,REBUTTALAGENT 在撰寫反駁方案之前會產生一個可檢查的回應計劃,確保每個論點都明確地錨定在內部或外部證據之上。我們在提出的 REBUTTALBENCH 上進行的驗證過程表明,REBUTTALAGENT 在覆蓋率、忠實度和策略一致性方面均優於強大的基線系統,為同行評審過程提供了一個透明且可控的輔助工具。下圖總結了我們的工作,並比較了我們的方法與以往的方法。

REBUTTALBENCH 是一個多智能體框架,旨在將反駁過程轉化為結構化且可檢查的工作流程。系統在撰寫最終文本之前會產生與證據相關的中間產物,以確保輸出結果的可靠性和可控性。如下圖所示,該架構將複雜的推理過程分解為多個專業智能體,並配備輕量級檢查器。這種設計突顯了關鍵決策點,使作者能夠保留對策略立場和最終措辭的責任。此流程首先將稿件提煉成結構化的摘要,並提取審查者關注的原子性問題,以確保長期推理的穩定性。在這些關注點的指導下,系統透過從稿件中檢索高保真度的摘錄,並利用網路搜尋添加可驗證的外部文獻,建構證據包。工作流程最後產生一個明確的回應計劃,概述論點和證據鏈接,作者可以透過人機協作機制對其進行完善,之後系統將產生正式的反駁信。

REBUTTALBENCH 使用 LLM 作為評判員的評分標準,從相關性(R 分數)、論證品質(A 分數)和溝通品質(C 分數)三個方面,以 0-5 分制對回覆進行評估。下方的詞雲和高頻詞直方圖突出了評審員反覆關注的幾個方面,例如清晰度、新穎性和可重複性,這些也正是評分標準所明確針對的。
agent-browser 瀏覽器自動化 CLI 工具
agent-browser 專注於為 AI Agent 提供快速、可靠的瀏覽功能。整個專案使用 Rust 撰寫核心腳本,提供高效的執行速度,同時保留 Node.js 作為後備方案,讓開發者可以在不同環境下自由切換。
