LearnWeak：教小型桌面代理補弱變強

LearnWeak 針對一個常見的 Computer-use agents(CUA) 痛點：小型桌面代理雖然便宜又快，但去到指定軟件時，成功率往往不穩。它不是盲目加資料，而是先找出學生模型的弱項，再集中補訓。

LearnWeak 建議先用 meituan/EvoCUA-8B-20260105 做底座，再按軟件掛上對應 LoRA，例如 learnweak-gimp。完整流程會配合 OSWorld，呼叫時記得選對模組名。

• 先辨認學生模型弱點，再自動生成針對性練習任務
• 用教師與學生的操作軌跡差異建立監督，毋須人工標註
• 訓練時分開處理規劃錯誤與執行錯誤，更新更精準
• 已有 GIMP、LibreOffice Calc、Impress、Writer、Thunderbird、VLC、VS Code、OS 的 LoRA 模組

它把學生(代理)弱點直接帶入資料生成與訓練，不再用同一套監督硬套所有錯誤。論文指出，在 OSWorld 八個桌面範疇，它平均比 EvoCUA-8B 高 11.6 個百分點，亦比 OpenCUA-7B 高 11.1 個百分點。

這項目適合要把小模型鎖定在指定桌面工作流的團隊，例如內部工具、自動化測試或較重視私隱的環境。它未必是即裝即用的一般工具，但對研究者、代理開發者，以及想低成本做範疇微調的人，很有參考價值。

GitHub： https://github.com/sujiikim/LearnWeak

Paper： https://arxiv.org/pdf/2605.28775