Google PAT：用 AI 做論文審查前哨

這是一篇介紹科研審查系統的論文，核心內容是 Google 提出的 Paper Assistant Tool（PAT） agentic AI framework，而不是可直接下載執行的 Hugging Face 模型。它的主要用途是讀取完整論文手稿，協助檢查理論推導、驗證實驗設計、指出潛在缺陷，並在投稿前提供較深入的審查意見。

頁面沒有提供 base model、參數規模、context length、GGUF 格式、mmproj、量化版本、llama.cpp、Ollama 或 LM Studio 等模型部署資訊，因此不能將它當成一般開源權重模型分析。可確認的是，PAT 採用 agentic workflow 與 inference scaling，不是單次 model call；摘要提到它藉由更長鏈路的推理流程，提升對數學錯誤的召回率。

論文給出的關鍵數字是：在 SPOT benchmark 上，PAT 對數學錯誤的 recall 較 zero-shot 提高 34%。這個結果反映它較適合處理需要多步驗證的學術內容，而非一般聊天問答。作者亦提出 AI 與人類共同參與科研評估的四個遞進層級，重點不是完全取代審稿人，而是減輕前期檢查的認知負擔，同時保留人類最終判斷。

屬於論文與系統框架介紹，不是已釋出權重的模型頁
主要能力包括理論檢查、實驗驗證、缺陷識別、修改建議
採用 agentic AI framework 與 inference scaling，強於單輪推理
在 SPOT benchmark 上，數學錯誤 recall 較 zero-shot 提升 34%

限制亦很清楚：目前看到的是 paper page 與摘要資訊，未見公開模型檔案、推論框架支援、量化檔命名、v2 更新記錄或 chat template 細節。以技術定位來看，PAT 更接近面向科研審查流程的 AI 系統項目，與一般 instruction model 或純 fine-tune 模型的差異，在於它強調多步分析、驗證流程與人類監督整合。

項目主頁 · Paper