PixVerve-95K：衝擊超高像素生圖評測

PixVerve-95K 是一個圍繞原生文字生成圖片而設的研究項目，重點放在把輸出推向 100MP 等級的超高解析度。它不只是提供資料，還連同模型方法與評測基準一併整理，方向相當清晰：回答「高像素生圖到底做得夠唔夠好」這個常見但難量化的問題。

對一般讀者來說，最易理解的切入點是把它視為一個「比較平台」。研究人員或開發者可先查看公開的資料集與基準設定，再用自己的文字生成圖片模型產出結果，之後按它提出的評估方式比較畫面細節、主體是否貼合描述，以及不同縮放層級下的穩定度。

這個項目的亮點，在於它不是只看一張圖表面是否好看，而是更重視超高解析度下的完整性與一致性。README 提到的 Multi-scale Fidelity Index（MSFI）與 Instance-centric Compliance Score（ICS），反映它嘗試由多尺度保真度與主體對應程度兩方面衡量結果，這比單純看主觀觀感更有系統。

重點可先看這幾項：
– 目標聚焦於原生文字生成圖片走向 100MP
– 內容涵蓋資料集、模型方法、基準評測三部分
– 評估指標包括 MSFI 與 ICS
– 適合拿來比較不同模型在高解析度場景的表現
– 已提及可配合 Qwen3.5-35B-A3B 與 vLLM 相關流程使用

適合關注這個項目的人，包括做文字生成圖片研究的團隊、想測試高解析度輸出能力的模型開發者，以及需要有系統 benchmark 的學術場景。若你平時留意的模型包括 Qwen3.5-35B-A3B，或其他文字到圖片生成系統，PixVerve-95K 的價值更像是一把尺，幫你判斷模型在大尺寸畫面下是否仍能守住細節與語意一致性。

GitHub： https://github.com/HaojunChen663/PixVerve-95K

Paper： https://arxiv.org/pdf/2605.20147