CNS 點樣改良擴散取樣效率

Colored Noise Sampling（CNS），核心想法是按影像頻率分配雜訊，而不是每一步都加入同樣的 white noise。對非研究背景讀者來說，可以把它理解成：模型早段已經大致砌好輪廓，就不必再把力氣花在這些部分，反而集中補足仍未成形的細節。

它要解決的問題很明確：傳統 Stochastic Differential Equations（SDE）取樣器會平均地把隨機能量灑向所有頻段，但 diffusion models 本身有 spectral bias，低頻結構較早完成，高頻細節較後才逐步補上。CNS 會利用預先計算好的 gamma matrix，判斷每個頻段在不同時間步的完成程度，再把雜訊導向仍然欠缺結構的部分。

這個設計吸引之處，在於它屬於 training-free，而且是 plug-and-play sampler substitution。換句話說，不用重新訓練原有模型，不用增加步數，主要改動只在 noise injection；對已經有生成流程的人，這比重建整個項目方便得多。

保留原模型與原取樣步數，只改取樣時的雜訊策略
依靠 gamma matrix 做頻率感知的動態分配
支援多種架構，文件提到 SiT、JiT、FLUX
在 ImageNet-256 的 FID 結果有明顯改善，尤其 unguided 設定較突出

項目提供了較具體數字：SiT-XL/2 的 unguided FID 由 8.26 降到 6.27，JiT-B/16 由 32.39 降到 26.69，JiT-H/16 由 11.88 降到 8.31；使用 Classifier-Free Guidance 時也有一致改善。這些結果顯示，CNS 並非單靠理論包裝，而是在多個模型上都有可量化的收益。

這項目較適合已經在研究或測試 diffusion models 生成品質的人，例如想比較 ODE 與 SDE 取樣差異、希望在不改訓練成本下提升輸出表現的開發者。若你只想快速理解概念，重點就是：CNS 不是換模型，而是把每一步加入的隨機能量分配得更精準。

GitHub： https://github.com/hadardavidson/colored-noise-sampling