Switti 高速 text2img 模型 Scale-wise transformers 模型Switti 基於 Transformer 架構,用於文本到圖像生成的 scale-wise 模型。性能上優於現有的 T2I AR 模型,並可與最先進的 T2I 擴散模型相媲美,同時速度提高了 7 倍。 在高分辨率尺度上禁用分類器自由引導可以進一步加速採樣,並改善細節生成。