大提速3.8倍!AMD GPU终于优化Stable Diffusion
时间 • 2025-07-29 11:31:52
硬件
模型
优化
提升
效率
大提速3.8倍!AMD GPU终于优化Stable Diffusion
快科技4月18日消息,NVIDIAAI之强大,不仅仅在于硬件性能好,更离不开生态优化适配,可以发挥最佳效率,AMD相比之下就差了很多,但也在努力追赶。
现在,StabilityAI发布了ONNX框架优化的StableDiffusion模型,在兼容的AMDRadeon显卡、锐龙集显上最多可以提速达3.8倍。
AMD表示,过去一年来,一直在与OSV、OEM、ISV厂商合作,优化AMD硬件上的AI应用,包括硬件设计、驱动程序、编译器、机器学习模型等等。
根据官方公布的数据,经过优化之后,SDXL1.0、SDXLTurbo在AMD硬件上的推理性能,对比基础的PyTroch模型最高提升3.8倍,SD3.5则可提升最多2.6倍。
实际图片、视频生成应用中,SDXL1.0、SDXLTurbo、SD3.5Large、SD3.5LargeTurbo在RX9070XT显卡上的效率分别提升了3.1倍、1.5倍、3.3倍、2.1倍。
SDXL1.0、SD3.5Large、SD3.5LargeTurbo在锐龙AIMAX+395上的效率,则分别提升了1.4倍、3.3倍、3.0倍。
AMD硬件优化版的StableDiffusion模型有一个特殊的“_amdgpu”后缀标记(比如stable-diffusion-3.5-large_amdgpu),现在已经可以在StabilityAI或者HuggingFace上下载了。
你也可以使用AMD、TensorStackAI联合打造的最新版Amuse3.0。
注意,AMDGPU驱动版本不要低于24.30.31.05预览版,或者等待即将发布的25.4.1正式版。