无论是ChatGPT还是stable Diffusion,或许都将成为改变大家未来的起点。如今Stable Diffusion能实现的功能越来越多,国内社区的发展也是越来越成熟,国内模型作者带来的底模和Lora的数量也是越发的丰富。我们也可以更全面的分析不同显卡在不同工况下的AI绘图性能对比。这次我们给大家带来了从RTX 2060 super到RTX 4090,共17款显卡的SD AI绘图性能测试。
测试环境
由于目前SDXL还不够成熟,模型数量和插件支持也比较少,所以依旧使用了SD1.5进行测试。使用赛博大神秋叶最新版整合包模拟了3种应用场景。
运行环境
- SD WEBUI:V1.5.1
- xformers:0.0.20
- python:3.10.11
- gradio:3.32.0
- torch:2.0.1+cu118
- ControlNet v1.1.237
测试平台
- CPU:Intel酷睿i9 13900K
- 显卡:RTX20/RTX30/RTX40共17款
- 主板:ROG MAXIMUS Z790 HERO
- 内存:十铨DDR5 7200 16GB*2
- 硬盘:WD_BLACK SN850X2TB
- 电源:R0G 雷神2 1000W
测试模型
- Tag抽卡
- 底模Lora高分辨率修复
- ControlNet Tile高清细节
Tag抽卡测试
第一个测试来自英伟达测试指南提供的一个模型和提示词,生成768*768大小的图片。这个测试压力相对比较小,不但没有Lora,甚至连反向提示词都没有。
从测试结果来看,4090毫无疑问的第一每分钟可以生成19.35张图,也就是差不多3秒1张,出图速度是上代旗舰3090Ti的差不多1.76倍,3090Ti甚至没有跑过4080,4070Ti则是勉强跑赢了3090,4070介于3080Ti和3080之间。这17张显卡中,没想到成绩最差的是3060,基本上只能和2060 super差不多。当然4060也没好到哪里去。
显卡的FP46半精度性能对SD出图速度影响很大。所以我们可以看到这个排名和这些显卡的理论半精度性能排名大概是一样的。而出图性能和游戏性能表现并不是完全挂钩的,就像3060,虽然它的张量核心比2060 super先进一代,但数量实在是太少了,所以在这里并不占优。
虽然英伟达给的这套测试标准比较简单粗暴,但是还是能比较直接的反映出图性能表现的,毕竟现在很多国内大神融的底模,通过提示词直接抽卡也能获得比较不错的图片了。
看到这里就有小伙伴要说了,我花钱买显卡来跑图不是为了画房子的,很多小伙伴更热衷于画AI老婆。那第二个测试我们就来画小姐姐试试吧。
底模Lora高分辨率修复测试
这个测试我们将大模型换成了国内大佬炼的真人模型,同时给小姐姐使用了JK制服Lora、人脸Lora、黑丝Lora以及胶片风格的Lora,为了给显卡更大的压力,这次还加入了高清修复,将图片分辨率从初始的512*768放大两倍到1024乘1536。
这一次的计算压力明显变大,即使强如4090,每分钟也只能画出3.75张图,也就是16秒才能画出一张图了。比较有意思的是在这样稍高一点的负载下,3060终于是跑赢了2060 super,4060也跑赢了2070 super。或许是高负载下大显存的优势会更明显,又或许是新版本的CUDA深度神经网络库的优化更好。抛开这些略有变化的排名,其他显卡的性能依旧和前一个测试是一致的。
除了直接生图以外,ControlNet的可以说是SD中必不可少的插件。强大之处无需多言,其中Tile模型也是广受大家喜爱。第三个测试我们就来测一下它吧。
ControlNet Tile高清细节测试
Tile模型的作用之一就是高清修复模糊图片。我们这里用之前生成的一张512512的图片放入type模型修复,并将分辨率提升至12801280。
可以看到修复后的细节确实好了不少。
4060每分钟出足5.45张,也就是说每11秒就可以出一张图,依旧是压倒性的优势。不过其他显卡又有了一些细微的变化。大致来看的话,RTX 40系列的表现比前一个测试要好一些。4060Ti跑赢了3070Ti,4070Ti也略微超过了3090Ti。这或许真的是新版CUDA深度神经网络库的优化更好。
另外这个分辨率的测试,根据SD的反馈,显存占用大概是9.1G左右,也就是说超出了8G显卡的显存容量,所以有着更大显存的卡表现会更好一些。比如说3060 12G已经快赶上2070 super了,而从4070开始,性能有明显的大幅提升。
显卡购买建议
因为这次测试也是尽量控制了不超过或者不过多的超出8G显存这个范围。所以在这种使用条件下,GPU本身的性能是要比显存容量更为重要的。但是如果我们将出图数量除以价格,得到每块钱出图效率的话,可以看到其实低端的2060 super和3060有着很高的性价比的。而在40系中,4060Ti和4070有着较高的性价比。
当然这是在完全不考虑效率的情况下,如果你是作为生产力工具来使用的话,确实还是建议购买更高端的产品,比如如果说在24小时连续不断出图数量的话,4090要比2060 super要多出4000张左右,绝对数量的差距还是有些恐怖的。如果你有直出高分辨率大图、炼丹等需求的话,大显存、高性能卡才是更好的选择。因为在显存耗尽之后,即使通过设置或插件达到不爆显存的操作,也是要调用内存处理的,从而大幅增加出图时间。在这种情况下,出图效率的差距就不是那么线性的。
以上测试呢可能会根据大家的测试平台不同,使用环境不同、模型不同等情况而出现一些差距。所以说成绩仅供大家参考。顺便说说魔改2080Ti 22G和3070 16G,如果说SD出图性能的话,这两块卡是差不多的。如果看前面测试3070的排名,大概就是处于那个位置。他们目前在二手市场的价格又只比新的4060高一点点,看起来好像还有点性价比。但是呢如果你只是玩一玩,大概率不是随时都能用到这么大显存的。目前很多模型其实都没有高分辨率优化,所以直出高分辨率图片大概率都是多头多脚,并不一定能让你满意。而且20系和30系的矿卡那是满天飞啊,魔改卡的来源,懂的都懂。所以买的话恐怕你得做好足够的心理准备。因为它随时有坏掉的风险,你也可能随时联系不上店家,失去保修,甚至装驱动都是一个问题。相信看到这里的各位小伙伴对SD中这些主流显卡的表现有个大概的认知了吧。希望能对你的选购提供一点点的帮助。
发布者:硬件先生,转转请注明出处:https://hardwaresman.com/ai-huitu-xianka/