使用Intel顯卡調(diào)教Stable Diffusion生成圖片

說來之前對AI生成圖片一直沒什么興趣,一方面GTX 1060的性能實在堪憂,另一方面也懶得去搞這些。雖然到現(xiàn)在英特爾對SD的優(yōu)化依舊堪憂,但Direct ML版本的出現(xiàn)讓I卡起碼可以跑得動制圖了。特定優(yōu)化版本要開WSL 2我也懶得折騰那些,只能用Windows版傻瓜式用一用。
基本下載
B站大佬“獨立研究員-星空”制作集成了I卡和A卡可用的Stable Diffusion包,具體在這個視頻的介紹里。需要注意的是,整個壓縮包的大小在8.85GB左右。包含了一個基礎的訓練包。還有這邊有個整包的FAQ,如果有問題的話可以來這里找一下答案。
想AI制圖就不得不提訓練包了,其中civitai.com基本上就是個AI制圖的集散地。首頁的Models選項就是由別人訓練好的模型,以.safetensors
結(jié)尾并且通常在數(shù)GB大小。想玩好AI制圖,訓練模型必不可少。不同的模型有不同的對應關鍵字訓練量,只有訓練量大,才有豐富的關鍵字識別來增加隨機變量減少相似度。并且不同模型有不同的訓練側(cè)重點,找到自己喜歡的模型配合好“咒語”才能生成出好看的圖片。
基本使用
有些訓練模型如果是.safetensors
結(jié)尾的,可以直接放進models\Stable-diffusion
文件夾下。然后在網(wǎng)頁里選擇你要用的模型即可。如果切換模型后總是爆顯存,可以在頁面最下邊點擊重啟WebUI,反正這玩意的BUG不少。VAE為整個Stable Diffusion的色調(diào)插件,除非模型有要求,一般默認即可。至于咒語相關各種玄學和隨機性與相互作用,只能自己摸索經(jīng)驗。最簡便的就是去Civitai.com上查找類似的咒語。

著重說一下生成頁面的設置。

采樣方法(采樣器)我個人比較喜歡?DPM++ 2M SDE Karras?,速度比較快,效果也還不錯。
采樣迭代步數(shù)在36至46之間。這個數(shù)值也是靠摸索,太少太多都不好。
面部修復似乎沒什么用,至少我現(xiàn)在沒感覺到什么用處。平鋪/分塊也是一樣。
高清修復強烈推薦使用。放大算法如果是偏真人選擇R-ESRGAN 4x+,動漫二次元可以選擇Anime6B或者AnimeVideo。開啟高清修復的主要好處是可以大幅降低面部畫崩的概率。至于高清修復采樣次數(shù)我個人使用10次,重繪幅度默認就好。放大倍率只能是2,高了必爆顯存。
高和寬別多想,512x512默認就好。
生成批次可以調(diào),但每批數(shù)量別多想,調(diào)成2也會爆顯存。如果有批量生成圖片的需求只要調(diào)生成批次就好,爆顯存的概率低一些。
提示詞相關性與迭代步數(shù)關聯(lián),具體效果可以網(wǎng)上找相關文章。
一切準備妥當,就可以點生成按鈕,靜待過程。以上設置生成一張圖大概要2分鐘左右,高清修復就要占一半以上。如果只是看個大概風格不考慮臉部畫崩的問題,可以關閉高清修復功能來減少生成所需要的時間。至于下邊的Tiled Diffusion、分塊VAE等功能可以不用設置,除非你懂這些是做什么的。
附加功能

此項基本上用來放大生成圖。Upscaler 1開啟的效果已經(jīng)很不錯了,具體超分算法推薦和高清修復一樣的選項。如果1024x1024分辨率的圖,默認4倍超分到4000x4000左右個人覺得夠用。至于GFPGAN之類的選項我個人沒有試過,也不太清楚調(diào)整之后會有什么效果。
圖片位置
生成的圖片都保存在outputs
文件夾內(nèi),目錄下還有若干子文件夾:
extras-images
?為附加功能生成的圖片。比如生成完使用附加功能放大后的圖片都保存在這里。img2img-grids
?為圖生圖隊列的集合圖。img2img-images
?為圖生圖的結(jié)果圖片文件。txt2img-grids
?為文生圖隊列的集合圖。txt2img-images
?為文生圖的結(jié)果圖片文件。
以上文件夾除extras-images
外,均會按照你使用的當天日期生成一個文件夾,方便尋找。
關于爆顯存
即使設置妥當,爆顯存也有一定的玄學問題。比如上文提到的切換訓練模型生成時會爆、大分辨率這種看一眼都覺得會爆之外,生成圖片隨時隨地花式There is not enough GPU video memory available也是軟件的一部分。生成圖片的時候最好不要使用頻繁修改顯存的軟件,能縮小到托盤最好。邊生成邊看視頻這種事情最好不要做,有可能不報錯也會讓生成的圖片變成純黑色。
總體來看如果設置沒出格,但總是爆顯存可以嘗試關閉控制臺重新打開來達到重置的目的。
生成后盡量不要動設置,比如使用了某個生成批次就一直使用該設置。不要一會兒6個一會兒9個。
顯存小的話可以考慮使用低一些的顯存模式啟動,可能有一些優(yōu)化。
玄學很多,可以把爆顯存的問題當作一個日常。
其它
Stable Diffusion生成的PNG文件均包含生成信息。其中原生圖有正向關鍵詞與反向關鍵詞、生成參數(shù)與模型使用等。超分圖有超分信息。
網(wǎng)頁面板中的“圖片信息”項可以查看具體的生成信息。最后當你掌握了以上要點,有了咒語就可以體驗爆顯存和生成圖交織的快感了。