散文網(wǎng) » 科技 »數(shù)碼 » 使用Intel顯卡調(diào)教Stable Diffusion生成圖片

使用Intel顯卡調(diào)教Stable Diffusion生成圖片

2023-08-03 22:05 作者:Bevis熊熊 0人讀過 | 我要投稿

說來之前對AI生成圖片一直沒什么興趣，一方面GTX 1060的性能實在堪憂，另一方面也懶得去搞這些。雖然到現(xiàn)在英特爾對SD的優(yōu)化依舊堪憂，但Direct ML版本的出現(xiàn)讓I卡起碼可以跑得動制圖了。特定優(yōu)化版本要開WSL 2我也懶得折騰那些，只能用Windows版傻瓜式用一用。

基本下載

B站大佬“獨立研究員-星空”制作集成了I卡和A卡可用的Stable Diffusion包，具體在這個視頻的介紹里。需要注意的是，整個壓縮包的大小在8.85GB左右。包含了一個基礎的訓練包。還有這邊有個整包的FAQ，如果有問題的話可以來這里找一下答案。

想AI制圖就不得不提訓練包了，其中civitai.com基本上就是個AI制圖的集散地。首頁的Models選項就是由別人訓練好的模型，以.safetensors結(jié)尾并且通常在數(shù)GB大小。想玩好AI制圖，訓練模型必不可少。不同的模型有不同的對應關鍵字訓練量，只有訓練量大，才有豐富的關鍵字識別來增加隨機變量減少相似度。并且不同模型有不同的訓練側(cè)重點，找到自己喜歡的模型配合好“咒語”才能生成出好看的圖片。

基本使用

有些訓練模型如果是.safetensors結(jié)尾的，可以直接放進models\Stable-diffusion文件夾下。然后在網(wǎng)頁里選擇你要用的模型即可。如果切換模型后總是爆顯存，可以在頁面最下邊點擊重啟WebUI，反正這玩意的BUG不少。VAE為整個Stable Diffusion的色調(diào)插件，除非模型有要求，一般默認即可。至于咒語相關各種玄學和隨機性與相互作用，只能自己摸索經(jīng)驗。最簡便的就是去Civitai.com上查找類似的咒語。

著重說一下生成頁面的設置。

采樣方法（采樣器）我個人比較喜歡?DPM++ 2M SDE Karras?，速度比較快，效果也還不錯。
采樣迭代步數(shù)在36至46之間。這個數(shù)值也是靠摸索，太少太多都不好。
面部修復似乎沒什么用，至少我現(xiàn)在沒感覺到什么用處。平鋪/分塊也是一樣。
高清修復強烈推薦使用。放大算法如果是偏真人選擇R-ESRGAN 4x+，動漫二次元可以選擇Anime6B或者AnimeVideo。開啟高清修復的主要好處是可以大幅降低面部畫崩的概率。至于高清修復采樣次數(shù)我個人使用10次，重繪幅度默認就好。放大倍率只能是2，高了必爆顯存。
高和寬別多想，512x512默認就好。
生成批次可以調(diào)，但每批數(shù)量別多想，調(diào)成2也會爆顯存。如果有批量生成圖片的需求只要調(diào)生成批次就好，爆顯存的概率低一些。
提示詞相關性與迭代步數(shù)關聯(lián)，具體效果可以網(wǎng)上找相關文章。

一切準備妥當，就可以點生成按鈕，靜待過程。以上設置生成一張圖大概要2分鐘左右，高清修復就要占一半以上。如果只是看個大概風格不考慮臉部畫崩的問題，可以關閉高清修復功能來減少生成所需要的時間。至于下邊的Tiled Diffusion、分塊VAE等功能可以不用設置，除非你懂這些是做什么的。

附加功能

此項基本上用來放大生成圖。Upscaler 1開啟的效果已經(jīng)很不錯了，具體超分算法推薦和高清修復一樣的選項。如果1024x1024分辨率的圖，默認4倍超分到4000x4000左右個人覺得夠用。至于GFPGAN之類的選項我個人沒有試過，也不太清楚調(diào)整之后會有什么效果。

圖片位置

生成的圖片都保存在outputs文件夾內(nèi)，目錄下還有若干子文件夾：

extras-images?為附加功能生成的圖片。比如生成完使用附加功能放大后的圖片都保存在這里。
img2img-grids?為圖生圖隊列的集合圖。
img2img-images?為圖生圖的結(jié)果圖片文件。
txt2img-grids?為文生圖隊列的集合圖。
txt2img-images?為文生圖的結(jié)果圖片文件。

以上文件夾除extras-images外，均會按照你使用的當天日期生成一個文件夾，方便尋找。

關于爆顯存

即使設置妥當，爆顯存也有一定的玄學問題。比如上文提到的切換訓練模型生成時會爆、大分辨率這種看一眼都覺得會爆之外，生成圖片隨時隨地花式There is not enough GPU video memory available也是軟件的一部分。生成圖片的時候最好不要使用頻繁修改顯存的軟件，能縮小到托盤最好。邊生成邊看視頻這種事情最好不要做，有可能不報錯也會讓生成的圖片變成純黑色。

總體來看如果設置沒出格，但總是爆顯存可以嘗試關閉控制臺重新打開來達到重置的目的。
生成后盡量不要動設置，比如使用了某個生成批次就一直使用該設置。不要一會兒6個一會兒9個。
顯存小的話可以考慮使用低一些的顯存模式啟動，可能有一些優(yōu)化。
玄學很多，可以把爆顯存的問題當作一個日常。

其它

Stable Diffusion生成的PNG文件均包含生成信息。其中原生圖有正向關鍵詞與反向關鍵詞、生成參數(shù)與模型使用等。超分圖有超分信息。

網(wǎng)頁面板中的“圖片信息”項可以查看具體的生成信息。最后當你掌握了以上要點，有了咒語就可以體驗爆顯存和生成圖交織的快感了。