我如何訓練ChatGPT 撰寫Midjourney 提示語?AI 繪圖四個階段

最近我開始嘗試讓Midjourney 設計部落格文章的主圖,制作課程簡報當中的某些情境圖、封面圖,熟練操作與提示語之后,比找圖庫更節(jié)省時間,而且也更能直接產(chǎn)生相對適合自己需要的特殊圖片。
也在這樣的使用過程中,雖然一開始沒有想要認真研究Midjourney 的提示語,但也不知不覺累積了一份屬于我自己慣用的AI 繪圖工具咒語筆記,包含可以下什么樣的參數(shù)、用什么樣的關鍵字結構,以獲得更符合自己需要的結果。
不過當每一天都會用到Midjourney 生成圖片的時候(文章圖、簡報圖),我就希望「設計提示語」的流程可以更快一點,也就想到透過ChatGPT來快速生成。
嘗試了一段時間,發(fā)現(xiàn)真的可以訓練ChatGPT 來自動撰寫我需要的Midjourney 提示語,而且:
很多時候訓練好的ChatGPT 比我更會描述圖片場景、藝術風格。
訓練好的ChatGPT 也比我更會使用專業(yè)攝影、3D 技術的參數(shù)。
訓練好的ChatGPT 也會自己下好Midjourney 可能需要的參數(shù)。
訓練好的ChatGPT 可以讓我有時候只要發(fā)想一個「概念」,就能生成上述圖片主題、場景,自動選擇適合的藝術風格,自動下好需要的技術參數(shù)或Midjourney 參數(shù)。
今天這篇文章,就來跟大家分享我自己搭配ChatGPT 輔助,加速學習與應用Midjourney 提示語的流程。
階段一:讓ChatGPT 翻譯Midjourney 提示語:從簡單開始就好
首先,我的大前提是:
如果可以簡單解決,就盡量不要把事情復雜化。
在這里的意思是, Midjourney 雖然有些很厲害的圖片是利用很厲害的提示語來完成(看起來復雜,有各種關鍵字,有各種技術參數(shù))。不過,也有不少時候,簡單的提示語就能產(chǎn)生不錯的效果。
例如我單純下這樣的指令:「Sunrise at Alishan, Taiwan. --ar 16:9 --v 5」,即使我沒有使用任何的攝影專業(yè)術語,其實也能產(chǎn)生可用的(阿里山)日出照片。
所以,第一階段,我們可以先不用想得太復雜,就用ChatGPT 來「翻譯」我們的提示語構想即可。
我會先建立一個專門的ChatGPT 對話頻道,之后所有跟Midjourney 提示語有關的問題都在這個頻道詢問,慢慢建立起我需要的ChatGPT 繪圖提示語助理。
這里的「翻譯」,就是把我們中文的概念構想,翻譯成英文的繪圖提示語。
如果這樣就能產(chǎn)生自己滿意、需要的照片,那么其實不需要把Midjourney 的提示語寫得太復雜。
階段二:讓ChatGPT 改寫Midjourney 提示語:從概念想法,轉譯成圖片語言
但是有些時候,更專業(yè)的提示語確實更能產(chǎn)生自己需要的特殊圖片,或是讓圖片的效果更好。例如我提供這樣的提示語:「Sunrise at Alishan, Taiwan, captured in a stunning photograph, featuring majestic mountains and lush forests, birds-eye view perspective, inspired by professional travel photography, breathtaking beauty, vivid colors of morning sky, peaceful atmosphere, realistic style, high dynamic range (HDR), long exposure, optimal camera settings for perfect sunrise capture, golden hour lighting, --ar 16:9 --v 5」
在這樣的Midjourney 提示語中,除了臺灣阿里山日出外,我還強調了照片的風格(專業(yè)旅行攝影、讓人屏息的美景)、拍攝的角度(鳥瞰、遠景)、想要的顏色、攝影照片術語(HDR效果)等等。這時候產(chǎn)出的照片效果,確實又提升了一個層級。
但是問題來了,如果我不是專業(yè)攝影師、不是專業(yè)繪圖者,我怎么知道如何有效地描述一張圖片的各種場景、細節(jié)、技術呢?這時候,可以利用ChatGPT 來「轉譯」。
請ChatGPT 把我的想法「轉譯」成更好的AI 繪圖提示語。
例如我會這樣問:「我要用AI 繪圖工具制造一張個人照片的宮崎駿卡通風格版本,請建議我可以在提示語上加上哪些英文關鍵字?」
這樣一來,我可以獲得許多原本想不到、不知道的專業(yè)術語,都可以用在Midjourney 提示語中。
或者另外一種「轉譯」,是幫我把單純的概念,轉換成一張圖片需要的場景、構圖、細節(jié),我可以這樣問:
「請根據(jù)所有你知道的AI 繪圖提示語結構與邏輯,設計一張「現(xiàn)代港口,真實攝影照片」的英文提示語,要設定適合的攝影技術參數(shù)?!?/p>
「請根據(jù)所有你知道的AI 繪圖提示語結構與邏輯,設計一張「安靜」的英文提示語?!?/p>
很多時候,我其實是卡在沒有什么繪制圖片的構想,只有一個想要的主題(例如:現(xiàn)代港口、真實攝影照片),或者想要的概念(例如:安靜),這時候,可以利用ChatGPT 幫我轉譯成一個完整的繪圖提示語。
雖然ChatGPT 在其2021 年前的資料庫中其實并不認識Midjourney,但是只要我問他「請根據(jù)所有你知道的AI 繪圖提示語結構與邏輯」,那么他就真的會認真地用各種角度描繪一張圖片的元素,例如下面的港口照片中, ChatGPT 轉譯了:
港口的景觀細節(jié)。
拍攝真實照片的關鍵(例如during golden hour)。
也幫我提供了攝影需要的光圈、 ISO 等細節(jié)。
我只是說了「現(xiàn)代港口,真實攝影照片,攝影技術參數(shù)」,而ChatGPT 透過轉譯,提供給我Midjourney 需要的更完整細節(jié)描述。
階段三:讓ChatGPT 模仿Midjourney 提示語:把專家語法換上我的需求
前面的「轉譯」,比較像是ChatGPT 自己天馬行空的想像,他可以把我們的概念描述成圖片語言,但是到底適不適合Midjourney 呢?其實ChatGPT 并不知道,所以有時候階段二產(chǎn)出的提示語,用在Midjourney 上會產(chǎn)不出好結果。
在Midjourney 中確實有些語法、結構、邏輯更能產(chǎn)出有效的圖片,如果要讓不認識Midjourney 的ChatGPT 學習,最好的方式就是讓他「模仿」。
例如有一次,我在Midjourney 的探索圖庫中看到一張很棒的奇幻風格圖片,于是我先把該張圖片的提示語復制下來。(我建議可以常常到Midjourney 的探索圖庫中去找自己需要的優(yōu)質圖片并收集其提示語來用)
接著,我就請ChatGPT 「模仿」該張圖片的提示語,設計一個我自己想要主題的Midjourney 指令,我是這樣下指令的:「請幫我根據(jù)下面的AI 繪圖提示語邏輯,撰寫一份關于XXXXX 的AI 繪圖工具英文提示語:」
這里關鍵之處在于要提示ChatGPT 「根據(jù)范例的邏輯來思考」:
「根據(jù)范例的邏輯來思考」、「根據(jù)范例的邏輯來思考」、「根據(jù)范例的邏輯來思考」!很重要,所以說三次,如果是其他提示語,可能會變成只是在替換關鍵字而已。
這樣ChatGPT 就會開始去理解范例背后的設計流程,并用同樣流程設計不同內容。(類似我在這篇教學:「ChatGPT 提示語說明書:通用三層結構與9 個技巧提高AI 生產(chǎn)力」提到的思維鏈提示法)
可以看到ChatGPT 確實會根據(jù)范例提示語的「邏輯」,重新修正成我需要的內容,而且「不只是替換關鍵字而已」,像是原本的范例場景是海洋, ChatGPT 根據(jù)我的主題自動把場景換成城市與天空(我并沒有下這樣的指令),并重新設計了整個描述。
于是就產(chǎn)出下面這張圖。
我們可以收集很多自己需要的類型提示語的「目前最佳范例」,例如我收集了海報用的、照片用的、抽象概念用的、人物用的、食物用的等等提示語。需要哪一種類型,就請ChatGPT 根據(jù)最佳范例模仿,然后生成出我需要的新主題的提示。
階段四:讓ChatGPT 理解后創(chuàng)作Midjourney 提示語:拆解指令邏輯
前面第三階段,其實對于一開始不太會設計Midjourney 提示語的我來說,或是對沒有藝術、繪圖、攝影專業(yè)的我來說,已經(jīng)可以有模有樣的請ChatGPT 設計出專業(yè)的Midjourney 提示語,并且產(chǎn)出我需要的圖片效果。
不過我還想要更節(jié)省時間,也想更有效學習Midjourney 提示語,所以我進一步這樣做:
我開始「喂給」 ChatGPT 一些自己很喜歡的Midjourney 照片的提示語,但是這次請他「拆解出里面的結構與邏輯」。
我會這樣問:「請幫我分析下面這段AI 繪圖提示語有哪些結構,用表格呈現(xiàn): 貼上Midjourney 提示語范例」
這樣做可以帶來兩大好處:
對我自己來說,我開始看懂原來Midjourney 的高手是用這樣的結構、邏輯來設計提示語啊!我也開始更懂提示語的一些關鍵技巧、重要參數(shù)了。
對ChatGPT 來說,這個AI 繪圖專用頻道里的ChatGPT ,開始懂得用這些結構與邏輯來設計Midjourney 提示語了!
不一定要一次性喂給ChatGPT 很多提示語范例,我都是偶爾看到很棒的Midjourney 圖片與提示語時,就把他喂給ChatGPT ,讓他產(chǎn)生一些片段的學習。
更重要的反而是:偶爾就更新一下最近覺得不錯的提示語,畢竟ChatGPT 的記憶不是永久。只要持續(xù)更新,就能讓自己下次使用的時候有更好的設計邏輯。
接著,當我要生出一張圖片的Midjourney 提示語時,我會這樣請ChatGPT 幫忙:
請根據(jù)前面所有你記得的提示語結構邏輯,設計一張「XXXXX」的AI 繪圖工具提示語。
這時候,我不用說太多,甚至都不用說要使用英文, ChatGPT 根據(jù)前面片段記住的各種提示語結構、邏輯,就會自動產(chǎn)出有用的Midjourney 提示語。我們可以看到:
我只給出「安靜」兩個字,但是ChatGPT 自動描繪出了一個安靜的場景細節(jié)。
不過,這是前面所說的「階段二」就有機會做到的!但下面就是經(jīng)過階段三、四學習,才能做到的提示。
而且ChatGPT 會主動加上圖片藝術風格、技術技巧的描述(這些對Midjourney 來說很重要),例如這張圖給的是插畫風格。
并且ChatGPT 對圖片的描述會有更多細節(jié),例如更會加上鏡頭焦點、顏色描述等等細節(jié)。
甚至,還會加上Midjourney 專屬的參數(shù),例如要用v5 引擎、圖片比例、品質強化、風格強化等等。
如果在這樣學習后,再請ChatGPT 設計一張「現(xiàn)代港口,真實攝影照片」的Midjourney 提示語呢?
這時候,整個提示會變得更專業(yè),有更多、更正確描述的攝影技術語言,也有更多光影的專業(yè)描述,當然也有加上Midjourney 的特殊參數(shù),最后就產(chǎn)生了一張我更滿意的港口照片圖。
如果跟前面階段二生成的圖片做比較,其實階段二生成的港口圖也不錯,但重點在于,階段四產(chǎn)出的照片更像是我想要的「真實攝影照片」,這是ChatGPT 學習后的結果。
最后,再提供幾個階段四的應用案例給大家參考,這時候我可以更直接給一些抽象概念,讓ChatGPT 幫我設計有用的Midjourney 提示語。
例如我說我要簡報封面,就自動幫我加上midjourney 的圖片比例參數(shù)--ar 16:9 。
也別忘了, ChatGPT 是對話機制,如果測試Midjourney 提示語后發(fā)現(xiàn)效果有落差,只要在ChatGPT 用對話請他修正即可。
小結
我想說的是,前述四個訓練ChatGPT 幫我撰寫Midjourney 提示語的階段,并不是說階段四就會比階段三好!
所以有時候簡單一句話, ChatGPT 翻譯成英文的Midjourney 提示語,就是最好的做法(階段一)!
但是,我們也可以從階段二、階段三、階段四的不同訓練方式,看到利用ChatGPT 撰寫Midjourney 提示語還可以有這些彈性作法,從而讓自己更能設計出符合需要的創(chuàng)意圖片。
階段一:讓ChatGPT 翻譯Midjourney 提示語:從簡單開始就好
階段二:讓ChatGPT 改寫Midjourney 提示語:從概念想法,轉譯成圖片語言
階段三:讓ChatGPT 模仿Midjourney 提示語:把專家語法換上我的需求
階段四:讓ChatGPT 理解后創(chuàng)作Midjourney 提示語:拆解結構邏輯
而且,在這樣的學習過程中,除了每天更快速生成我需要的圖片,我也漸漸學會Midjourney 提示語的關鍵結構、邏輯、參數(shù)(并且整理成筆記),有些時候,我就利用階段一自己寫出提示語,反而可以達到更想要的效果。
而想要知道在Midjourney 中可以設定哪些提示語?不同參數(shù)有什么不同意義?最好的方式,就是先參考這份Midjourney 的官方教學文件,會學到非常多。
基本上Midjourney 提示語的結構,和ChatGPT 提示語的結構很像,都是:目的優(yōu)先、輸入資料、設定輸出三個階段:
目的優(yōu)先:圖片主題、場景、人物描述。
輸入資料:設定圖片、照片細節(jié),例如構圖方式、使用的攝影技術或繪畫技術、藝術風格、時間年代等等。(尤其藝術風格影響很大)
設定輸出:利用各種參數(shù)設定圖片長寬比例、品質高低、藝術化程度等細節(jié)。
也提供大家參考。