場景5:頭像
在 Stock Photo 一章中,介紹了 img2img 的方法,這個方法除了解決 Stock Photo 的那幾個問題外,還很適合多個場景。
本章會著重介紹用這個方法生成的頭像的 prompt。並且從本章開始會逐步豐富我們的 prompt 結構,使其更加完整。
注意事項
在介紹 img2img 的應用前,我想強調一下:
- 不要在 Discord Midjourney 公開群上傳自己的照片!這樣你的照片會被公開群裡的所有人看見。建議使用 Midjourney Bot。
- 另外,非 pro 付費會員,生成的圖片都會被其他會員看見。但你可以在生成完頭像後,刪掉生成的圖片。如果還不知道如何使用 Bot ,及刪除照片,請看基本操作篇。
- img2img 的操作我就不過多贅述了。如果你還不太清楚,可以看基本操作篇,以及 Stock Photo 那篇。
3D 卡通頭像
第一個要分享的是卡通頭像。首先跟大家強調下:
- 我基本上把國內國外的生成頭像教程都看過,並試過一遍,還跟 Midjourney 社群的人也交流過。我的理解是,以目前 V5 的能力,不管你如何調整 prompt ,想用 img2img 方法生成一張非常像原圖的圖片,基本靠運氣,即使用了前面介紹的技巧七方法,也只是提高機率。如果你有令頭像非常像的方法,不妨透過 Issue 分享給我,我會署下你的名字,並分享給大家。
- 各位在學習的過程中,如果發現生成的圖片不像原圖,也不需要氣餒。這是正常的。
- 你可以透過我分享的方法,生成一張有原圖神韻的卡通頭像。注意肯定不會非常像原圖。
在 prompt 里加上原圖連結(建議使用證件照,或者背景比較單一的照片,這樣成功率會高一些),然後用我前面提到的框架設計一個 prompt:
Prompt | 解釋 | |
---|---|---|
型別是什麼? | Portraits / Avatar | 如果你的原圖是證件照,可以在 prompt 里加入「肖像」一詞,或者「Avatar 頭像」。 |
主體是什麼? | smiling cute boy, undercut hairstyle | 這裡可以是選填,你可以先不加這個描述,只填其餘 prompt,然後如果生成的圖片不像你。那你就在這裡加點描述下你的頭像的詞,一般就是性別、樣貌、髮型、配飾(比如眼鏡、耳環等)、表情等。注意,儘量挑特徵比較強的部分輸入,特徵對了,生成的圖片基本會有幾份像。 |
背景是什麼? | white background | 我這裡保留了證件照的白底,你可以加一些實際場景的背景,比如餐廳之類的。 |
構圖是怎樣的? | null | 因為我們預先傳了圖片,圖片是張證件照,所以不填 |
用什麼鏡頭? | soft focus | 柔焦是指攝影中,使用柔焦鏡頭,使得拍攝的影像既清晰又柔和的效果。一般多在拍攝人像的時候使用,我在 prompt 里加上這個,可以使照片更柔和。你也可以不加。 |
是什麼風格? | 3d render,Pixar style | 因為目標是生成 3d 照片,所以這裡加了 3d render(3d 渲染),以及我喜歡的皮克斯風格 |
引數 | —iw 2 | iw 是一個文字和 img 權重引數。數值越大,就越像原圖,關於這個值的介紹,可以看高階引數篇。 |
最後,還有三個技巧:
- 如果你生成的照片並不像預設的照片,可以在四張圖裡,挑一張比較像的,然後點 V(Variation),讓模型繼續生成,再繼續挑一張像一點的照片,然後繼續生成新照片,直到出現一張比較像的。
- 第二個,我覺得很神奇,如果前兩個方法你都試過了,你生成的圖片還是跟原圖不像,那就在 prompt 里加上「wear glasses(戴眼鏡)」,真的很神奇,我只要加上戴眼鏡就像非常多,如果你原圖戴眼鏡了,你試試在引數里加個 —no glasses,你會得到一張更不像你的圖。
- 最後,就是多用一個引數,這個方法會在技巧八中展開說下。
本章最後,有我的證件照的案例。
技巧七:多引數同時使用
在使用 img2img 的方法生成頭像時,我發現問題是「文字權重比圖片權重高」,導致其生成的圖片不像原圖,iw 引數在 V5 裡最多提升圖片權重到 2,所以我就在想有沒有可能進一步降低文字的權重。
然後我就試了下 s 引數,發現的確好了很多。
如果生成的圖片還是不像,你可以在 —iw 2 基礎上,再加一個引數 —s 200 ,注意同時用兩個引數時,中間不要有逗號。我發現加了 s 引數之後的確像了很多,我個人猜測是 s 和 iw 連用會進步一削弱 text 的權重。
s 是控制生成圖片的風格化程度。簡單理解,這個值越低會更符合 text prompt 的描述,數值越高藝術性就會越強,但跟 text prompt 關聯性就會比較弱。所以如果你生成的圖還是不像,就加大這個值,比如調到 500。
我想透過這個案例告訴大家,多個引數一起使用,有可能會形成合力,進一步放大模型的能力。未來有新的引數能力,不妨也想想有沒有可能一起用?
動漫風頭像
與 3D 卡通頭像一樣,主要的修改是在圖片風格上:
Prompt | 解釋 | |
---|---|---|
型別是什麼? | Portraits / Avatar | 繼續使用相同描述 |
主體是什麼? | smiling cute boy, undercut hairstyle | 繼續使用相同描述 |
背景是什麼? | white background | 繼續使用相同描述 |
構圖是怎樣的? | null | 繼續使用相同描述 |
用什麼鏡頭? | null | 因為是漫畫風,就不加柔光鏡頭了 |
是什麼風格? | anime, Studio Ghibli | 目標是製作動漫風的頭像,所以這裡加了 anime(動漫),然後加了吉卜力風格 |
引數 | —iw 2 —s 500 | 注意同時用兩個引數時,中間不要有逗號。 |
賽博龐克頭像
這是我最喜歡的風格之一,也是只需要改一下風格和背景即可:
Prompt | 解釋 | |
---|---|---|
主體是什麼? | cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing | 加了臉的修飾,還有戴上 VR 眼鏡,穿上賽博龐克風衣服 |
背景是什麼? | neon-lit cityscape background | 為了讓圖片更像是賽博龐克,就加了個霓虹燈城市背景,讓其看起來更有賽博那味 |
是什麼風格? | Cyberpunk, by Josan Gonzalez | 加了賽博龐克風格,以及我非常喜歡的賽博龐克畫家 Josan Gonzalez |
上面這幾個頭像 prompt 最後生成的頭像是這樣的,坦率地說,我已經盡力了,我的個人特徵太少了,人也不帥,生成的圖片,都有種東南亞人那味,感覺 Midjourney 對亞洲人的理解還不是很行 😂
技巧八:使用 Seed 引數對圖進行二次修改
注意:這個技巧,我個人覺得未來潛力比較大,但目前 Midjourney 的實現效果還比較一般,效果得不到保證。官方的社群的幫助文件也提到這個功能在 V5 非常不穩定。詳細可以看看我整理的 Midjourney 官方 FAQ 一章。
你可能遇到類似這樣的場景:
- 你輸入一段 prompt,機器生成了 4 張圖片
- 你看了下4張照片,發現其中有一張還行,但其餘不是很滿意,然後改了下 prompt,機器又生成了一些
- 但這次生成的照片你都不滿意,你就很煩惱為何會這樣
- 然後你就像為啥不能在第一次生成圖上做修改呢?
基於某一次生成的結果進行二次 prompt 修改,理論上我認為是可以的,以賽博龐克頭像為例,我先用上述 prompt 生成了四張圖片,然後在訊息的右上角點選 emoji 按鈕(下圖1),然後再輸入框裡(下圖2)輸入 envelope,然後點選信封 emoji(下圖3),接著 bot 就會將 seed 號碼發給你。
然後我修改上面的賽博龐克頭像的 prompt,將其背景改為 China Town,此時需要注意:
- 新的 prompt 並不是只改 background,你需要將之前的 prompt 都帶上。
- prompt 僅修改 background 的部分。
- 最後帶上 seed 引數。
以下是我的案例:
原 prompt:
{img url} avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1
新 prompt(seed 碼只是範例,你要填寫自己的 seed):
{img url} avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1 --seed 758242567
以下是生成的效果(左圖為原圖,右圖是用了 seed 後生成的圖),可以看到,背景的確換了,但人的外觀也有點變化 😂
效果不是很好,但我覺得值得探索,這樣能提高漸進最佳化的成功率:
技巧九:神秘的 blend 功能
這個技巧,說實話,我感覺不能稱其為技巧,但這又是一個 Midjourney 非常重要的 feature,所以在這裡著重介紹一下。
這個功能使用起來非常簡單,在 Discord 輸入框裡 /blend,然後點選這個選單:
之後你的輸入框就會變成這樣:
然後你就可以點選這兩個框,然後選擇你電腦上的照片,新增完成後,大喊一聲「使用融合卡」(不是),然後點選回車:
然後 Midjourney 就會生成這樣牛逼的結果,左邊是融合鋼鐵俠,右邊是融合巴斯光年:
這個功能我第一次看到時,我是非常震驚的,以為是小時候看遊戲王裡主角們使用「融合卡」的那種效果。可惜並不是,這個功能非常不穩定,僅有在滿足多個未知條件才能達到上述的效果。
我本來打算用這個方法用於生成頭像,但我發現只要用自己的照片,融合其他風格的照片,效果都不太好,目前實驗下來效果最好的是名人頭像,我的感覺是因為 Midjourney 餵了不少名人的頭像給模型,所以這種融合的效果都很好。
但我覺得它真的很適合做頭像,將自己的頭像跟另一張圖片融合一下,就能生成一張不錯的圖,方便又快捷。可惜目前這個功能感覺還不太好用。
當然這個功能還不僅僅止於此,它還有很多使用場景,在後續會介紹給大家。