Midjourney 各版本差異
V1、V2、V3、V4、V5
我們都用相同的 prompt 來看看各版本的差異,我使用的是官方案例裡的 prompt:
vibrant California poppies
從上圖裡其實你就能看到 Midjourney 的進化方向:
- 越來越豐富的細節,生成的內容也越來越真實。V1 和 V2 基本上就是簡筆畫,看看 V2 第四張圖前景和背景的處理就很粗暴,到了 V3 背景和透視都變得更加合理,然後到了 V4 基本就是一個可用的狀態。
- 解析度越來越高。V1~V3 單張圖是 256 x 256,到了 V5 單圖已經預設是 1024*1024。
- 引數更多,Prompt 更加重要。這個在 V5 版本更加明顯,感覺以前的版本,並不太能理解一些詞,比如材料詞 marble 之類的。但到了 V5 理解能力變強了。
- 藝術風格詞變得更重要。這個結論暫時沒有得到官方的認證,甚至有很多人認為 V5 版本是個更「通用」的版本,我的理解是 V5 提高了整個基準線,不需要太多描述詞,就能生成一個「可以看」的圖片,但如果要生成一張你跟你預期完全一致的圖,其實變難了,你需要瞭解更多的 prompt。
然後我們再來看看更復雜的 prompt 看看版本的差異:
21years chinese girl, in school, beauty, long black hair, sun light,insane detail, smooth light, real photography fujifilm superia, full HD, taken on a Canon EOS R5 F1.2 ISO100 35MM
看看生成的結果,是不是差距非常大,從 V1 到 V5 的進化,Midjourney 大約花了 1 年的時間,如果僅算研發時間,我覺得應該不到 1 年,非常了不起:
Niji
最後再介紹一個 Midjourney 的特殊版本 Niji,這個版本其實是 Midjourney 跟 Spellbrush 一起開發的。「niji」是日語「にじ」,意思是「彩虹」 或者 「2D」。
它在生成動漫類別的圖片上,比較在行。舉個例子,prompt 是 fancy peacock,左圖是 v5 模型,右圖是 niji v5模型,右圖更偏向於漫畫風格: