简单说来,你可以将这些参数理解为官方的固定prompt模版,而且这个模板包含了一些特殊字符,让模型能百分百保证输出结果的一致性,并且还能提升prompt的准确度和输入效率。
如果你有用过ChatGPT,应该会遇到过这种场景,用了别人一样的prompt模板,但却没法令ChatGPT 生成相同的内容。
而Midjourney 因为是图片类目,相对比较垂直,所以他们将很多图片类的通用prompt语句做成了模板,比如图片长宽比,有1:1、2:3、4:7等等,如果你要用ChatGPT的使用习惯,就需要在prompt 里不断重复 Aspect Ratios 1:1等,而且每个人的表达Aspect Ratios 的方式都不一样,模型还要去理解人说的话,比较麻烦。
所以Midjourney就设计了一些参数,让你能快速调用,比如Aspect Ratio这个,就只需要输入一ar 1:1即可。同时因为固定了表达方式,大家要改长宽比,都会用这种方式表达,Midjourney调整下模型,就能保证输出的图片的一致性了。
因为其稳定且必须,所以我才会先教各位参数。
一、Version
目前Midjourney支持多个版本,最新的版本是V5,跟ChatGPT 稍微有点不一样,Midjourney给我的感觉,并不是版本越大,约厉害,而是擅长的东西不太一样。相关区别请查阅Midjourney 各版本差异。
Version 参数使用方式见下表。你也可以在设置里,调整默认的版本,相关教程请查阅Midjourney 基础设置。
调用方法 | 使用案例 | 注意事项 |
---|---|---|
在关键词后加空格,然后带上版本参数:—v或者 -v—version或者一 version | vibrant california poppies —v 5 |
版本仅支持 1、2、3、 4、5。 |
因为可以在prompt 里直接加版本参数,同时又可以在设置里设置版本,所以你有可能会遇到如下图这样的情况(我想生成版本1的图,但设置里设置了5怎么办?):
此时模型会按照从左往右的顺序运行这些参数,按照上面的例子,其实生成的图片是V1版本,可以跟下面的这个 V5版本对比下:、
二、Aspect Ratios
第一个参数是图片的长宽比,使用方式如下,及版本差异如下:
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带上长宽比参数:—ar或者一ar— aspect 或者 -aspect | vibrant california poppies —ar5:4 | 默认比例是1:1。比例数需要是整数,比如1.3:1是不行的,但13:10可以。长宽比会影响生成图像的形状和构图。当放大图片时,有些长宽比可能会发生轻微的改变。比如 —ar 16:9(1.75)最终生成的图片可能是7:4(1.74)。 |
✅支持任意比例。但2:1以上的宽高比是实验性的,可能会产生不可预测的结果。 | ✅1:2到2:1 | ✅5:2到2:5 | ✅1:2到2:1 |
另外,长宽比在业界也有最佳实践:
🔹5:4多用于传统打印
🔹3:2多用于照片打印
🔹7:4比例接近于HD TV的比例,或者是智能手机
三、No
这个参数的意思是不要什么,如果你不想让AI生成的图片里出现树,那就输入plants 即可:
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带上你不想AI生成的内容:—no或者-no | -no plants | 无 | ✅ | ✅ | ✅ | ✅ |
四、Chaos
这个参数跟 ChatGPT 里的TopP有点像,主要控制模型的随机性,数字越高,约有可能产生一些意想不到的结果,数字越低一致性会更高。看看官方的例子,prompt 是watermelon owl hybrid。
这是当Chaos 为0的时候,一致性会比较高,西瓜和猫头鹰的融合的方式,在四次输出里都比较类似,另外在单次输出里,4张图(四宫格)的风格相似度也比较高:
这是Chaos 为100的时候,你会发现多次输出的融合风格都不太一样,且即使是在单次输出里,4张图的风格区别也比较大。如果你是想让AI帮你做一些探索性的事情,我建议初期可以将Chaos 调高一点,结果会发散一些。
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带数字:—c 或者一C— chaos 或者一 chaos |
-c 10 | 可以输入0-100,默认是 0 |
✅ | ✅ | ✅ | ✅ |
五、Stylize
这个参数跟 ChatGPT里的Temperature有点像,主要是控制生成图片的风格化程度。简单理解,这个值越低会更符合 prompt 的描述,数值越高艺术性就会越强,但跟prompt 关联性就会比较弱。
我们一起看下官方的例子,prompt都是colorful risograph of a fig。Risograph是一种数字印刷机,它使用模板和专用油墨来制作印刷品。Risograph通常用于制作海报、宣传册等低成本印刷品。这种印刷机可以产生特殊的色彩和纹理效果,头三张图基本上契合risograph的风格,但右下角那四张就非常不像了,模型加了很多戏。😂
除了在prompt 里输入外,你也可以在设置里,调整默认的版本,相关教程请查阅Midjourney 基础设置。
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带数字:—s 或者一S— stylize 或者一 stylize |
-s 50 | 默认是100 | ✅ | ✅ | ✅ | ✅ |
六、Niji
这个其实 Niji 模型,是Midjourney跟Spellbrush 一起开发的。「niji」是日语「にじ」,意思是「彩虹」或者「2D」。
它在生成动漫类的图片上,比较在行。举个例子,prompt是fancy peacock,左图是v5模型,右图是niji v5模型,右图更偏向于漫画风格:
使用方法跟Version比较像,只需要在文字prompt最后输入一niji即可
调用方法 | 使用案例 | 注意事项 |
---|---|---|
在关键词后加空格,然后带上版本参数:—niji或者-niji vibrant california poppies—niji | vibrant california poppies—niji | 部分参数对 Niji 无效。大家可以在完整列表里查看哪些参数对 Niji 无效。 |