我们在前文主要学习到 Midjourney中我们大部分可以使用的参数,我相信如果你能将参数合理应用,图片的质量就会有翻天覆地的变化。
那么在这篇文章中,我们来研究关于Midjourney中最为核心的一个内容:Prompt(提示词),我将以官方手册为基础带你更深入地了解MJ中的这一部分内容。
在Midjourney中,我们经常使用术语“提示词”,这个词也可以通俗地称为“关键词”或者“咒语”。当涉及到英文时,我们使用术语“prompt”来表示这一概念。此外,制作Midjourney的图像也被戏称为“魔法”,而参与游戏的玩家则自豪地被称为“魔法师”。

我们在第二课的内容中有提到一嘴提示词(Prompt)的常用结构,

💡主题内容 +🌳环境/背景气氛 +📷构图/镜头 +📒风格/参考方向+⚙️图像设定

我们把这个结构分为三层,图片描述,文本描述,参数

那我们从前两层开始本节课程,至于第三层参数我们将放在下一节详细叙述。

1、图片描述

关于图片描述这一部分的内容相对来说相对简单,主要需要注意的是图片的上传和拖入。
当上传两张或更多的图片时,图片顺序的摆放对结果的影响并不是很显著,但根据实验结果,最好还是将需要表达的主要内容放在前列;
此外,在参数设置中,对于图片权重的设定(使用--iw参数)需要特别重视,因为参数的设置对于结果的影响相当大。在这方面,深入了解参数的设置是非常有益的。

你需要了解的(图片提示)基本信息

图片提示可以作为提示的重要组成部分,它对构图、风格和颜色都会产生影响。在添加图片提示时需要注意,图片应该放置在文本提示之前。
可以有两种组合方式:图片+图片提示 和 图片+文本提示 。只有这样才能确保图片提示的有效性。请注意,单张图片是不够的哦!我们需要充分利用多种提示方式来达到更好的效果。

上传图片的两种形式

点击“+”号进行上传图片,或者可以 通过拖拽的方式来上传 。这两种方式都可行,但请记得在上传完成后按下回车键确认。
输入框点击右侧加号上传文件 直接图片拖入,回车键上传

添加图片URL的两种形式

最常见的方式是第一种形式,点击图片后在浏览器中打开,并复制链接 。不过,我们强烈推荐使用第二种形式,即 直接上传图片后,只需将鼠标点击在图片上并拖动到Prompt 框中即可!
点击图片,点击左下角的使用浏览器打开,在拷贝链接即可 直接按住已上传的图片下拉至提示输入框即可推荐

2、文本描述

随着MJ的热度不断攀升,越来越多的网友纷纷分享自己的“咒语”。我们只需简单地使用ctrl+C+V,就能轻松地应用这些口诀。然而,令人遗憾的是,尽管咒语的收藏量众多,但实际使用时结果往往不尽人意。
实际上,你可能未曾了解这些口诀背后的秘密。别人所展示的一张图片背后,可能隐藏着数百张废稿、微妙的文本顺序变化、垫图的内容以及微小的参数调整等 。所有这些微小细节都会对最终结果产生不同的影响。因此,我们不应过分关注口诀本身,而是应该尝试创造属于自己独特的口诀!只有这样,我们才能在MJ的世界中展现出非凡的魔法能力!
文本提示在本文中扮演着至关重要的角色,它也是MJ中出图逻辑的核心所在。文本描述涉及到各种内容和问题,所涉及的变数也是相当之多。举例来说,包括 提示的逻辑、文本的长度、语法以及细节描述 等等方面。我们要按照一定的顺序对其进行整理和梳理。让我们开始逐一剖析吧!

你必须了解的(文本提示)基本信息

MJ bot的文本提示是其最基本且至关重要的功能 ,这是不容忽视的事实。
这个功能通过将提示中的单词或词组进行拆解,然后与后台训练的数据库进行对比,以生成图像。
通过使用文本提示,你只需使用简单的词语,甚至一个表情符号,就能够获得出人意料的结果。当然,需要注意的是,虽然只有 很少一部分提示会产生高度艺术化和具有很大随机性的结果 。
除此之外,你也可以 通过提供更加详细的描述来获取符合你要求的内容 。
这一点非常重要。现在,让我们将重点放在对这个功能的深入探讨上,以便更好地理解和应用它。

提示词的书写顺序

首先,文本的顺序到底有什么考究?我们如何通过顺序去调整画面呢?
在我们日常刷短视频时能够常常看见有热心的网友分享关于写Prompt的基本逻辑,但内容顺序和方法各有特色,为了绝对的可靠咱们还是以官方的建议为标准:

主题+媒介+环境+照明+颜色+情绪+构图

1.jpg

总的来说:主体内容、背景环境、构图视角,风格和其他要求 (颜色氛围,构图)描述
但是,官方的一个书写逻辑是一个范本,我们可以完全遵循他的一个顺序,也可以适当的有所小的调整。

3、关于书写文本描述的建议

关于prompt的内容长短

MJ的图像生成逻辑基于对提示中的单词或短语进行拆解,与训练数据库进行对比,最终生成图像。因此,在描述时只需表达所需内容,无需单独阐述不需要的元素。
例如,如果你在描述卧室场景时提及花瓶,而MJ Bot却添加了你不需要的元素,你可以使用负权重-- no进行删除。这样的有效描述方法也在一定程度上能够简化文本内容。

在众多网友的分享中,我们会发现一长串英文提示词。经过仔细观察,我们会发现其中存在相似的词语、氛围词,或者冗长的主体描述。那么,这种做法是否正确呢?
让我们来看看官方的解释:Mj bot与人类不同,无法像人类一样理解语法、句子结构或单词;较少的词汇意味着每个词都承载着更重要的含义

当你添加过多繁琐的描述时,后面的描述词逐渐失去重要性,甚至会失去准确性。
image.png
在一个赛博朋克的城市霓虹灯街道里有一家玩具店,里面的人很少,有一个小孩在玩具店的橱柜旁边看着琳琅满目的玩具,水平视角,中心构图,突出人物,色彩丰富,颜色绚丽明亮,皮克斯风格,卡通风格,迪士尼风格,3D设计,C4D设计,建模,盲盒,非常高质量的图片细节和内容,开心的表情【已翻译成中文】
image.png
3D设计,皮克斯卡通风格,一个10岁的小女孩在玩具店里看着玩具,背景是赛博朋克街道,背景虚化,人物边缘光,中心构图,人物特写,半身像,前景有光斑,色彩丰富,高质量,高细节【已翻译成中文】
不可否认图1出来的图片还不错,放大之后很多细节度也都在,但这并不是我们文案中所描述的画面。
MJ唯一的确定性就是他不具备确定性,但我可以通过有效的文本描述使这种不确定性相对可控,这也能极大地提高落地性。

学会加限定词

以一组图为例,尽管整体感觉还不错,但存在一个缺点,即图中的人物各不相同。他们在年龄和穿着方面有所差异。为了解决这个问题,我们可以适当添加一些补充描述或限定词,例如:20岁和JK制服。
(然而,有一个非常重要的问题,许多人喜欢使用一些像安慰剂一样的词汇,例如4K、8K、高细节、超高质量内容、清晰度等等。这些词汇有用吗?在某种程度上是有用的,但不要过度使用。如果你在描述中提到背景虚化,并同时强调高清晰度,那么这就会产生矛盾。)
图1
图2
图一的内容确实不错,但是在这一组图中,人物年龄,服装,人物占比各不相同看着难受,给他来点限制吧,可爱的小姐姐永不过时,穿着JK扫大街我觉得够可爱了吧。

内容描述具体

如果你想清楚地描述所需内容,你当然可以选择含糊其辞,但这将导致获得的内容多样化且具有随机性,无法得到你所需的具体细节。
例如,你可以说”一只猫“,但这并不具体;
或者当你想描述卧室的一角时,你可以简单地说它是一个温馨的卧室,有花瓶、床头柜和窗帘,这样的描述给予了MJ bot更多发挥的空间,也许会带来惊喜。
但如果你有特定的想法,不妨尝试这样的描述:这是一个温馨的卧室,床头柜呈深棕色,上面摆放着精致的水晶玻璃花瓶,花瓶里插着五朵香槟玫瑰,背景是垂落的窗帘......
事实上,这样的描述也隐含着对内容的一些限制,和之前所说的类似。

使用更为专业的词语

MJ并不像charGPT那么聪明,也不是那么愚笨。当你想描述背景虚化效果时,直接说需要背景虚化就可以了。
但是,如果你提到光圈F2.0和尼康,那就更加准确了。
你可以通过改变关键词来调整背景虚化的程度
实际上,光圈和相机品牌的提及可以帮助获得更精确的结果。