AIGC进阶-Midjourney - 4.提示词入门 - 《AIGC 新手上路》

1、图片描述
2、文本描述
- 你必须了解的(文本提示)基本信息
- 提示词的书写顺序
3、关于书写文本描述的建议

我们在前文主要学习到 Midjourney中我们大部分可以使用的参数,我相信如果你能将参数合理应用,图片的质量就会有翻天覆地的变化。
那么在这篇文章中，我们来研究关于Midjourney中最为核心的一个内容：Prompt（提示词），我将以官方手册为基础带你更深入地了解MJ中的这一部分内容。
在Midjourney中，我们经常使用术语“提示词”，这个词也可以通俗地称为“关键词”或者“咒语”。当涉及到英文时，我们使用术语“prompt”来表示这一概念。此外，制作Midjourney的图像也被戏称为“魔法”，而参与游戏的玩家则自豪地被称为“魔法师”。

我们在第二课的内容中有提到一嘴提示词（Prompt）的常用结构，

💡主题内容 +🌳环境/背景气氛 +📷构图/镜头 +📒风格/参考方向+⚙️图像设定

我们把这个结构分为三层，图片描述，文本描述，参数。

那我们从前两层开始本节课程，至于第三层参数我们将放在下一节详细叙述。

1、图片描述

关于图片描述这一部分的内容相对来说相对简单，主要需要注意的是图片的上传和拖入。
当上传两张或更多的图片时，图片顺序的摆放对结果的影响并不是很显著，但根据实验结果，最好还是将需要表达的主要内容放在前列；
此外，在参数设置中，对于图片权重的设定（使用--iw参数）需要特别重视，因为参数的设置对于结果的影响相当大。在这方面，深入了解参数的设置是非常有益的。

你需要了解的(图片提示)基本信息

图片提示可以作为提示的重要组成部分，它对构图、风格和颜色都会产生影响。在添加图片提示时需要注意，图片应该放置在文本提示之前。
可以有两种组合方式：图片+图片提示和图片+文本提示。只有这样才能确保图片提示的有效性。请注意，单张图片是不够的哦！我们需要充分利用多种提示方式来达到更好的效果。

上传图片的两种形式

点击“+”号进行上传图片，或者可以通过拖拽的方式来上传。这两种方式都可行，但请记得在上传完成后按下回车键确认。
输入框点击右侧加号上传文件直接图片拖入，回车键上传

添加图片URL的两种形式

最常见的方式是第一种形式，点击图片后在浏览器中打开，并复制链接。不过，我们强烈推荐使用第二种形式，即直接上传图片后，只需将鼠标点击在图片上并拖动到Prompt 框中即可！
点击图片，点击左下角的使用浏览器打开，在拷贝链接即可直接按住已上传的图片下拉至提示输入框即可推荐

2、文本描述

随着MJ的热度不断攀升，越来越多的网友纷纷分享自己的“咒语”。我们只需简单地使用ctrl+C+V，就能轻松地应用这些口诀。然而，令人遗憾的是，尽管咒语的收藏量众多，但实际使用时结果往往不尽人意。
实际上，你可能未曾了解这些口诀背后的秘密。别人所展示的一张图片背后，可能隐藏着数百张废稿、微妙的文本顺序变化、垫图的内容以及微小的参数调整等。所有这些微小细节都会对最终结果产生不同的影响。因此，我们不应过分关注口诀本身，而是应该尝试创造属于自己独特的口诀！只有这样，我们才能在MJ的世界中展现出非凡的魔法能力！
文本提示在本文中扮演着至关重要的角色，它也是MJ中出图逻辑的核心所在。文本描述涉及到各种内容和问题，所涉及的变数也是相当之多。举例来说，包括提示的逻辑、文本的长度、语法以及细节描述等等方面。我们要按照一定的顺序对其进行整理和梳理。让我们开始逐一剖析吧！

你必须了解的(文本提示)基本信息

MJ bot的文本提示是其最基本且至关重要的功能，这是不容忽视的事实。
这个功能通过将提示中的单词或词组进行拆解，然后与后台训练的数据库进行对比，以生成图像。
通过使用文本提示，你只需使用简单的词语，甚至一个表情符号，就能够获得出人意料的结果。当然，需要注意的是，虽然只有很少一部分提示会产生高度艺术化和具有很大随机性的结果。
除此之外，你也可以通过提供更加详细的描述来获取符合你要求的内容。
这一点非常重要。现在，让我们将重点放在对这个功能的深入探讨上，以便更好地理解和应用它。

提示词的书写顺序

首先，文本的顺序到底有什么考究?我们如何通过顺序去调整画面呢?
在我们日常刷短视频时能够常常看见有热心的网友分享关于写Prompt的基本逻辑，但内容顺序和方法各有特色，为了绝对的可靠咱们还是以官方的建议为标准:

主题+媒介+环境+照明+颜色+情绪+构图

总的来说:主体内容、背景环境、构图视角，风格和其他要求 (颜色氛围，构图)描述
但是，官方的一个书写逻辑是一个范本，我们可以完全遵循他的一个顺序，也可以适当的有所小的调整。

3、关于书写文本描述的建议

关于prompt的内容长短

MJ的图像生成逻辑基于对提示中的单词或短语进行拆解，与训练数据库进行对比，最终生成图像。因此，在描述时只需表达所需内容，无需单独阐述不需要的元素。
例如，如果你在描述卧室场景时提及花瓶，而MJ Bot却添加了你不需要的元素，你可以使用负权重-- no进行删除。这样的有效描述方法也在一定程度上能够简化文本内容。

在众多网友的分享中，我们会发现一长串英文提示词。经过仔细观察，我们会发现其中存在相似的词语、氛围词，或者冗长的主体描述。那么，这种做法是否正确呢？
让我们来看看官方的解释：Mj bot与人类不同，无法像人类一样理解语法、句子结构或单词；较少的词汇意味着每个词都承载着更重要的含义。

当你添加过多繁琐的描述时，后面的描述词逐渐失去重要性，甚至会失去准确性。

在一个赛博朋克的城市霓虹灯街道里有一家玩具店，里面的人很少，有一个小孩在玩具店的橱柜旁边看着琳琅满目的玩具，水平视角，中心构图，突出人物，色彩丰富，颜色绚丽明亮，皮克斯风格，卡通风格，迪士尼风格，3D设计，C4D设计，建模，盲盒，非常高质量的图片细节和内容，开心的表情【已翻译成中文】

3D设计，皮克斯卡通风格，一个10岁的小女孩在玩具店里看着玩具，背景是赛博朋克街道，背景虚化，人物边缘光，中心构图，人物特写，半身像，前景有光斑，色彩丰富，高质量，高细节【已翻译成中文】
不可否认图1出来的图片还不错，放大之后很多细节度也都在，但这并不是我们文案中所描述的画面。
MJ唯一的确定性就是他不具备确定性，但我可以通过有效的文本描述使这种不确定性相对可控，这也能极大地提高落地性。

学会加限定词

以一组图为例，尽管整体感觉还不错，但存在一个缺点，即图中的人物各不相同。他们在年龄和穿着方面有所差异。为了解决这个问题，我们可以适当添加一些补充描述或限定词，例如：20岁和JK制服。
(然而，有一个非常重要的问题，许多人喜欢使用一些像安慰剂一样的词汇，例如4K、8K、高细节、超高质量内容、清晰度等等。这些词汇有用吗？在某种程度上是有用的，但不要过度使用。如果你在描述中提到背景虚化，并同时强调高清晰度，那么这就会产生矛盾。)

图一的内容确实不错，但是在这一组图中，人物年龄，服装，人物占比各不相同看着难受，给他来点限制吧，可爱的小姐姐永不过时，穿着JK扫大街我觉得够可爱了吧。

内容描述具体

如果你想清楚地描述所需内容，你当然可以选择含糊其辞，但这将导致获得的内容多样化且具有随机性，无法得到你所需的具体细节。
例如，你可以说”一只猫“，但这并不具体；
或者当你想描述卧室的一角时，你可以简单地说它是一个温馨的卧室，有花瓶、床头柜和窗帘，这样的描述给予了MJ bot更多发挥的空间，也许会带来惊喜。
但如果你有特定的想法，不妨尝试这样的描述：这是一个温馨的卧室，床头柜呈深棕色，上面摆放着精致的水晶玻璃花瓶，花瓶里插着五朵香槟玫瑰，背景是垂落的窗帘......
事实上，这样的描述也隐含着对内容的一些限制，和之前所说的类似。

使用更为专业的词语

MJ并不像charGPT那么聪明，也不是那么愚笨。当你想描述背景虚化效果时，直接说需要背景虚化就可以了。
但是，如果你提到光圈F2.0和尼康，那就更加准确了。
你可以通过改变关键词来调整背景虚化的程度。
实际上，光圈和相机品牌的提及可以帮助获得更精确的结果。