另一次调整思路
- 问题汇总：

本章内容哈，已经是咱们研究AIGC技术结合实践工作需求的第三章了

大家看过前两章节的，应该都对AIGC有了一个比较模糊的概念

这次咱们就做模拟设计一个大型KV的主视觉内容

无论是难度系数还是设计强度都远比之前大很多

SA大分享-大型KV的主视觉内容翻车过程 - 图1

设计需求如图所示

活动目的：

爱奇艺超级福利节的重点在于福利节

目的是通过福利活动来提高拉新转化率

因此根据爱奇艺产品特点及会员权益特点来构思画面

这次内容，之前喵喵同学就已经做过一个比较高质量的结课作业了

SA大分享-大型KV的主视觉内容翻车过程 - 图2

当时给她的评分是80-85分之间的水平档次

属于不算特别出众，创意也很平庸

但是视觉质量和整体画面效果都还是说的过去，中规中矩

本次尝试是希望在AI辅助的情况下

提升设计创意与视觉效果，将原版的80分创作提高到90分的水平档次

就是同一个设计师，同技术段位的情况下，AIGC能不能赋能

这就是见真章的时候了

首先在场景构思这个方面

以下图为参考，用辐射构图作为画面构图形式

SA大分享-大型KV的主视觉内容翻车过程 - 图3

为什么这么说了

因为很多设计师都有一个比较明显的习惯

这种习惯类似于集邮的概念

比较喜欢尝试之前自己没有做过的构图和设计方向

但是自身能力上往往水平不足，对参考图的分析理解是有很大误区的

这次选择这张强透视的图

其实喵喵同学就是这个习惯

因为之前不会做，不敢做，这次有了AIGC技术加持的情况下

胆子就大了，就想挑战一下自己的软肋

整体画面的视觉聚集性比较强，强透视结构

这张图已经超出她水平120%了

就这，还要再加入一个新的创意概念

用舞台剧为载体，让元素从单独场景汇入画面中心

SA大分享-大型KV的主视觉内容翻车过程 - 图4

将每个场景与整个画面融合并互动起来

大致的草图思路是这样：四周为不规则摆放的手机载体，将人物场景放置在手机上，汇聚到画面中心；

画面中心是标题及爱奇艺播放器，向外飞出拟人化 VIP 精灵与场景互动

SA大分享-大型KV的主视觉内容翻车过程 - 图5

你们细品一下，这意思是我和科比合砍81分的节奏了

AIGC不是哆啦A梦，你也不是大熊，是没办法做出超出自身认知的设计图的

单独场景以手手机轮廓为载体+舞台剧的形式

SA大分享-大型KV的主视觉内容翻车过程 - 图6

SA大分享-大型KV的主视觉内容翻车过程 - 图7

SA大分享-大型KV的主视觉内容翻车过程 - 图8

SA大分享-大型KV的主视觉内容翻车过程 - 图9

在进一步的构思过程中

中心元素：以爱奇艺播放器为核心，高亮突出

影视场景：选取热门影视资源场景，以由远及近、细节饱满到细节模糊的效果向中心聚拢

会员拟人化：将普通、黄金、白金、体育、FUN、星钻会员拟人化，将VIP精灵从中心飞出，与各场景互动

权益展示：以红包、金币等形式强调爱奇艺超级福利节

展示卖点：VIP限时买1送3，一键实现会员自由，三倍快乐惊喜不停，突出活动福利内容

配色：以夏日清爽配色蓝色、黄色为主，以同色系颜色作为辅助色，以爱奇艺品牌色绿色强调活动主题

整体的构思上面还是挺有想法的

但是到这一步哈，思路一直停留在一个抽象的概念上

不够具体，脑海里面的画面感也比较弱

这就是我们俗称的“思路不清晰”

在具体的构成过程中，选择的素材内容包括

从爱奇艺的热门影视中挑选出经典剧照或标志性造型来作单独场景

SA大分享-大型KV的主视觉内容翻车过程 - 图10

SA大分享-大型KV的主视觉内容翻车过程 - 图11

SA大分享-大型KV的主视觉内容翻车过程 - 图12

SA大分享-大型KV的主视觉内容翻车过程 - 图13

《周处除三害》、《狐妖小红娘》、《种地吧少年》、《青春环游记》等热门影视及综艺

视觉风格上，选择妖怪屋的卡通剪纸造型作为插画的设计风格

SA大分享-大型KV的主视觉内容翻车过程 - 图14 SA大分享-大型KV的主视觉内容翻车过程 - 图15 SA大分享-大型KV的主视觉内容翻车过程 - 图16

走到这一步，其实你们也感受到了把

设计者依旧没有解决一个硬伤问题

就是自己到底要画成什么样子的图，是完全没有概念的，把握不住的

在这种情况下，急于求成的开始用MJ抽卡，风险就非常的高

使用describe直接描述画面

SA大分享-大型KV的主视觉内容翻车过程 - 图17

SA大分享-大型KV的主视觉内容翻车过程 - 图18

通过参考图，可以直接得到一下几组词缀

SA大分享-大型KV的主视觉内容翻车过程 - 图19 SA大分享-大型KV的主视觉内容翻车过程 - 图20

可以看出，这些关键词没什么实际帮助，因为画面的元素内容是不可用的，不需要画面中元素的prompt提示

因此挑战了一下思路，改为询问ChatGPT 来获取参考图中的构成形式的描述

SA大分享-大型KV的主视觉内容翻车过程 - 图21

SA大分享-大型KV的主视觉内容翻车过程 - 图22

这个高清大图，大家应该能看清楚了，可以看出，由于问题的指向性不够明确，ChatGPT从多个角度进行了全面分析，但是又没什么重点

需要提高问题的指向性，提供更精准的描述

继续提问“请帮我只从构图布局上来详细分析

SA大分享-大型KV的主视觉内容翻车过程 - 图23

在这一步，ChatGPT虽然提供了构图分析

但这些分析基于图例，无法直接帮助我生成新图片的prompt

意思就是，AI工具只能被动按照你的思路来阐述结果内容

不能产生破局的新方向

这对于创意设计就非常的致命

由于设计者本身也有点思路不清晰，仍在构思阶段对具体画面没有确定想法

也无法提供详细信息，因此需要ChatGPT直接给出一个可以尝试的prompt

从这一步开始，整个设计的走向，就完全随机化了

这一步，我按照历史性的角度给你们解析一下，就是签了一个丧权辱国的辛丑条约了

设计的主动权完全不在设计师手里了，全凭AI去掌握设计节奏了，也为后续的发展埋下了伏笔

问题：如果我想用Midjourney生成一张这样构图布局的画面，我应当怎么写prompt？

图片参考

SA大分享-大型KV的主视觉内容翻车过程 - 图24

生成结果

SA大分享-大型KV的主视觉内容翻车过程 - 图25

SA大分享-大型KV的主视觉内容翻车过程 - 图26

可以看到ChatGPT生成了一段详细的prompt，并从整体、布局、前景、中景、背景、色彩、风格、细节等方面分析了画面构成

这段prompt过长，不符合Midjourney的prompt书写规范

包含了许多无效词汇

因此，需要对这段prompt进行精简，并用更专业的词组进行优化

这个过程，真的非常耗时，也需要设计者不断地纠正词缀

可不比直接做设计轻松哦

继续追问ChatGPT：请帮我将这段prompt用更精简、更专业的词组优化

这里GPT的模型迭代中，已经能高度适配MJ的书写规范了

所以直接这么说，GPT是能懂你意思的

SA大分享-大型KV的主视觉内容翻车过程 - 图27

可以看到，虽然prompt经过精简，但仍不符合书写规范

且存在很多无效词汇，仍需进一步优化

问题：

请帮我将这段prompt用更精简、更专业的词组优化

你看看设计者像不像大熊，AIGC像不像哆啦A梦

SA大分享-大型KV的主视觉内容翻车过程 - 图28

这一次结果已有显著优化，prompt结构大为精简

但仍需进一步去掉其中不需要的具体元素描述

将prompt中的符号替换为“，”分解长句，优化结构

SA大分享-大型KV的主视觉内容翻车过程 - 图29

去掉不需要的描述，并替换需要的元素

SA大分享-大型KV的主视觉内容翻车过程 - 图30

由于在Midjourney的prompt书写规范中，冒号通常不具备特殊作用

Midjourney的prompt书写主要依靠简洁明了的描述和关键词来定义图像内容

使用冒号可能不会对生成结果产生实际影响

因此最好使用简洁的描述来明确表达需求，所以再次进行替换

SA大分享-大型KV的主视觉内容翻车过程 - 图31

最终调整之后的可行性词缀是这样

Dramatic, intricate illustration, Central stage, radial composition, characters, Gold coin and Red packet decorations, decorations, contrast for tension, vintage Style, fantasy Style, mystery, balance, dynamic elements floating elf, cohesive, engaging, surrealism, Symmetry

风险警告哈，以上词缀表面上是设计者的思路想法，实际上全是AIGC产出的想法结果，过程中设计者只是不断完善了词缀的语法问题，直接使用/imagine生成

SA大分享-大型KV的主视觉内容翻车过程 - 图32

可以看到画面好看是好看，但与爱奇艺的创意KV毫不相干

使用/imagine的垫图功能

参考垫图

SA大分享-大型KV的主视觉内容翻车过程 - 图33

生成结果

SA大分享-大型KV的主视觉内容翻车过程 - 图34

从生成结果来看

还是好看没什么实际用途

使用—sref风格参考指令，并添加—ar 16:9

SA大分享-大型KV的主视觉内容翻车过程 - 图35

越来越离谱了，场面完全失控了

如果这是一个工作需求，这个时候已经是无法挽救的地步了

要么扣工资，要么准备打辞职报告了

设计者还想试一下，重新调整prompt并使用sref

由于不知道是哪些词造成了画面偏差，因此尝试去掉几个可能影响画面的prompt

SA大分享-大型KV的主视觉内容翻车过程 - 图36

这一步，就完全是英语考试猜ABCD选择题了

SA大分享-大型KV的主视觉内容翻车过程 - 图37

结果基本没多大变化

再次使用垫图功能：参考图

SA大分享-大型KV的主视觉内容翻车过程 - 图38

SA大分享-大型KV的主视觉内容翻车过程 - 图39

事已至此，已成艺术，越来越抽象了

使用prompt直接生成图片

SA大分享-大型KV的主视觉内容翻车过程 - 图40

不能说是跟本次需求毫无关系吧，至少是八竿子打不着了

可以看出，过度依赖ChatGPT和Midjourney是无法生成，设计者自己也不清楚的画面效果的

无法根据经验调整prompt的准确性，也难以把控最终的画面效果

那么调整一下思路

这一次以生成单独场景为目标，从局部去描述prompt

本次选取乐队节目作为画面元素

SA大分享-大型KV的主视觉内容翻车过程 - 图41

A square frame, There’s a band singing up there, Paper-cut wind, Flat illustration, Simple modeling, Bright color, Lively atmosphere, White background —ar 16:9

这组词，也是一拍脑袋搞的东西

根本禁不起推敲，也没有好好构思

生成的结果也很随机

SA大分享-大型KV的主视觉内容翻车过程 - 图42

又进行了垫图处理

参考图是

SA大分享-大型KV的主视觉内容翻车过程 - 图43

结果稍微看得过去了

SA大分享-大型KV的主视觉内容翻车过程 - 图44

右上人物清晰，造型稳定，但风格偏向二次元漫画

左下人物风格更偏3D

右下生成了多个人物，但比例不一致，风格也偏向二次元漫画

综合来看，左上图更符合剪纸风格的简单造型，因此选择左上图来生成变体

SA大分享-大型KV的主视觉内容翻车过程 - 图45

生成结果

SA大分享-大型KV的主视觉内容翻车过程 - 图46

这一步的四个生成结果没有差别

人物造型过于复杂，头发和衣服不稳定

虽然这些结果较为符合剪纸风格的造型，但可用性很差，调整难度颇大

进一步调整尺寸，生成单一人物造型

上图中的四个画面，人物形象较符合剪纸风格

但画面中存在很多无用的辅助图形

因此，尝试去掉尺寸限制，使用1:1比例

希望在这种情况下，画面重点能更集中在人物造型上

SA大分享-大型KV的主视觉内容翻车过程 - 图47

生成的人物造型受到《阴阳师》妖怪屋的影响较大

右上和左下的造型过于接近妖怪屋人物造型

左上的人物头部兽化，四肢生成比较混乱

右下人物造型较为稳定，与乐器互动良好，因此选择右下图进行进一步变体

SA大分享-大型KV的主视觉内容翻车过程 - 图48

加入Guitarist, vocalist, bass player, drums乐队人员描述

由于尺寸大小对画面没有改善，这里重新加入16:9的尺寸参数

A square frame, There’s a band singing up there, Guitarist, vocalist, bass player, drums,Paper-cut wind, Flat illustration, Simple modeling, Bright color, Lively atmosphere, White background —ar 16:9

SA大分享-大型KV的主视觉内容翻车过程 - 图49

生成的图像质量不如上一张，人物造型较复杂且图像效果不佳

这好不容易看到点希望，又瞬间打回原形了

到这里，设计者的心态就完全炸裂了

开始病急乱投医了，盲目生图

在调整思路的过程中，由于无法明确预期效果

因此难以提供具体的调整和优化方向

只能依赖Midjourney生成图片，希望能随机抽卡获得符合预期的作品

找了各种风格的参考图

SA大分享-大型KV的主视觉内容翻车过程 - 图50

SA大分享-大型KV的主视觉内容翻车过程 - 图51

生成结果

SA大分享-大型KV的主视觉内容翻车过程 - 图52

SA大分享-大型KV的主视觉内容翻车过程 - 图53

SA大分享-大型KV的主视觉内容翻车过程 - 图54

陷入了不断生成图片的死循环，产生了很强烈的赌徒心理，导致思路更加混乱

然后这个方向就彻底放弃了

SA大分享-大型KV的主视觉内容翻车过程 - 图55

尽管通过生成的变体作为参考，可以精确描述人物形象以获得准确的素材并组合场景完成绘制

但是这种情况下哈，是在有具体构思和画面草图时才需要的步骤

单纯生成某个局部画面并不能帮助设计者构思全局，仍然无法解决问题

另一次调整思路

describe电影经典场景

这一次选取《周处除三害》的名场面进行describe描述

SA大分享-大型KV的主视觉内容翻车过程 - 图56

SA大分享-大型KV的主视觉内容翻车过程 - 图57 SA大分享-大型KV的主视觉内容翻车过程 - 图58

这一步生成了非常不准确的描述

但是相比之下，第四条的描述略显精准，因此选取第四条作为修改的基础prompt

A cinematic still of the stage where a long haired rock band plays in all white while in front of them on ground covered with sausages and pieces of meat there is a huge painting of Thomas Beaudoin dressed as God who stands on his throne playing guitar and singing to godlike creatures lying around him, the room has red curtains, pink walls and wooden floors, the lighting is warm, shot in the style of Stanley Kubrick

Stanley Kubrick是20世纪最著名的导演之一

他的作品视觉独特，非常具有美感

SA大分享-大型KV的主视觉内容翻车过程 - 图59