什么是 Prompt 提示词
:::info 提示词是我们与 AI 科学高效沟通的桥梁,有点像魔咒一样,输入一段神奇的词语,AI 会将你的想法变成现实
:::
prompt 顾名思义是”提示词”的意思,在 AI 文生图中用于指导 AI 生成过程,告诉 AI 你想要的画面效果。不知道多少人和我一样,写提示词的时候脑袋一空,只能想出来 girl, cute, forest ,sun, sea, flowers 这样单调的词汇,生成出来图的效果自然差强人意。
和提问的艺术一样,你提的问题越精确上下文越充足越能得到想要的回答,Prompt 也有一套自己的逻辑,你提供的 prompt 越能精确表达自己的意图就越容易得到自己想要的图,所生成的图像质量也就越高,或者说生成优质画作的概率就越高,毕竟 AI 生成图片具有随机性。
文生图 & 图生图中的提示词
在 SD 中两种主要绘制图片的方式,一个是文生图,一个是图生图。文生图就是主要通过文字来和 AI 沟通:
而图生图还可以通过图片来传达信息,在图生图中也有提示词,而且同样重要。
示例生成
提示词的内容是非常广泛的,它可能包括作品主题,画风,形象特点以及一些具体包含的要素。以下面左图为例,使用的是比较流行的 AOM 橘子模型,配置如右图所示,下面绿色块部分为正向提示词,已经大体分类:
画质标准化:
:::color2 masterpiece, best quality, ultra-detailed, illustration,
:::
画面主题:
:::color2 1girl, solo, outdoors, camping, night, mountains, nature, stars, moon, tent, twin ponytails, green eyes, cheerful, happy, backpack, sleeping bag, camping stove, water bottle, mountain boots, gloves, sweater, hat, flashlight,forest, rocks, river, wood, smoke, shadows, contrast, clear sky, constellations, Milky Way,
:::
氛围修饰:
:::color2 peaceful, serene, quiet, tranquil, remote, secluded, adventurous, exploration, escape, independence, survival, resourcefulness, challenge, perseverance, stamina, endurance, observation, intuition, adaptability, creativity, imagination, artistry, inspiration, beauty, awe, wonder, gratitude, appreciation, relaxation, enjoyment, rejuvenation, mindfulness, awareness, connection, harmony, balance, texture,
:::
风格特点:
:::color2 detail, realism, depth, perspective, composition, color, light, shadow, reflection, refraction, tone, contrast, foreground, middle ground, background, naturalistic, figurative, representational, impressionistic, expressionistic, abstract, innovative, experimental, unique
:::
负向提示词是:
:::danger (worst quality, low quality:1.4), (realistic, lip, nose, tooth, rouge, lipstick, eyeshadow:1.0), (dusty sunbeams:1.0),, (abs, muscular, rib:1.0), (depth of field, bokeh, blurry:1.4), (greyscale, monochrome:1.0), text, title, logo, signature,watermark,
:::
提示词类型
提示词分两种类型,正向提示词和反向提示词。正向提示词:告诉 AI 你想生成的图是什么样的,比如
正向提示词示例
(RAW photo, best quality), (realistic, photo-realistic:1.3), masterpiece, an extremely delicate and beautiful, extremely detailed, CG, unity , 2k wallpaper, Amazing, finely detail, light smile, extremely detailed CG unity 8k wallpaper, huge filesize, ultra-detailed, highres, absurdres, soft light, (((medium hair:1.3), short bang, pink hair, floating hair novafrogstyle)), beautiful detailed girl, detailed fingers, extremely detailed eyes and face, beautiful detailed nose, beautiful detailed eyes, long eyelashes, light on face, looking at viewer, (closed mouth:1.2), 1girl, cute, young, mature face, (full body:1.3), ((small breasts)), realistic face, realistic body, beautiful detailed thigh, (ulzzang-6500-v1.1:0.8), <lora:koreanDollLikeness_v15:0.4>, business suit, cross-laced clothes, collared shirt, open clothes, in office, detailed office, open cardigan, black thighhighs, miniskirt, black underwear, unbuttoned shirt,
反向提示词示例
paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans, extra fingers, fewer fingers, ((watermark:2)), (white letters:1), (multi nipples), bad anatomy, bad hands, text, error, missing fingers, missing arms, missing legs, extra digit, fewer digits, cropped, worst quality, jpeg artifacts, signature, watermark, username, bad feet, {Multiple people}, blurry, poorly drawn hands, poorly drawn face, mutation, deformed, extra limbs, extra arms, extra legs, malformed limbs, fused fingers, too many fingers, long neck, cross-eyed, mutated hands, polar lowres, bad body, bad proportions, gross proportions, wrong feet bottom render, abdominal stretch, briefs, knickers, kecks, thong, {{fused fingers}}, {{bad body}}, bad-picture-chill-75v, ng_deepnegative_v1_75t, EasyNegative, bad proportion body to legs, wrong toes, extra toes, missing toes, weird toes, 2 body, 2 pussy, 2 upper, 2 lower, 2 head, 3 hand, 3 feet, extra long leg, super long leg, mirrored image, mirrored noise, (bad_prompt_version2:0.8), aged up, old
语法规则
通过英文书写
由于模型是通过英文进行训练的,所以提示词请通过英文进行书写,如果不太行可以求助翻译软件:
以词组为单位
它不需要像真正的句子一样有完整的语法结构,词组与词组之间使用 ,
进行分隔,比如你要描述”一个在森林里漫步的女孩,阳光洒在她身上“可以这样描述 1girl, forest, path, walking ,sun, sunshine, sunshine on body
,另外提示词可换行,多行和多个空格会被识别为 1 个。
提示词权重
有时候我们输入了提示词进去 AI 不一定 get 到你最想要的是什么,比如你特别想要”白色的花”,可以通过提示词权重的方式将白花的优先级增强。提示词权重分配有两种方式,一种是套括号,另一种是括号加数字:
:::color2 括号加数字,直接调整全速,例如: (white flower: 1.5),或者 (white flower: 0.8) 加强或者减弱提示词
:::
:::color2 圆括号:每套一层,额外 x 1.1 倍,例如:(((white flower))) 权重为 1.1 1.1 1.1 = 1.331
:::
:::color2 大括号:每套一层,额外 x 1.05 倍,例如:{{{white flower}}} 权重为 1.05 1.05 1.05 = 1.15
:::
:::color2 方括号:每套一层,额外 x 0.9 倍,例如:[[[white flower]]] 权重为 0.9 0.9 0.9 = 0.729
:::
另外关于提示词权重还有这些注意事项:
:::color2 prompt 提示词越往前,它的权重越大
:::
:::color2 提示词权重不宜过大,容易使画面崩坏,在 0.5 ~ 1.5 之间为宜
:::
…其他还有提示词进阶语法,混合,迁移,迭代等。
内容分类
提示词根据其描述作用不同可以分为 内容提示词
, 画质提示词
和 画风提示词
等。
内容提示词
内容型提示词是描述画面内容的提示词,可以按下面的分类去细化:
画质提示词
如果只有内容型的提示词,画出来的作品大概率无法让自己满意,会觉得不清晰,细节不够等。我们可以通过画质提示词让 AI 生成时更多参考这类高画质的提示词去生成。
画风提示词
画风也就是作品的艺术风格,写实性风格更依赖于基于真实照片训练的模型。
通用模板
一个 AI 能够读懂的好咒语应该是内容充实丰富且画面具有清晰标准的,可以通过下面的通用模板来修改里面的每一段内容,仔细看是不是想一篇小作文?
怎么写好小作文?
如何编写准确的提示词来描述自己想要生成的画面对普通人而言并不那么容易,即使是了解了以上的规则后包括我自己也依然难以准确向 AI 描述自己想要的画面,这里提供几种辅助生成提示词的方式。
提示词生成器
AI 绘画出来已经有一段时间了,网上有不少辅助工具,比如:
AI绘画提示词生成器 - 一个工具箱 - 好用的在线工具都在这里!
要注意的一点是思路不要被这些工具限制住了。
用 ChatGPT 帮你生成提示词
将下面一段角色扮演的提示词喂给 ChatGPT,然后问他即可,可以根据自己的需要微调喂给 chatgpt 的提示词。
从现在开始你将扮演一个stable diffusion的提示词工程师,你的任务是帮助我设计stable diffusion的文生图提示词。你需要按照如下流程完成工作。1、我将给你发送一段图片情景,你需要将这段图片情景更加丰富和具象生成一段图片描述。并且按照“【图片内容】具像化的图片描述”格式输出出来;2、你需要结合stable diffusion的提示词规则,将你输出的图片描述翻译为英语,并且加入诸如高清图片、高质量图片等描述词来生成标准的提示词,提示词为英语,以“【正向提示】提示词”格式输出出来;3、你需要根据上面的内容,设计反向提示词,你应该设计一些不应该在图片中出现的元素,例如低质量内容、多余的鼻子、多余的手等描述,这个描述用英文并且生成一个标准的stable diffusion提示词,以“【反向提示】提示词”格式输出出来。4、你需要提示我在生成图片时需要设置的参数以及给我推荐一个使用的模型以及生成这张图片的最优长宽比例,按照“【参数】Sampling method:参数;Sampling steps:参数;CFG Scale:参数;Seed:参数;最优长宽比:参数”的格式输出给我,其中需要注意的是Sampling method参数请在如下列表中选择“Euler a,Euler,LMS,Heun,DPM2,DPM2a,DPM++ 25 a,DPM++ 2M,DPM++ SDE,DPM fast,DPM adaptive,LMS Karras,DPM2 Karras,DPM2 a Karras,DPM++ 2S a Karras,DPM++ 2M Karras,DPM++ SDE Karras,DDIM,PLIMS,UniPC)”。例如:我发送:一个二战时期的护士。你回复:
【图片内容】一个穿着二战期间德国护士服的护士,手里拿着一个酒瓶,带着听诊器坐在附近的桌子上,衣服是白色的,背后有桌子。
【正向提示】A nurse wearing a German nurse's uniform during World War II, holding a wine bottle and a stethoscope, sat on a nearby table with white clothes and a table behind,full shot body photo of the most beautiful artwork in the world featuring ww2 nurse holding a liquor bottle sitting on a desk nearby, smiling, freckles, white outfit, nostalgia, sexy, stethoscope, heart professional majestic oil painting by Ed Blinkey, Atey Ghailan, Studio Ghibli, by Jeremy Mann, Greg Manchess, Antonio Moro, trending on ArtStation, trending on CGSociety, Intricate, High Detail, Sharp focus, dramatic, photorealistic painting art by midjourney and greg rutkowski;【反向提示】cartoon, 3d, ((disfigured)), ((bad art)), ((deformed)),((extra limbs)),((close up)),((b&w)), wierd colors, blurry, (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck))), Photoshop, video game, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross-eye, body out of frame, blurry, bad art, bad anatomy, 3d rende;
【参数】Sampling method:DPM++ 2M Karras;Sampling steps:20;CFG Scale:7;Seed:639249185;最优长宽比:3:4 现在我的第一个图片场景如下:一个海边抽烟的男人
回复示例:
抄作业
:::info 抄作业时可以做对照实验,比如挑一张你喜欢的图,然后先用自己的语言描述一遍,然后再对比一遍其真正的提示词,对比两者的差别,可以逐渐掌握技巧。
:::
在一些模型网站和一些绘画分享网站上很多用户会主动分享自己作图使用的提示词和模型参数等信息,帮助大家获得类似的出图效果,这里首先推荐 C 站:
比如你想复刻某个模型下的出图效果可以参考:
其他网站比如 OpenArt :
https://lexica.art/,lexica 可以通过图搜索相似图:
其他辅助工具
从图片中获取提示词
如果已有心仪的参考图片,可以从已有的参考图中反推 tag,或者从已有生成的图中获取生成信息,均可获得比较良好的提示词参考:
Tag 自动补全
这个插件可以根据用户输入自动给出高频提示词补全,非常方便。
Prompt 自动生成器
可以根据一小段描述自动生成和完善 prompt,本质上也是 GPT。
….
参考
20分钟搞懂Prompt与参数设置,你的AI绘画“咒语”学明白了吗? | 零基础入门Stable Diffusion·保姆级新手教程 | Prompt关键词教学_哔哩哔哩_bilibili