提示词反推

在 webui 中提示词部分很多人都存在一个困扰,就是不清楚如何填写提示词比较好:

🍽 提示词反推 + 图片信息获取 - 图1

但是你有一张你想要生成的参考图片,图片中包含你想要描述的内容,但是你不能准确通过提示词准确描述自己想要的画面,这个时候可以通过反推提示词来实现。

🍽 提示词反推 + 图片信息获取 - 图2

在图生图 tab 下,有两个按钮“CLIP 反向推导提示词”和“DeepBooru 反向推导提示词”。注意第一次使用这两个功能时会比较慢,功能没有预安装,需要在线获取

🍽 提示词反推 + 图片信息获取 - 图3

CLIP 反推

我们将图片拖进去之后,点击 CLIP 反向推导提示词:

🍽 提示词反推 + 图片信息获取 - 图4

过一会提示词输入框中就会出现反推的提示词:

  1. a girl in a short skirt and a white shirt is standing in front of a fence and flowers on the side of a building, Aguri Uchida, official art, a screenshot, graffiti

可以发现提示词前面部分是对画面的描述,比较偏自然语言的风格

DeepBooru 反推

我们再试试 DeepBooru 反推:

🍽 提示词反推 + 图片信息获取 - 图5

可以发现 DeepBooru生成的提示词是由一个个单词所构成,像是给图片打了很多标签,生成量上比 CLIP 更多。

  1. 1girl, blue_sailor_collar, blue_skirt, blue_sky, blush, brown_hair, building, bush, cityscape, cloud, cowboy_shot, day, fence, field, flower, flower_field, from_side, garden, grass, house, hydrangea, looking_at_viewer, neckerchief, outdoors, pink_flower, plant, pleated_skirt, purple_eyes, purple_flower, red_neckerchief, road, sailor_collar, school_uniform, serafuku, short_hair, short_sleeves, skirt, sky, solo, stairs, thighhighs, white_legwear

模型对比和使用建议

两种模型生成的提示词对比如下,都是可以对我们描述提示词提供一个不错的思路:

🍽 提示词反推 + 图片信息获取 - 图6

  • 在多数情况下,动漫模型在训练时采用的是 DeepBooru ,所以如果你想要生成二次元图片时,可以更多采用 DeepBooru
  • 而在训练写实模型时更多采用的时 CLIP 进行的标记,所以如果你想要生成写实的图片时,可以更多采用CLIP

图片信息获取

在使用 sd-webui 偶尔会出现这样的情况,以前生成过一张图片,但是现在你不记得或者记不清当时是如何设置这些参数的,那么这时候就可以通过 sd-webui 提供的图片信息功能来获取这张图片当时生成时所获取的参数:

  • 同样你有一张别人生成的图也可以通过这种方式获得图片参数。
  • 注意如果对图片做过处理则这些生成信息会丢失,比如通过 PS 另存为。

🍽 提示词反推 + 图片信息获取 - 图7

比如上面这张图片所提供的参数:

  1. parameters
  2. <lora:fashionGirl_v50:0.66>, <lora:koreanDollLikeness_v10:0.2>, (masterpiece:1.4), (best quality:1.4), realistic, 1gril, solo, ((light blue hair)), hair ornament, long hair, blue eyes, collarbone, portrait, red lips, parted lips, (cleavage, pleated skirt), small breasts, blue nails, necklace, earrings, fashi-girl, looking at viewer, professional light, night, rain, outdoors, <lora:shojovibe_v11:0.7>,
  3. Negative prompt: easynegative, four fingers, fewer fingers, extra fingers, (extra hands), sketches, (low quality:2), (worst quality:2), skin spot, age spot, nipples, glans, skin blemishes, ((freckle)), ((greyscale)), ((monochrome)), nsfw, watermark,
  4. Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 2688169167, Size: 450x752, Model hash: f713bab753, Model: yesmix_v15, Denoising strength: 0.55, Clip skip: 2, Hires upscale: 2, Hires steps: 21, Hires upscaler: Latent

之后你可以将这些参数发送到“文生图”,“图生图”…中,注意模型不会自动设置主模型,然后重新生成:

🍽 提示词反推 + 图片信息获取 - 图8

之所以有这些信息是因为我们在设置 => 保存图像/宫格图 中默认勾选了“将有关生成参数的文本信息,以块的形式保存到PNG图片文件中”。如果你不想将参数打进去可以去掉勾选。

🍽 提示词反推 + 图片信息获取 - 图9

参考

bilibili