图像生成

图像生成节点类别。用于AI生成图像的任务。

Stable Diffusion

生成h - 图1

该节点可以使用 Stable Diffusion 模型生成图像,采用 Stability.ai 的官方接口。

参数详解

提示词

支持列表输入 用于生成图像的提示词,目前支持英文输入。

负面提示词

支持列表输入 不希望出现在图像中的内容,目前支持英文输入。

模型

目前支持 Stable Diffusion 官方模型:
  • Ultra
  • Stable Diffusion 3 Large
  • Stable Diffusion 3 Large Turbo
  • Stable Diffusion 3 Medium
  • Core
  • SDXL 1.0
  • SDXL 0.9
已弃用模型:
  • SDXL 0.8
  • stable-diffusion-v1-5
  • stable-diffusion-512-v2-1
  • stable-diffusion-768-v2-1

提示遵循强度

即 CFG_SCALE 参数,用于控制提示词的强度,数值越高则模型越遵循提示词进行生成。 v2 模型对 4~8 的数值有较好的效果,v1 模型对 7~14 的数值有较好的效果。 可接受的数值范围为 1~35。

采样器

Stable Diffusion 的采样方法,偏技术,有进阶需求的用户可自行调整。 不同的采样器会影响生成图像的质量和生成速度。

宽度和高度

  • <font style="color:rgb(31, 35, 40);">SDXL 1.0</font> <font style="color:rgb(31, 35, 40);">SDXL 0.9</font>
    • <font style="color:rgb(31, 35, 40);">1024 x 1024</font>
    • <font style="color:rgb(31, 35, 40);">1152 x 896</font>
    • <font style="color:rgb(31, 35, 40);">896 x 1152</font>
    • <font style="color:rgb(31, 35, 40);">1216 x 832</font>
    • <font style="color:rgb(31, 35, 40);">832 x 1216</font>
    • <font style="color:rgb(31, 35, 40);">1344 x 768</font>
    • <font style="color:rgb(31, 35, 40);">768 x 1344</font>
    • <font style="color:rgb(31, 35, 40);">1536 x 640</font>
    • <font style="color:rgb(31, 35, 40);">640 x 1536</font>
  • <font style="color:rgb(31, 35, 40);">Ultra</font>, <font style="color:rgb(31, 35, 40);">Stable Diffusion 3 Large</font>, <font style="color:rgb(31, 35, 40);">Stable Diffusion 3 Large Turbo</font>, <font style="color:rgb(31, 35, 40);">Stable Diffusion 3 Medium</font>, <font style="color:rgb(31, 35, 40);">Core</font>
    • <font style="color:rgb(31, 35, 40);">16:9</font>
    • <font style="color:rgb(31, 35, 40);">1:1</font>
    • <font style="color:rgb(31, 35, 40);">21:9</font>
    • <font style="color:rgb(31, 35, 40);">2:3</font>
    • <font style="color:rgb(31, 35, 40);">3:2</font>
    • <font style="color:rgb(31, 35, 40);">4:5</font>
    • <font style="color:rgb(31, 35, 40);">5:4</font>
    • <font style="color:rgb(31, 35, 40);">9:16</font>
    • <font style="color:rgb(31, 35, 40);">9:21</font>

输出类型

用于控制输出端口的输出格式。
  • 仅链接文字 - 输出端口的内容只有链接字符串,不适合直接作为 Markdown 格式呈现。
  • Markdown
    • 以 Markdown 格式输出,适合直接作为 Markdown 格式呈现。
    • 格式:<font style="color:rgb(31, 35, 40);">![image](链接字符串)</font>
  • HTML
    • 以 HTML 格式输出。
    • 格式:<font style="color:rgb(31, 35, 40);"><img src="链接字符串" /></font>

输出类型

<font style="color:rgb(31, 35, 40);">字符串</font> | <font style="color:rgb(31, 35, 40);">列表</font>

当提示词或负面提示词是列表时,输出类型为列表。

积分消耗

根据图像尺寸、采用模型、生成数量决定。
  • Ultra - 400 积分/张
  • Stable Diffusion 3 Large - 325 积分/张
  • Stable Diffusion 3 Large Turbo - 200 积分/张
  • Stable Diffusion 3 Large Medium - 175 积分/张
  • Core - 150 积分/张
  • SDXL 1.0 - 根据尺寸不同积分消耗不同,约 10 积分/张
  • SDXL 0.9 - 根据尺寸不同积分消耗不同,约 80 积分/张

Dall·E

生成h - 图2

OpenAI 最强大的图像生成模型。可根据用户最近的提示词生成具有复杂细节的高质量图像。

参数详解

提示词

支持列表输入 用于生成图像的提示词。

模型

目前支持 Dall·E 模型:
  • Dall·E 3

尺寸

  • 1024x1024
  • 1792x1024
  • 1024x1792

品质

  • standard
  • hd - HD模式可以创建出具有更精细细节和图像内部一致性更高的图片。

风格

  • vivid - 使得模型倾向于生成超真实和戏剧性的图像。
  • natural - 使得模型生成更自然、不那么超真实的图像。

输出类型

用于控制输出端口的输出格式。
  • 仅链接文字 - 输出端口的内容只有链接字符串,不适合直接作为 Markdown 格式呈现。
  • Markdown
    • 以 Markdown 格式输出,适合直接作为 Markdown 格式呈现。
    • 格式:<font style="color:rgb(31, 35, 40);">![image](链接字符串)</font>
  • HTML
    • 以 HTML 格式输出。
    • 格式:<font style="color:rgb(31, 35, 40);"><img src="链接字符串" /></font>

输出类型

<font style="color:rgb(31, 35, 40);">字符串</font> | <font style="color:rgb(31, 35, 40);">列表</font>

当提示词或负面提示词是列表时,输出类型为列表。

积分消耗

每张图片消耗 100 积分。

可图

生成h - 图3

可图大模型是由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型。Kolors 在数十亿图文对下进行训练,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面,相比于开源/闭源模型,都展示出了巨大的优势。同时,Kolors 支持中英双语,在中文特色内容理解方面更具竞争力。

参数详解

提示词

支持列表输入 用于生成图像的提示词,目前支持英文输入。

负面提示词

支持列表输入 不希望出现在图像中的内容,目前支持英文输入。

宽度和高度

数字,范围 512 ~ 2048

迭代步数

数字,范围 1 ~ 50

提示遵循强度

即 CFG_SCALE 参数,用于控制提示词的强度,数值越高则模型越遵循提示词进行生成。 可接受的数值范围为 0~20 。

噪声调度器

支持的噪声调度器有:
  • EulerDiscreteScheduler
  • EulerAncestralDiscreteScheduler
  • DPMSolverMultistepScheduler
  • DPMSolverMultistepScheduler_SDE_karras
  • UniPCMultistepScheduler
  • DEISMultistepScheduler

输出类型

用于控制输出端口的输出格式。
  • 仅链接文字 - 输出端口的内容只有链接字符串,不适合直接作为 Markdown 格式呈现。
  • Markdown
    • 以 Markdown 格式输出,适合直接作为 Markdown 格式呈现。
    • 格式:<font style="color:rgb(31, 35, 40);">![image](链接字符串)</font>
  • HTML
    • 以 HTML 格式输出。
    • 格式:<font style="color:rgb(31, 35, 40);"><img src="链接字符串" /></font>

输出类型

<font style="color:rgb(31, 35, 40);">字符串</font> | <font style="color:rgb(31, 35, 40);">列表</font>

当提示词或负面提示词是列表时,输出类型为列表。

积分消耗

每张图片消耗 50 积分。