图像空间的缩放产生的图像与原图可能在画质上有区别,不会产生额外的信息。但是,使用放大模型或者在潜空间的缩放很有可能会改变原有图像的信息(如:纹理、光线等)。通常,图像空间的缩放在预处理阶段使用,模型或潜空间的缩放在后处理阶段使用。

图像空间(Image Space)缩放

基于图像插值的缩放,特点如下

插值方式 原理描述 优点 缺点
邻近插值 选择最邻近的像素值进行填充 速度最快 像素化严重,边缘锯齿感明显
双线性插值 根据四个最近像素值的加权平均进行插值 过渡平滑,计算量小 细节模糊,放大效果一般
区域插值 使用较大区域内的像素加权平均进行计算 保持细节,适合缩小图像 放大效果不如其他方法
双三次插值 基于16个相邻像素,用三次函数进行插值 过渡更平滑,细节保留较好 计算复杂,速度较慢
Lanczos插值 使用Lanczos核函数,考虑更大像素范围(8×8区域)进行插值 保留细节最好,减少模糊和伪影 计算量最大,速度最慢

指定尺寸绽放

指定尺寸的缩放

图像缩放 - 图2

按系数缩放

系数:缩放比例

图像缩放 - 图3按像素缩放

按原图比例缩放到“像素数量(megapixels)”,2代表2百万像素。

图像缩放 - 图4

Image Resize By Longer Side

将长边缩放到指定长度,短边与其保持原来的比例。

同理,也有Image Resize By Shorter Side。

图像缩放 - 图5

模型放大

图像缩放 - 图6

这些模型在不同类型的图像处理需求上展现出各自的特点,可根据特定需求选择合适的放大模型来达到最佳效果。以下是图像放大模型的特点简介:

模型名称 特点
ESRGAN_4x 基于 ESRGAN(Enhanced Super-Resolution GAN)的 4 倍放大模型,提供优秀的细节增强和锐化效果。
LDSR Latent Diffusion Super Resolution,利用潜在扩散过程进行放大,适合处理复杂图像内容。
R-ESRGAN_4x+ 在 ESRGAN 基础上进行改进的模型,增强对细节和噪声处理的能力,生成更清晰自然的结果。
R-ESRGAN_4x+ Anime6B 专为动漫图像优化的 4 倍放大模型,适合动漫和插画风格图像,保持线条清晰和颜色准确。
ScuNET GAN 基于 GAN 的图像增强模型,适合真实感图像,重视生成细节和视觉真实感。
ScuNET PSNR 专注于峰值信噪比(PSNR)的图像放大模型,旨在减少图像失真和保留更多细节,适合高精度需求场景。
SwinIR_4x 基于 Swin Transformer 的图像超分辨率模型,具有强大的细节增强和降噪能力。
4x-UltraSharp 专注于提升图像的锐度,生成清晰锐利的放大效果,适合高分辨率需求的场景。
4x_NMKD-Siax_200k 经过 200k 训练步数的放大模型,适合各种图像,平衡了清晰度与去噪处理。
4x_NMKD-Superscale-SP_178000_G 强调图像的超级缩放和细节恢复,适合高要求的图像放大需求,特别是自然场景图像。
4x-AnimeSharp 为动漫风格图像设计,保持线条和色彩的清晰度和细腻度,适合动画和漫画的放大处理。
4x_foolhardy_Remacri 综合细节恢复和降噪的通用放大模型,适合各种风格的图像。
BSRGAN Blind-SR GAN,适合盲图像超分辨率处理,增强图像细节的同时适应各种图像类型。
DAT 2/3/4 Deep Aggregation Transformer 系列,用于逐步提升图像细节和锐度,适用于高质量图像的放大。
4x-DeCompress 专注于图像的去压缩处理,适合放大并修复压缩损失严重的图像。
4x-DeCompress-Strong 增强型去压缩模型,适合压缩损失严重的图像,具有更强的细节恢复能力。
8x-NMKD-Superscale 提供 8 倍放大比例,适合高分辨率场景,保留细节并进行优化,适合大尺寸图片生成。
4xNomos2_hq_dat2.pth 适用于高清场景的 4 倍放大模型,适合真实感和高精度图像处理。
8x_NMKD-Faces_160000_G 专门针对人脸的 8 倍放大模型,细化人脸细节和肤色处理,适合人像图像的放大。
4xNomos8kSCHAT-L 高分辨率处理模型,适合超高清图像的放大需求,保留了丰富的细节和真实感。
4xRealWebPhoto_v4 专为真实场景照片设计的放大模型,平衡锐化与自然效果,适合网络和网页图像放大。
4xFaceUpSharpDAT 专注人脸图像增强的放大模型,提供清晰的细节恢复和锐化效果,适合高分辨率人脸图像的处理。

潜空间(Latent Space)缩放

图像缩放 - 图7

通常配合图生图工作流使用。

图像缩放 - 图8通过调整提示语降噪,可以控制画面内容与原图的相似性。

SD放大

Ultimate SD Upscale介绍

需要安装插件UltimateSDUpscale, https://github.com/ssitu/ComfyUI_UltimateSDUpscale

图像缩放 - 图9

以下是 Ultimate SD Upscale 的主要参数设置说明,以及各参数对图像放大效果的影响:

参数解释见:FAQ,通常使用默认参数即可。

参数名称 描述
采样参数 随机种、运行后操作、步数、CFG、采样器、调度器、降噪等参数同K采集器。
放大系数
Upscale Factor
放大倍率,控制图像的放大倍数,常见选择为 2 倍、4 倍等。较高的放大倍率适用于需要高分辨率输出的场景,但也会增加内存消耗。
模式类型
Type
重新绘制类型: - Linear:逐块处理图像,按行列顺序逐块执行。 - Chess:以棋盘格图案处理,减少接缝痕迹。 - None:禁用重新绘制。适用于无接缝修复,或图像存在可见重叠或接缝痕迹。
分块宽度
Tile width
每块的宽度。块越大,最终图像中的伪影越少。建议 2k 图像使用 512px 宽度。
分块高度
Tile height
每块的高度。默认值为 0,相当于设置为宽度。较大的块可以减少最终图像中的伪影。建议 2k 图像使用 512px 高度。
分区分块
Padding
每块在处理时考虑的相邻块像素数量。
模糊
Mask blur
块遮罩模糊程度。建议 512-768px 块大小的模糊值设置为 12-16,若有接缝可增加模糊值。
接缝修复模式
Type
接缝修复类型: - Bands pass:在行和列的接缝上添加额外处理,覆盖小区域,耗时少。 - Half tile offset pass:在接缝附近添加 2 次半块偏移的处理。覆盖区域较大,效果较好,但耗时更长。 - Half tile offset + intersections pass:先运行 Half tile offset,再在交叉点上运行额外处理。 - None:禁用接缝修复(默认值)。
接缝修复的去噪
Denoise
接缝修复的去噪强度。
接缝修复宽度
Width
重新绘制线的宽度,仅在 Band pass 中使用。
接缝修复分区
Padding
处理接缝时考虑的图像附近像素数量。
接缝修复模糊
Mask blur
接缝修复遮罩模糊程度。建议在 32px 填充时设置为 8-16;若填充增加,模糊值也应相应增加。

SUPIR放大(仅限SDXL)

需要安装插件UltimateSDUpscale, https://github.com/kijai/ComfyUI-SUPIR

模型文件:https://huggingface.co/Kijai/SUPIR_pruned/tree/main

图像缩放 - 图10