图像空间
的缩放产生的图像与原图可能在画质上有区别,不会产生额外的信息。但是,使用放大模型
或者在潜空间
的缩放很有可能会改变原有图像的信息(如:纹理、光线等)。通常,图像空间的缩放在预处理阶段使用,模型或潜空间的缩放在后处理阶段使用。
图像空间(Image Space)缩放
基于图像插值的缩放,特点如下
插值方式 | 原理描述 | 优点 | 缺点 |
---|---|---|---|
邻近插值 | 选择最邻近的像素值进行填充 | 速度最快 | 像素化严重,边缘锯齿感明显 |
双线性插值 | 根据四个最近像素值的加权平均进行插值 | 过渡平滑,计算量小 | 细节模糊,放大效果一般 |
区域插值 | 使用较大区域内的像素加权平均进行计算 | 保持细节,适合缩小图像 | 放大效果不如其他方法 |
双三次插值 | 基于16个相邻像素,用三次函数进行插值 | 过渡更平滑,细节保留较好 | 计算复杂,速度较慢 |
Lanczos插值 | 使用Lanczos核函数,考虑更大像素范围(8×8区域)进行插值 | 保留细节最好,减少模糊和伪影 | 计算量最大,速度最慢 |
指定尺寸绽放
指定尺寸的缩放
按系数缩放
系数:缩放比例
按像素缩放
按原图比例缩放到“像素数量(megapixels)”,2代表2百万像素。
Image Resize By Longer Side
将长边缩放到指定长度,短边与其保持原来的比例。
同理,也有Image Resize By Shorter Side。
模型放大
这些模型在不同类型的图像处理需求上展现出各自的特点,可根据特定需求选择合适的放大模型来达到最佳效果。以下是图像放大模型的特点简介:
模型名称 | 特点 |
---|---|
ESRGAN_4x | 基于 ESRGAN(Enhanced Super-Resolution GAN)的 4 倍放大模型,提供优秀的细节增强和锐化效果。 |
LDSR | Latent Diffusion Super Resolution,利用潜在扩散过程进行放大,适合处理复杂图像内容。 |
R-ESRGAN_4x+ | 在 ESRGAN 基础上进行改进的模型,增强对细节和噪声处理的能力,生成更清晰自然的结果。 |
R-ESRGAN_4x+ Anime6B | 专为动漫图像优化的 4 倍放大模型,适合动漫和插画风格图像,保持线条清晰和颜色准确。 |
ScuNET GAN | 基于 GAN 的图像增强模型,适合真实感图像,重视生成细节和视觉真实感。 |
ScuNET PSNR | 专注于峰值信噪比(PSNR)的图像放大模型,旨在减少图像失真和保留更多细节,适合高精度需求场景。 |
SwinIR_4x | 基于 Swin Transformer 的图像超分辨率模型,具有强大的细节增强和降噪能力。 |
4x-UltraSharp | 专注于提升图像的锐度,生成清晰锐利的放大效果,适合高分辨率需求的场景。 |
4x_NMKD-Siax_200k | 经过 200k 训练步数的放大模型,适合各种图像,平衡了清晰度与去噪处理。 |
4x_NMKD-Superscale-SP_178000_G | 强调图像的超级缩放和细节恢复,适合高要求的图像放大需求,特别是自然场景图像。 |
4x-AnimeSharp | 为动漫风格图像设计,保持线条和色彩的清晰度和细腻度,适合动画和漫画的放大处理。 |
4x_foolhardy_Remacri | 综合细节恢复和降噪的通用放大模型,适合各种风格的图像。 |
BSRGAN | Blind-SR GAN,适合盲图像超分辨率处理,增强图像细节的同时适应各种图像类型。 |
DAT 2/3/4 | Deep Aggregation Transformer 系列,用于逐步提升图像细节和锐度,适用于高质量图像的放大。 |
4x-DeCompress | 专注于图像的去压缩处理,适合放大并修复压缩损失严重的图像。 |
4x-DeCompress-Strong | 增强型去压缩模型,适合压缩损失严重的图像,具有更强的细节恢复能力。 |
8x-NMKD-Superscale | 提供 8 倍放大比例,适合高分辨率场景,保留细节并进行优化,适合大尺寸图片生成。 |
4xNomos2_hq_dat2.pth | 适用于高清场景的 4 倍放大模型,适合真实感和高精度图像处理。 |
8x_NMKD-Faces_160000_G | 专门针对人脸的 8 倍放大模型,细化人脸细节和肤色处理,适合人像图像的放大。 |
4xNomos8kSCHAT-L | 高分辨率处理模型,适合超高清图像的放大需求,保留了丰富的细节和真实感。 |
4xRealWebPhoto_v4 | 专为真实场景照片设计的放大模型,平衡锐化与自然效果,适合网络和网页图像放大。 |
4xFaceUpSharpDAT | 专注人脸图像增强的放大模型,提供清晰的细节恢复和锐化效果,适合高分辨率人脸图像的处理。 |
潜空间(Latent Space)缩放
通常配合图生图工作流使用。
通过调整提示语与降噪,可以控制画面内容与原图的相似性。
SD放大
需要安装插件UltimateSDUpscale, https://github.com/ssitu/ComfyUI_UltimateSDUpscale
以下是 Ultimate SD Upscale 的主要参数设置说明,以及各参数对图像放大效果的影响:
参数解释见:FAQ,通常使用默认参数即可。
参数名称 | 描述 |
---|---|
采样参数 | 随机种、运行后操作、步数、CFG、采样器、调度器、降噪等参数同K采集器。 |
放大系数 Upscale Factor |
放大倍率,控制图像的放大倍数,常见选择为 2 倍、4 倍等。较高的放大倍率适用于需要高分辨率输出的场景,但也会增加内存消耗。 |
模式类型 Type |
重新绘制类型: - Linear:逐块处理图像,按行列顺序逐块执行。 - Chess:以棋盘格图案处理,减少接缝痕迹。 - None:禁用重新绘制。适用于无接缝修复,或图像存在可见重叠或接缝痕迹。 |
分块宽度 Tile width |
每块的宽度。块越大,最终图像中的伪影越少。建议 2k 图像使用 512px 宽度。 |
分块高度 Tile height |
每块的高度。默认值为 0,相当于设置为宽度。较大的块可以减少最终图像中的伪影。建议 2k 图像使用 512px 高度。 |
分区分块 Padding |
每块在处理时考虑的相邻块像素数量。 |
模糊 Mask blur |
块遮罩模糊程度。建议 512-768px 块大小的模糊值设置为 12-16,若有接缝可增加模糊值。 |
接缝修复模式 Type |
接缝修复类型: - Bands pass:在行和列的接缝上添加额外处理,覆盖小区域,耗时少。 - Half tile offset pass:在接缝附近添加 2 次半块偏移的处理。覆盖区域较大,效果较好,但耗时更长。 - Half tile offset + intersections pass:先运行 Half tile offset,再在交叉点上运行额外处理。 - None:禁用接缝修复(默认值)。 |
接缝修复的去噪 Denoise |
接缝修复的去噪强度。 |
接缝修复宽度 Width |
重新绘制线的宽度,仅在 Band pass 中使用。 |
接缝修复分区 Padding |
处理接缝时考虑的图像附近像素数量。 |
接缝修复模糊 Mask blur |
接缝修复遮罩模糊程度。建议在 32px 填充时设置为 8-16;若填充增加,模糊值也应相应增加。 |
SUPIR放大(仅限SDXL)
需要安装插件UltimateSDUpscale, https://github.com/kijai/ComfyUI-SUPIR