stable diffusion controlnet前处理中的图像resize

在SD controlnet应用中,一般都要先安装controlnet_aux,并在项目代码中import相关前处理模块,如下所示。

在对control image进行前处理(比如找边缘,人体特征点)之前,往往会图像进行resize,这个resize函数定义在controlnet_autx中util.py中,无论是scribble,还是openpse或其它功能,都会调用这段resize代码。同时如果调用pipe接口时没有显示指定图像生成的宽和高,那么生成的图像size将会基于control image前处理后的宽高值。 所以这里重点讨论下controlnet前处理中的resize函数。

先上代码:

复制代码
def resize_image(input_image, resolution):
    H, W, C = input_image.shape
    H = float(H)
    W = float(W)
    k = float(resolution) / min(H, W)
    H *= k
    W *= k
    H = int(np.round(H / 64.0)) * 64
    W = int(np.round(W / 64.0)) * 64
    img = cv2.resize(input_image, (W, H), interpolation=cv2.INTER_LANCZOS4 if k > 1 else cv2.INTER_AREA)
    return img

在前处理接口会有一个参数detect_resolution,其缺省值为512。它会传给上面resize函数的resolution。它会将宽或高的较小值设成512,然后对应的高或宽按原始图像等比例缩放。 此外,还要对等比例缩放后的宽、高值进行微调确保能被64整除。 所以即使原始control image的尺寸是一些比较随意的值,但是经过前处理后的size都会被整归成能被64整除的值。前面说过,如果pipe接口没有显示指定生成图像的宽和高,那么该规整值就是最终图像的生成尺寸。

相关推荐
老刘说AI14 天前
类Sora模型:解锁动态视觉艺术的密码
人工智能·stable diffusion·架构·embedding
python-码博士14 天前
Stable Diffusion 3 / FLUX 类模型中的 Flow Matching:怎么用、怎么调、怎么避坑
stable diffusion
Rocky Ding*16 天前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
Asimov_Liu18 天前
Diffusion 与 Flow Matching 数学原理及其在 VLA Action 生成中的应用
stable diffusion·自动驾驶·具身智能·vla·flow matching
Rocky Ding*18 天前
Token Merging for Fast Stable Diffusion:一篇读懂 Stable Diffusion 的免训练加速机制
论文阅读·人工智能·深度学习·机器学习·stable diffusion·aigc·ai-native
yuguo.im19 天前
Mac M4 安装 sd-webui 踩坑全记录
macos·stable diffusion
hugo_im20 天前
Mac M4 安装 sd-webui 踩坑全记录
stable diffusion
一叶知秋dong20 天前
Stable diffusion 工作原理
人工智能·深度学习·stable diffusion
仰望尾迹云23 天前
灵感画廊入门:AI绘画零基础到精通
stable diffusion·ai绘画·图像生成
AI极客菌23 天前
AI绘画工具中,为什么专业玩家爱用Stable Diffusion,普通玩家却喜欢Midjourney?
大数据·人工智能·ai·ai作画·stable diffusion·aigc·midjourney