Stable Diffusion 的 `/sdapi/v1/img2img` 接口参数定义

css 复制代码
{
  "prompt": "",
  "negative_prompt": "",
  "styles": [
    "string"
  ],
  "seed": -1,
  "subseed": -1,
  "subseed_strength": 0,
  "seed_resize_from_h": -1,
  "seed_resize_from_w": -1,
  "sampler_name": "string",
  "scheduler": "string",
  "batch_size": 1,
  "n_iter": 1,
  "steps": 50,
  "cfg_scale": 7,
  "width": 512,
  "height": 512,
  "restore_faces": true,
  "tiling": true,
  "do_not_save_samples": false,
  "do_not_save_grid": false,
  "eta": 0,
  "denoising_strength": 0.75,
  "s_min_uncond": 0,
  "s_churn": 0,
  "s_tmax": 0,
  "s_tmin": 0,
  "s_noise": 0,
  "override_settings": {},
  "override_settings_restore_afterwards": true,
  "refiner_checkpoint": "string",
  "refiner_switch_at": 0,
  "disable_extra_networks": false,
  "firstpass_image": "string",
  "comments": {},
  "init_images": [
    "string"
  ],
  "resize_mode": 0,
  "image_cfg_scale": 0,
  "mask": "string",
  "mask_blur_x": 4,
  "mask_blur_y": 4,
  "mask_blur": 0,
  "mask_round": true,
  "inpainting_fill": 0,
  "inpaint_full_res": true,
  "inpaint_full_res_padding": 0,
  "inpainting_mask_invert": 0,
  "initial_noise_multiplier": 0,
  "latent_mask": "string",
  "force_task_id": "string",
  "sampler_index": "Euler",
  "include_init_images": false,
  "script_name": "string",
  "script_args": [],
  "send_images": true,
  "save_images": false,
  "alwayson_scripts": {},
  "infotext": "string"
}

Stable Diffusion 的 /sdapi/v1/img2img 接口参数定义及其默认值和详细含义如下:

  1. prompt : 描述希望生成图像的文本提示。例如 "a beautiful landscape with mountains and a river"。默认值为空字符串 ""
  2. negative_prompt : 描述希望避免生成内容的文本提示。例如 "ugly, blurry"。默认值为空字符串 ""
  3. styles : 一个包含风格的字符串列表,用于生成图像的特定风格。例如 ["anime", "photorealistic"]。默认值为空列表 []
  4. seed : 随机种子,用于图像生成的可重复性。相同的种子和提示会生成相同的图像。默认值为 -1 表示随机种子。
  5. subseed : 用于在生成过程中变换图像细节的辅助种子。默认值为 -1
  6. subseed_strength : 辅助种子的影响程度,范围从 01。值越高,变换效果越显著。默认值为 0
  7. seed_resize_from_h : 调整初始种子的高度,-1 表示不调整。默认值为 -1
  8. seed_resize_from_w : 调整初始种子的宽度,-1 表示不调整。默认值为 -1
  9. sampler_name : 采样器名称,如 "Euler A", "DDIM" 等。控制生成图像的算法。默认值为 ""
  10. scheduler : 计划任务的名称。默认值为 ""
  11. batch_size : 一次生成的图像数量。默认值为 1
  12. n_iter : 迭代次数。生成图像时重复的次数。默认值为 1
  13. steps : 生成图像的迭代步骤数,影响图像的细节和质量。通常设为 50。默认值为 50
  14. cfg_scale : CFG (Classifier-Free Guidance) 比例,控制生成图像与提示匹配的紧密度。较高的值会使生成的图像更接近提示内容。默认值为 7
  15. width : 生成图像的宽度,单位为像素。默认值为 512
  16. height : 生成图像的高度,单位为像素。默认值为 512
  17. restore_faces : 是否自动修复人脸细节。对人脸生成效果有明显提升。默认值为 False
  18. tiling : 是否生成平铺图像,用于纹理。默认值为 False
  19. do_not_save_samples : 是否不保存生成的样本图像。默认值为 False
  20. do_not_save_grid : 是否不保存生成的图像网格。默认值为 False
  21. eta : 噪声衰减参数,影响生成过程中的随机性。通常设为 0。默认值为 0
  22. denoising_strength : 去噪强度,控制初始图像与生成图像之间的变化程度,范围从 01。默认值为 0.75
  23. s_min_uncond : 最小无条件采样步数。默认值为 0
  24. s_churn : 采样抖动参数。默认值为 0
  25. s_tmax : 采样最大阈值。默认值为 0
  26. s_tmin : 采样最小阈值。默认值为 0
  27. s_noise : 采样噪声。默认值为 0
  28. override_settings : 重写设置的字典,可用于覆盖默认模型设置。默认值为空字典 {}
  29. override_settings_restore_afterwards : 重写设置后是否恢复原始设置。默认值为 True
  30. refiner_checkpoint : 精炼器检查点名称。默认值为 ""
  31. refiner_switch_at : 切换到精炼器的步骤。默认值为 0
  32. disable_extra_networks : 是否禁用额外的网络。默认值为 False
  33. firstpass_image : 第一阶段图像的 URL 或 base64 编码。默认值为 ""
  34. comments : 备注信息的字典。默认值为空字典 {}
  35. init_images : 初始图像的 URL 或 base64 编码列表。默认值为空列表 []
  36. resize_mode : 调整模式,如保持比例、拉伸等。0 表示保持比例,1 表示拉伸。默认值为 0
  37. image_cfg_scale : 图像配置比例。默认值为 0
  38. mask : 蒙版图像的 URL 或 base64 编码。用于指定图像的哪些部分应被修改。默认值为 ""
  39. mask_blur_x : 蒙版的 X 方向模糊度。默认值为 4
  40. mask_blur_y : 蒙版的 Y 方向模糊度。默认值为 4
  41. mask_blur : 蒙版的模糊度。默认值为 0
  42. mask_round : 是否使蒙版圆滑。默认值为 True
  43. inpainting_fill : 填充修复模式。默认值为 0
  44. inpaint_full_res : 是否使用全分辨率进行修复。默认值为 True
  45. inpaint_full_res_padding : 修复时的填充大小。默认值为 0
  46. inpainting_mask_invert : 是否反转蒙版。默认值为 0
  47. initial_noise_multiplier : 初始噪声倍增器。默认值为 0
  48. latent_mask : 潜在蒙版的 URL 或 base64 编码。默认值为 ""
  49. force_task_id : 强制任务 ID。默认值为 ""
  50. sampler_index : 采样器索引名称,类似于 sampler_name。默认值为 "Euler"
  51. include_init_images : 是否包含初始图像。默认值为 False
  52. script_name : 脚本名称。默认值为 ""
  53. script_args : 脚本参数列表。默认值为空列表 []
  54. send_images : 是否发送生成的图像。默认值为 True
  55. save_images : 是否保存生成的图像。默认值为 False
  56. alwayson_scripts : 始终启用的脚本字典。默认值为空字典 {}
  57. infotext : 信息文本。默认值为 ""

这些参数控制生成过程中的各个方面,可以根据需要进行调整以获得理想的图像生成效果【7†source】【8†source】【9†source】【10†source】【11†source】【12†source】。

相关推荐
szxinmai主板定制专家3 分钟前
【国产NI替代】基于A7 FPGA+AI的16振动(16bits)终端PCIE数据采集板卡
人工智能·fpga开发
数据分析能量站38 分钟前
神经网络-AlexNet
人工智能·深度学习·神经网络
Ven%44 分钟前
如何修改pip全局缓存位置和全局安装包存放路径
人工智能·python·深度学习·缓存·自然语言处理·pip
szxinmai主板定制专家1 小时前
【NI国产替代】基于国产FPGA+全志T3的全国产16振动+2转速(24bits)高精度终端采集板卡
人工智能·fpga开发
YangJZ_ByteMaster1 小时前
EndtoEnd Object Detection with Transformers
人工智能·深度学习·目标检测·计算机视觉
Anlici1 小时前
模型训练与数据分析
人工智能·机器学习
余~~185381628002 小时前
NFC 碰一碰发视频源码搭建技术详解,支持OEM
开发语言·人工智能·python·音视频
唔皇万睡万万睡2 小时前
五子棋小游戏设计(Matlab)
人工智能·matlab·游戏程序
视觉语言导航2 小时前
AAAI-2024 | 大语言模型赋能导航决策!NavGPT:基于大模型显式推理的视觉语言导航
人工智能·具身智能
volcanical2 小时前
Bert各种变体——RoBERTA/ALBERT/DistillBert
人工智能·深度学习·bert