Stable Diffusion 的 `/sdapi/v1/img2img` 接口参数定义

css 复制代码
{
  "prompt": "",
  "negative_prompt": "",
  "styles": [
    "string"
  ],
  "seed": -1,
  "subseed": -1,
  "subseed_strength": 0,
  "seed_resize_from_h": -1,
  "seed_resize_from_w": -1,
  "sampler_name": "string",
  "scheduler": "string",
  "batch_size": 1,
  "n_iter": 1,
  "steps": 50,
  "cfg_scale": 7,
  "width": 512,
  "height": 512,
  "restore_faces": true,
  "tiling": true,
  "do_not_save_samples": false,
  "do_not_save_grid": false,
  "eta": 0,
  "denoising_strength": 0.75,
  "s_min_uncond": 0,
  "s_churn": 0,
  "s_tmax": 0,
  "s_tmin": 0,
  "s_noise": 0,
  "override_settings": {},
  "override_settings_restore_afterwards": true,
  "refiner_checkpoint": "string",
  "refiner_switch_at": 0,
  "disable_extra_networks": false,
  "firstpass_image": "string",
  "comments": {},
  "init_images": [
    "string"
  ],
  "resize_mode": 0,
  "image_cfg_scale": 0,
  "mask": "string",
  "mask_blur_x": 4,
  "mask_blur_y": 4,
  "mask_blur": 0,
  "mask_round": true,
  "inpainting_fill": 0,
  "inpaint_full_res": true,
  "inpaint_full_res_padding": 0,
  "inpainting_mask_invert": 0,
  "initial_noise_multiplier": 0,
  "latent_mask": "string",
  "force_task_id": "string",
  "sampler_index": "Euler",
  "include_init_images": false,
  "script_name": "string",
  "script_args": [],
  "send_images": true,
  "save_images": false,
  "alwayson_scripts": {},
  "infotext": "string"
}

Stable Diffusion 的 /sdapi/v1/img2img 接口参数定义及其默认值和详细含义如下:

  1. prompt : 描述希望生成图像的文本提示。例如 "a beautiful landscape with mountains and a river"。默认值为空字符串 ""
  2. negative_prompt : 描述希望避免生成内容的文本提示。例如 "ugly, blurry"。默认值为空字符串 ""
  3. styles : 一个包含风格的字符串列表,用于生成图像的特定风格。例如 ["anime", "photorealistic"]。默认值为空列表 []
  4. seed : 随机种子,用于图像生成的可重复性。相同的种子和提示会生成相同的图像。默认值为 -1 表示随机种子。
  5. subseed : 用于在生成过程中变换图像细节的辅助种子。默认值为 -1
  6. subseed_strength : 辅助种子的影响程度,范围从 01。值越高,变换效果越显著。默认值为 0
  7. seed_resize_from_h : 调整初始种子的高度,-1 表示不调整。默认值为 -1
  8. seed_resize_from_w : 调整初始种子的宽度,-1 表示不调整。默认值为 -1
  9. sampler_name : 采样器名称,如 "Euler A", "DDIM" 等。控制生成图像的算法。默认值为 ""
  10. scheduler : 计划任务的名称。默认值为 ""
  11. batch_size : 一次生成的图像数量。默认值为 1
  12. n_iter : 迭代次数。生成图像时重复的次数。默认值为 1
  13. steps : 生成图像的迭代步骤数,影响图像的细节和质量。通常设为 50。默认值为 50
  14. cfg_scale : CFG (Classifier-Free Guidance) 比例,控制生成图像与提示匹配的紧密度。较高的值会使生成的图像更接近提示内容。默认值为 7
  15. width : 生成图像的宽度,单位为像素。默认值为 512
  16. height : 生成图像的高度,单位为像素。默认值为 512
  17. restore_faces : 是否自动修复人脸细节。对人脸生成效果有明显提升。默认值为 False
  18. tiling : 是否生成平铺图像,用于纹理。默认值为 False
  19. do_not_save_samples : 是否不保存生成的样本图像。默认值为 False
  20. do_not_save_grid : 是否不保存生成的图像网格。默认值为 False
  21. eta : 噪声衰减参数,影响生成过程中的随机性。通常设为 0。默认值为 0
  22. denoising_strength : 去噪强度,控制初始图像与生成图像之间的变化程度,范围从 01。默认值为 0.75
  23. s_min_uncond : 最小无条件采样步数。默认值为 0
  24. s_churn : 采样抖动参数。默认值为 0
  25. s_tmax : 采样最大阈值。默认值为 0
  26. s_tmin : 采样最小阈值。默认值为 0
  27. s_noise : 采样噪声。默认值为 0
  28. override_settings : 重写设置的字典,可用于覆盖默认模型设置。默认值为空字典 {}
  29. override_settings_restore_afterwards : 重写设置后是否恢复原始设置。默认值为 True
  30. refiner_checkpoint : 精炼器检查点名称。默认值为 ""
  31. refiner_switch_at : 切换到精炼器的步骤。默认值为 0
  32. disable_extra_networks : 是否禁用额外的网络。默认值为 False
  33. firstpass_image : 第一阶段图像的 URL 或 base64 编码。默认值为 ""
  34. comments : 备注信息的字典。默认值为空字典 {}
  35. init_images : 初始图像的 URL 或 base64 编码列表。默认值为空列表 []
  36. resize_mode : 调整模式,如保持比例、拉伸等。0 表示保持比例,1 表示拉伸。默认值为 0
  37. image_cfg_scale : 图像配置比例。默认值为 0
  38. mask : 蒙版图像的 URL 或 base64 编码。用于指定图像的哪些部分应被修改。默认值为 ""
  39. mask_blur_x : 蒙版的 X 方向模糊度。默认值为 4
  40. mask_blur_y : 蒙版的 Y 方向模糊度。默认值为 4
  41. mask_blur : 蒙版的模糊度。默认值为 0
  42. mask_round : 是否使蒙版圆滑。默认值为 True
  43. inpainting_fill : 填充修复模式。默认值为 0
  44. inpaint_full_res : 是否使用全分辨率进行修复。默认值为 True
  45. inpaint_full_res_padding : 修复时的填充大小。默认值为 0
  46. inpainting_mask_invert : 是否反转蒙版。默认值为 0
  47. initial_noise_multiplier : 初始噪声倍增器。默认值为 0
  48. latent_mask : 潜在蒙版的 URL 或 base64 编码。默认值为 ""
  49. force_task_id : 强制任务 ID。默认值为 ""
  50. sampler_index : 采样器索引名称,类似于 sampler_name。默认值为 "Euler"
  51. include_init_images : 是否包含初始图像。默认值为 False
  52. script_name : 脚本名称。默认值为 ""
  53. script_args : 脚本参数列表。默认值为空列表 []
  54. send_images : 是否发送生成的图像。默认值为 True
  55. save_images : 是否保存生成的图像。默认值为 False
  56. alwayson_scripts : 始终启用的脚本字典。默认值为空字典 {}
  57. infotext : 信息文本。默认值为 ""

这些参数控制生成过程中的各个方面,可以根据需要进行调整以获得理想的图像生成效果【7†source】【8†source】【9†source】【10†source】【11†source】【12†source】。

相关推荐
初眸࿐1 小时前
华为云安全事件深度剖析与防范策略
大数据·人工智能·云原生·开源·华为云·云计算·github
夕小瑶1 小时前
首个WebAgent在线评测框架和流程数据管理平台来了,GPT-4、Qwen登顶闭源和开源榜首!
人工智能
文盲青年1 小时前
深层神经网络示例
人工智能·深度学习·神经网络
yuri_yagn1 小时前
《TF2.x强化学习手册》P14-P26连续动作空间的神经网络强化学习以及Gym作为训练环境和构建神经网络智能体
人工智能·神经网络·neo4j
瑶光守护者1 小时前
5G-A通感融合赋能低空经济-RedCap芯片在无人机中的应用
人工智能·笔记·物联网·学习·5g·无人机
bluewelkin2 小时前
计算机视觉篇1 计算机视觉概览
人工智能·计算机视觉
深度学习lover2 小时前
<数据集>竹子缺陷检测数据集<目标检测>
人工智能·python·yolo·目标检测·计算机视觉
业余小程序猿3 小时前
【pytorch】thread: [16,0,0] Assertion `t >= 0 && t < n_classes` failed
人工智能·pytorch·python
lipeng083 小时前
大模型系列3--pytorch dataloader的原理
人工智能·pytorch·python
deephub3 小时前
Pytorch的编译新特性TorchDynamo的工作原理和使用示例
人工智能·pytorch·python·深度学习