基础请求结构
{
"type": "generate", # 固定值,表示请求生成图像
"numbers": 4, # 生成图像数量
"prompt": ["场景描述1", "场景描述2", ...], # 每个图像的详细文字描述
"neg_prompt": ["负面关键词1", "负面关键词2", ...], # 需避免的特征
"ratio": ["4:3", "4:3", ...] # 图像宽高比例
}
关键参数详解
1. type
- 含义:请求类型
- 可选值 :
"generate"
:生成新图像"upscale"
:图像放大"variation"
:基于现有图像生成变体
2. numbers
- 含义:需要生成的图像数量
- 注意 :
- 通常建议单次请求不超过 5 张,避免超时
- 部分 API 有并发限制(如免费版可能限制为 1-2 张)
3. prompt
-
含义:图像详细描述,决定生成内容
-
构成要素:
- 风格:如 "港风动漫"" 二次元 ""写实油画" 等
- 场景:如 "大巴失控冲向悬崖"" 青楼内翩翩起舞 "
- 人物:如 "身着古装的女子"" 表情惊恐的学生 "
- 环境:如 "阴云密布的天空"" 灯光昏暗的侯府 "
- 光影:如 "光影对比强烈"" 暖黄色灯光 "
- 构图:如 "俯视角"" 人物在画面中心 "
-
示例优化:
json
"prompt": [ "港风动漫风格,一辆倾斜的红色双层巴士冲向悬崖,玻璃碎裂,车内学生表情惊恐,暴雨倾盆,霓虹灯牌在雨中闪烁,侧逆光突出剪影,画面颗粒感强" ]
4. neg_prompt
- 含义:需避免生成的内容
- 常见关键词 :
- 低质量相关:"blurry", "low quality", "pixelated"
- 风格排除:"3D", "cartoon", "anime"(如果需要写实风格)
- 特定元素:"ugly", "disfigured", "bad anatomy"
5. ratio
- 含义:图像宽高比例
- 常见值 :
- 正方形:"1:1"
- 横幅:"16:9", "21:9"
- 竖幅:"9:16"
- 标准:"4:3"(你当前使用的比例)
进阶参数(可选)
1. style
-
作用:显式指定风格,与 prompt 中的风格描述互补
-
示例 :
json
"style": "Hong Kong style animation", "prompt": ["一辆失控的大巴..."]
2. seed
-
作用:固定随机种子,确保结果可复现
-
示例 :
json
"seed": 12345, # 相同seed+prompt会生成相似图像
3. quality
- 作用:控制图像质量,影响生成时间
- 可选值 :
- "normal"(默认)
- "high"(更高质量,更长生成时间)
使用建议
-
风格强化:
- 在 prompt 中重复关键风格词(如 "港风动漫")
- 添加时代特征(如 "复古霓虹灯"" 老香港街道 ")
-
光影控制:
- 冷色调适合悬疑场景(如 "深蓝色调"" 雨夜霓虹 ")
- 暖光营造复古感(如 "钨丝灯"" 昏黄路灯 ")
-
细节增强:
- 添加时代元素(如 "BB 机"" 繁体字招牌 ")
- 人物服饰材质(如 "旗袍蕾丝边"" 皮革风衣 ")
-
负面提示优化:
json
"neg_prompt": [ "modern city", "clean environment", "flat lighting", "digital painting" ]
常见问题排查
-
生成结果不符合预期:
- 检查 prompt 是否包含矛盾描述(如 "明亮场景" 与 "阴森恐怖")
- 增加 neg_prompt 排除干扰元素
-
比例异常:
- 部分 API 可能不严格遵守比例,需在生成后裁剪
-
风格不突出:
- 在 prompt 开头明确风格(如 "港风动漫,以... 为背景")
- 参考同类成功案例的描述模板