调用接口(千问API)的数据格式:
1.Messages结构
千问API使用messages数组来保存对话内容,每个消息都包含role和content两个字段。
role分为:
system:系统消息,设定AI的角色和行为,使用场景:放在消息列表第一位,用于指定助手身份、回答风格、任务边界
user:用户消息,使用场景:用户输入的问题或指令
assistant:助手消息,使用场景:模型对用户的回复(在多轮对话中需要保存)
注意:user和assistant必须成对、交替出现
例子:messages: [
{ role: "system", content: "你是一个C#编程助手" },
{ role: "user", content: "什么是List?" },
{ role: "assistant", content: "List是..." }, ← 上一轮的回答
{ role: "user", content: "那Dictionary呢?" } ← 新的问题
]
2.核心参数说明
参数:model(string) 指定使用的模型,qwen-turbo, qwen-plus, qwen-max 等
参数:messages(array数组) 对话消息列表,包含system/user/assistant消息
参数:temperature(float) 控制回答的随机性。值越低回答越确定、简洁;值越高回答越多样、详尽,取值范围:0-2(常用0.3-0.8)
参数:max_tokens(int) 限制模型生成的最大token数,直接控制回复长度,取值范围:1 ~ 8192
参数:stream(bool) 是否流式输出,取值范围:true/false
3.响应数据结构
csharp
{
"id": "chatcmpl-xxx",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "模型返回的回答内容"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 100,
"completion_tokens": 50,
"total_tokens": 150
}
}
参数总结:
参数 低值效果 高值效果 推荐场景
【1】temperature 0.2-0.4:回答简短、保守、确定性强 0.7-0.9:回答详细、有创意、多样性高 ,推荐场景:事实问答用0.3,创意生成用0.8
【2】max_tokens 50-100:回答非常简短 500+:回答详细完整,推荐场景:预览场景用小值,完整回答用大值
【3】model选择 qwen-turbo:速度快,成本低 qwen-plus:质量高,推荐场景:实时对话用turbo,复杂任务用plus
注意:temperature和max_tokens不传时,模型使用默认值