请求 URL:
http://10.x.x.x:8002/v1/embeddings
请求方法:
POST
请求头(Headers):
Authorization="Bearer 你的API-KEY"
Content-Type="application/json"
请求体:
{
"model": "qwen3-embed-0.6B",
"input": "我想测试向量模型"
}
成功返回示例:
{
"id": "embd-23d6e61803cf48b686a01e8ebe6a22c3",
"object": "list",
"created": 1777361942,
"model": "qwen3-embed-0.6B",
"data": [
{
"index": 0,
"object": "embedding",
"embedding": [-0.0184326171875,-0.006439208984375,...]
}
],
"usage": {
"prompt_tokens": 2,
"total_tokens": 2,
"completion_tokens": 0,
"prompt_tokens_details": null
}
}
常见问题:
401 未授权
检查 API-KEY 是否正确
确认前面加了 Bearer (有空格)
模型不存在
模型名填写错误
文本过长
qwen3-embed-0.6B 支持最长 8192 token
超长需要分段