使用url请求本地qwen3-embed-0.6B向量大模型示例

请求 URL:

http://10.x.x.x:8002/v1/embeddings

请求方法:

POST

请求头(Headers):

Authorization="Bearer 你的API-KEY"

Content-Type="application/json"

请求体:

{

"model": "qwen3-embed-0.6B",

"input": "我想测试向量模型"

}

成功返回示例:

{

"id": "embd-23d6e61803cf48b686a01e8ebe6a22c3",

"object": "list",

"created": 1777361942,

"model": "qwen3-embed-0.6B",

"data": [

{

"index": 0,

"object": "embedding",

"embedding": [-0.0184326171875,-0.006439208984375,...]

}

],

"usage": {

"prompt_tokens": 2,

"total_tokens": 2,

"completion_tokens": 0,

"prompt_tokens_details": null

}

}

常见问题:

401 未授权

检查 API-KEY 是否正确

确认前面加了 Bearer (有空格)

模型不存在

模型名填写错误

文本过长

qwen3-embed-0.6B 支持最长 8192 token

超长需要分段

相关推荐
智慧物业老杨1 小时前
物业数智化转型实战:从单一服务到综合解决方案的技术落地路径
人工智能·算法·ai
Agent手记2 小时前
生产节拍混乱,在制品积压严重该怎么破解?——2026制造业柔性生产与Agent自动化实战指南
运维·人工智能·ai·自动化
俊哥V2 小时前
每日 AI 研究简报 · 2026-04-28
人工智能·ai
bloglin999992 小时前
“用向量 LLM 做向量化” vs “传统向量化算法”有什么区别?
ai·向量化
视觉&物联智能3 小时前
【杂谈】-人工智能于现代网络安全运营的价值持续攀升
人工智能·安全·web安全·ai·chatgpt·agi·deepseek
宋冠巡3 小时前
MCP服务器示例项目:MCP Inspector(测试工具)、hello-mcp-server(基础示例项目)和 REST API 转 MCP Tool
ai·mcp·mcp服务器·mcp inspector
꧁꫞꯭零꯭点꯭꫞꧂3 小时前
OpenClaw 本地部署 QQ /飞书机器人接入手册
ai
optimistic_chen3 小时前
【AI Agent 全栈开发】提示词技巧(prompt)
java·人工智能·ai·prompt·agent
2601_949695593 小时前
开源AI智能体OpenClaw接入DeepSeek V4全流程:从配置到成本
人工智能·驱动开发·ai·电脑