使用url请求本地qwen3-embed-0.6B向量大模型示例

请求 URL:

http://10.x.x.x:8002/v1/embeddings

请求方法:

POST

请求头(Headers):

Authorization="Bearer 你的API-KEY"

Content-Type="application/json"

请求体:

{

"model": "qwen3-embed-0.6B",

"input": "我想测试向量模型"

}

成功返回示例:

{

"id": "embd-23d6e61803cf48b686a01e8ebe6a22c3",

"object": "list",

"created": 1777361942,

"model": "qwen3-embed-0.6B",

"data": [

{

"index": 0,

"object": "embedding",

"embedding": -0.0184326171875,-0.006439208984375,...

}

],

"usage": {

"prompt_tokens": 2,

"total_tokens": 2,

"completion_tokens": 0,

"prompt_tokens_details": null

}

}

常见问题:

401 未授权

检查 API-KEY 是否正确

确认前面加了 Bearer (有空格)

模型不存在

模型名填写错误

文本过长

qwen3-embed-0.6B 支持最长 8192 token

超长需要分段

相关推荐
doiito2 小时前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent
doiito1 天前
【Agent Harness】Gliding Horse 的 L2 作战地图:让多 Agent 协作从“摸黑”变成“透明”
ai·rust·架构设计·系统设计·ai agent
xiezhr1 天前
逛GitHub发现一款免费带有AI功能的数据库管理工具DBX
ai·开源软件·自然语言·数据库管理工具
垚森3 天前
我用 GLM-5.2 造了个炸裂主题后台:16 套主题随心切,可在线体验
ai·react
doiito3 天前
【Agent Harness】Gliding Horse 工具结果压缩体系:如何用“指针”驯服上下文膨胀
ai·rust·架构设计·系统设计·ai agent
doiito4 天前
【Agent Harness】Gliding Horse 上下文动态感知与智能压缩:让 Agent 真正“听得进”每一句话
ai·rust·架构设计·系统设计·ai agent
探索云原生5 天前
K8s 1.36 这个 GA 特性,把 initContainer 拉模型的 hack 干掉了
ai·云原生·kubernetes
Zy宇5 天前
从养 OpenClaw 到养社区 AI:一套 Multi-Agent 社区的设计思路
人工智能·ai
doiito5 天前
【Agent Harness】Gliding Horse 记忆系统深度剖析:像 CPU 一样思考的 AI 记忆架构
ai·rust·架构设计·系统设计·ai agent
mobility6 天前
免费AI视频生成器:我如何用零成本做出带旁白字幕的多场景AI视频
ai·vibe coding