使用url请求本地qwen3-embed-0.6B向量大模型示例

请求 URL:

http://10.x.x.x:8002/v1/embeddings

请求方法:

POST

请求头(Headers):

Authorization="Bearer 你的API-KEY"

Content-Type="application/json"

请求体:

{

"model": "qwen3-embed-0.6B",

"input": "我想测试向量模型"

}

成功返回示例:

{

"id": "embd-23d6e61803cf48b686a01e8ebe6a22c3",

"object": "list",

"created": 1777361942,

"model": "qwen3-embed-0.6B",

"data": [

{

"index": 0,

"object": "embedding",

"embedding": [-0.0184326171875,-0.006439208984375,...]

}

],

"usage": {

"prompt_tokens": 2,

"total_tokens": 2,

"completion_tokens": 0,

"prompt_tokens_details": null

}

}

常见问题:

401 未授权

检查 API-KEY 是否正确

确认前面加了 Bearer (有空格)

模型不存在

模型名填写错误

文本过长

qwen3-embed-0.6B 支持最长 8192 token

超长需要分段

相关推荐
养肥胖虎9 小时前
RAG学习笔记(3):区分数据库检索与RAG的使用场景
数据库·ai·rag
蔡俊锋10 小时前
AI记忆压缩术:从305GB到7.4GB的魔法
人工智能·ai·ai 记忆
杨浦老苏12 小时前
AI原生笔记应用Tolaria
笔记·ai·markdown·obsidian
@蔓蔓喜欢你12 小时前
数据可视化入门:让你的数据说话
人工智能·ai
Mininglamp_271813 小时前
从单体大模型到Agent网络:当AI互联网取代信息互联网,底层架构需要怎么变?
人工智能·ai·ai agent·moa·分布式ai·多agent协作·scaling out
俊哥V14 小时前
每日 AI 研究简报 · 2026-05-18
人工智能·ai
多年小白14 小时前
兆易创新分析
大数据·人工智能·ai·金融·区块链
搬砖的小码农_Sky15 小时前
AI Agent:MCP介绍和具体实现方案
人工智能·机器学习·ai·人机交互·agi
一切皆是因缘际会17 小时前
AI低代码开发实战:轻量化部署与多场景落地
人工智能·深度学习·低代码·机器学习·ai·架构
chen_22719 小时前
KZPROJ Git Diff AI 审查工具
git·ai·claude·kanzi