使用url请求本地qwen3-embed-0.6B向量大模型示例

请求 URL:

http://10.x.x.x:8002/v1/embeddings

请求方法:

POST

请求头(Headers):

Authorization="Bearer 你的API-KEY"

Content-Type="application/json"

请求体:

{

"model": "qwen3-embed-0.6B",

"input": "我想测试向量模型"

}

成功返回示例:

{

"id": "embd-23d6e61803cf48b686a01e8ebe6a22c3",

"object": "list",

"created": 1777361942,

"model": "qwen3-embed-0.6B",

"data": [

{

"index": 0,

"object": "embedding",

"embedding": -0.0184326171875,-0.006439208984375,...

}

],

"usage": {

"prompt_tokens": 2,

"total_tokens": 2,

"completion_tokens": 0,

"prompt_tokens_details": null

}

}

常见问题:

401 未授权

检查 API-KEY 是否正确

确认前面加了 Bearer (有空格)

模型不存在

模型名填写错误

文本过长

qwen3-embed-0.6B 支持最长 8192 token

超长需要分段

相关推荐
AI导出鸭PC端16 分钟前
智谱清言怎么生成word文档?AI导出鸭终结乱码烦恼
人工智能·ai·c#·word·豆包·ai导出鸭
iChochy39 分钟前
通过 ZenMux 使用 Claude Code CLI 解锁更多 AI 模型,包括 Claude 所有模型
ai·claude
Nile42 分钟前
Claude Code-Dynamic Workflows:1.为什么用工作流?
人工智能·ai·ai编程·ai-native
j_xxx404_1 小时前
MySQL库操作硬核解析:字符集、校验规则、大小写比较、备份恢复与连接排查
运维·服务器·数据库·人工智能·mysql·ai·oracle
龙骑士baby1 小时前
重建 AI 认知第 4 篇:Skill——提示词的系统化封装
ai·大模型·llm·prompt·skill
xixixi777772 小时前
空天地通信、高速光模块、AI 智能体攻击、同态加密芯片四大事件解读:AI 算力底座攻防与全域通信同步升级
大数据·人工智能·深度学习·ai·大模型·光模块·智能体
天工开物开源基金会2 小时前
中国首个!OPC AI开源生态孵化中心落地武汉,打通“人才+赛事+认证+孵化”完整闭环
ai·opc·武汉
阿演3 小时前
DataDjinn 新版本更新:国产数据库支持、连接树体验、AI 查询和表格编辑继续增强
数据库·人工智能·ai·ai编程
装不满的克莱因瓶3 小时前
深入PyTorch模型的训练与可视化 —— 掌握迁移学习等模型训练效果提升的办法
人工智能·pytorch·python·深度学习·神经网络·ai·迁移学习
ANnianStriver4 小时前
PetLumina 08 — 通知系统与搜索功能修复(广播机制 + 已读状态 + 参数对齐)
java·ai·ai编程·广播机制