EverMemOS 访问外部(deepinfra)API接口

EverMemOS 访问外部API接口


📋 概述

  • EverMemOS 通过调用 外部大模型API 服务,实现evermemos内部业务响应,请求三方接口详情

✅ 目标接口

接口 功能 输入格式 输出格式
POST /v1/chat/completions 大语言模型对话 Chat Completions 格式 Chat 格式
POST /v1/reranker 文档重排序 Rerank Service 统一请求格式 统一响应格式(含 rank)
POST /v1/embeddings 文本向量化 Vectorize Service 请求格式(支持 is_query Embedding 格式

详细接口说明

1. /v1/chat/completions

功能描述

生成基于输入消息的聊天响应,使用配置的 LLM 引擎。

请求参数
参数名 类型 是否必需 默认值 描述
model string None 模型名称
messages array of object None 聊天消息列表,每个消息包含 rolecontent 字段
temperature float 0.7 生成温度,控制输出随机性
max_tokens integer 1024 最大生成 token 数
stream boolean false 是否流式输出
response_format object None 响应格式
请求示例
json 复制代码
{
  "model": "qwen-7b",
  "messages": [
    {
      "role": "user",
      "content": "你好,请介绍一下自己"
    }
  ],
  "temperature": 0.7,
  "max_tokens": 512
}
响应结构
字段名 类型 描述
id string 响应 ID
object string 对象类型,固定为 "chat.completion"
created integer 创建时间戳
model string 使用的模型名称
choices array of object 响应选项列表
choices[].index integer 选项索引
choices[].message object 包含 rolecontent 的消息对象
choices[].finish_reason string 完成原因
usage object 令牌使用情况
usage.prompt_tokens integer 提示令牌数
usage.completion_tokens integer 完成令牌数
usage.total_tokens integer 总令牌数
响应示例
json 复制代码
{
  "id": "chatcmpl-abcdef123456",
  "object": "chat.completion",
  "created": 1689123456,
  "model": "qwen-7b",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好!我是一个基于 Qwen 模型的 AI 助手,很高兴为你服务。请问有什么我可以帮助你的吗?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 25,
    "total_tokens": 35
  }
}

2. /v1/embeddings

功能描述

生成文本的嵌入向量,可用于文本相似度计算、检索等任务。

请求参数
参数名 类型 是否必需 默认值 描述
input array of string None 要生成嵌入的文本列表
model string "dengcao/Qwen3-Embedding-0.6B" 模型名称
encoding_format string "float" 编码格式
dimensions integer 1024 嵌入维度
is_query boolean false 是否为查询文本
请求示例
json 复制代码
{
  "input": ["人工智能的发展历程", "机器学习的基本原理"],
  "model": "dengcao/Qwen3-Embedding-0.6B",
  "is_query": false
}
响应结构
字段名 类型 描述
object string 对象类型,固定为 "list"
data array of object 嵌入数据列表
data[].object string 数据对象类型,固定为 "embedding"
data[].embedding array of float 嵌入向量
data[].index integer 索引
model string 使用的模型名称
usage object 使用情况
usage.prompt_tokens integer 提示令牌数
usage.total_tokens integer 总令牌数
响应示例
json 复制代码
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "embedding": [0.123, 0.456, -0.789, ...],
      "index": 0
    },
    {
      "object": "embedding",
      "embedding": [0.987, -0.654, 0.321, ...],
      "index": 1
    }
  ],
  "model": "dengcao/Qwen3-Embedding-0.6B",
  "usage": {
    "prompt_tokens": 2,
    "total_tokens": 2
  }
}
错误处理
状态码 描述
500 内部服务器错误,返回错误详情

3. /v1/reranker

功能描述

根据查询对文档列表进行重排序,返回按相关性排序的结果。

请求参数
参数名 类型 是否必需 默认值 描述
query string None 查询文本
documents array of string None 文档列表
model string "dengcao/Qwen3-Reranker-0.6B" 模型名称
instruction string "Given a search query, retrieve relevant passages that answer the query" 指令文本
请求示例
json 复制代码
{
  "query": "人工智能的应用领域",
  "documents": [
    "人工智能在医疗领域的应用包括疾病诊断和药物研发",
    "机器学习是人工智能的一个重要分支",
    "人工智能在金融领域用于风险评估和欺诈检测",
    "人工智能的发展历史可以追溯到上世纪50年代"
  ],
  "model": "dengcao/Qwen3-Reranker-0.6B"
}
响应结构
字段名 类型 描述
results array of object 排序结果列表
results[].index integer 原始文档索引
results[].score float 相关性分数
results[].rank integer 排序 rank
model string 使用的模型名称
input_tokens integer 输入令牌数
request_id string 请求 ID
响应示例
json 复制代码
{
  "results": [
    {
      "index": 0,
      "score": 0.95,
      "rank": 0
    },
    {
      "index": 2,
      "score": 0.90,
      "rank": 1
    },
    {
      "index": 3,
      "score": 0.75,
      "rank": 2
    },
    {
      "index": 1,
      "score": 0.60,
      "rank": 3
    }
  ],
  "model": "dengcao/Qwen3-Reranker-0.6B",
  "input_tokens": 50,
  "request_id": "uuid-123456"
}

✅ 3. 启动与测试

测试命令

Chat
bash 复制代码
curl -X POST http://xxx.xxx.xxx/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3:4b",
    "messages": [{"role": "user", "content": "你好!"}]
  }'
Embedding
bash 复制代码
curl -X POST http://xxx.xxx.xxx/v1/embeddings \
  -H "Content-Type: application/json" \
  -d '{
    "input": ["这里太暗了"],
    "is_query": true
  }'
Reranker
bash 复制代码
curl -X POST http://xxx.xxx.xxx/v1/reranker \
  -H "Content-Type: application/json" \
  -d '{
    "query": "这里太暗了",
    "documents": ["请打开灯", "今天天气很好"]
  }'

相关推荐
wangmengxxw1 小时前
SpringAI-MySQLMcp服务
java·人工智能·mysql·大模型·sse·springai·mcp
GHL2842710901 小时前
*:端口 & 127.0.0.1:端口
运维·服务器·c++
John Song1 小时前
miniconda是否初始化?
linux·运维·服务器·python
鱼毓屿御1 小时前
Tailwind CSS配置进阶
前端·css
Mr Xu_2 小时前
Git常用指令
前端·git
michael_ouyang2 小时前
IM 会话同步企业级方案选型
前端·websocket·electron·node.js
爱装代码的小瓶子2 小时前
【Linux基础】操作系统下的进程与虚拟内存的关系
android·java·服务器
betazhou2 小时前
借用Deepseek写一个定期清理备份文件的ps脚本
开发语言·前端·javascript·ps·deepseek·清理备份文件
淮北4942 小时前
大模型学习(二、使用lora进行微调)
java·服务器·学习