AI-Gateway:一款整合了OpenAI、Anthropic、LLama2等大语言模型的统一API接口

关于AI-Gateway

AI-Gateway是一款针对大语言模型的统一API接口,该接口可以用在应用程序和托管的大语言模型(LLM)之间,该工具可以允许我们通过一个统一的API接口将API请求转发给OpenAI、Anthropic、Mistral、LLama2、Anyscale、Google Gemini等大语言模型。

功能特性

1、功能非常快,体积非常小;

2、跨多模型和提供商实现负载均衡;

3、支持回退以确保应用程序保持弹性;

4、默认配置下,支持自动重试;

5、可根据需要安装中间件;

6、支持多种大语言模型;

支持的SDK

|-------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 编程语言 | 支持的SDK |
| Node.js / JS / TS | Portkey SDK OpenAI SDK LangchainJS LlamaIndex.TS |
| Python | Portkey SDK OpenAI SDK Langchain LlamaIndex |
| Go | go-openai |
| Java | openai-java |
| Rust | async-openai |
| Ruby | ruby-openai |

工具安装&部署

本地部署

如果你熟悉Node.js和npx的话,可以直接在本地安装和部署你自己的AI-Gateway:

复制代码
npx @portkey-ai/gateway

安装完成后,就可以打开浏览器并访问下列地址使用AI-Gateway了:

复制代码
http://localhost:8787

Cloudflare Worker部署

使用下列命令将该项目源码克隆至本地:

复制代码
git clone https://github.com/portkey-ai/gateway

然后安装NPM依赖:

复制代码
cd gateway

npm i

使用wrangler部署即可:

复制代码
npm run deploy

Node.js部署

使用下列命令将该项目源码克隆至本地:

复制代码
git clone https://github.com/portkey-ai/gateway

然后安装NPM依赖:

复制代码
cd gateway

npm i

npm run build

然后运行Node服务器:

复制代码
node build/start-server.js

Docker部署

广大研究人员也可以直接使用Docker来运行AI-Gateway:

复制代码
docker run -d -p 8787:8787 portkeyai/gateway:latest

Docker-Compose部署

使用下列命令下载Compose文件:

复制代码
wget "https://raw.githubusercontent.com/Portkey-AI/gateway/main/docker-compose.yaml"

然后运行Docker-Compose即可:

复制代码
docker compose up -d

服务当前会运行并监听8787端口。

AI-Gateway配置

AI-Gateway支持通过自定义配置来实现多功能路由策略,例如回退、负载均衡和自动重连等。

我们可以通过x-portkey-config Header在调用OpenAI时应用下列配置信息:

复制代码
// 使用OpenAI JS SDK时

const client = new OpenAI({

  baseURL: "http://127.0.0.1:8787", // The gateway URL

  defaultHeaders: {

    'x-portkey-config': {.. your config here ..},

  }

});

下面给出的样例配置会在回退至Gemini Pro之前尝试向OpenAI发送5次请求:

复制代码
{

  "retry": { "count": 5 },

  "strategy": { "mode": "fallback" },

  "targets": [{

      "provider": "openai",

      "api_key": "sk-***"

    },{

      "provider": "google",

      "api_key": "gt5***",

      "override_params": {"model": "gemini-pro"}

  }]

}

下面的配置将启动负载均衡功能:

复制代码
{

  "strategy": { "mode": "loadbalance" },

  "targets": [{

      "provider": "openai",

      "api_key": "sk-***",

      "weight": "0.5"

    },{

      "provider": "openai",

      "api_key": "sk-***",

      "weight": "0.5"

    }

  ]

}

工具使用

下面的例子中,我们将通过AI-Gateway尝试向OpenAI发送一个Chat completions调用:

复制代码
curl '127.0.0.1:8787/v1/chat/completions' \

  -H 'x-portkey-provider: openai' \

  -H "Authorization: Bearer $OPENAI_KEY" \

  -H 'Content-Type: application/json' \

  -d '{"messages": [{"role": "user","content": "Say this is test."}], "max_tokens": 20, "model": "gpt-4"}'

许可证协议

本项目的开发与发布遵循MIT开源许可证协议。

项目地址

AI-Gateway :【GitHub传送门

参考资料

AI Gateway - Simplify Your LLM Integrations | Portkey

https://hub.docker.com/r/portkeyai/gateway

相关推荐
开发者每周简报32 分钟前
求职市场变化
人工智能·面试·职场和发展
AI前沿技术追踪1 小时前
OpenAI 12天发布会:AI革命的里程碑@附35页PDF文件下载
人工智能
余~~185381628001 小时前
稳定的碰一碰发视频、碰一碰矩阵源码技术开发,支持OEM
开发语言·人工智能·python·音视频
galileo20161 小时前
LLM与金融
人工智能
DREAM依旧2 小时前
隐马尔科夫模型|前向算法|Viterbi 算法
人工智能
GocNeverGiveUp2 小时前
机器学习2-NumPy
人工智能·机器学习·numpy
B站计算机毕业设计超人3 小时前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
学术头条3 小时前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客3 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
feifeikon3 小时前
机器学习DAY3 : 线性回归与最小二乘法与sklearn实现 (线性回归完)
人工智能·机器学习·线性回归