cloudflare AI gateway实战代理任意第三方大模型服务提供商

cloudflare AI gateway实战代理任意第三方大模型服务提供商

💡 关于本教程实战演示如何配置、使用cloudflare的AI gateway代理任意的第三方大模型服务提供商

大纲

cloudflare AI gateway能做什么

创建网关并添加自定义大模型服务商

实战对接自定义服务商

正文

cloudflare AI gateway能做什么

1、提供日志分析
2、缓存

也可以跳过或者设置缓存有效期,有缓存后就不用每次请求大模型了,而是cloudflare返回缓存的内容,这样可以节省一些费用。

跳过或者设置缓存有效期的文档:https://developers.cloudflare.com/ai-gateway/features/caching/

3、限速
4、重试和模型回退

可以处理请求失败时的处理场景,如失败时请求另一个模型。

5、代理自定义模型

这个是本文教程的核心。

创建网关并添加自定义大模型服务商

1、创建网关

https://dash.cloudflare.com/?to=/:account/ai/ai-gateway![](https://i-blog.csdnimg.cn/direct/3089dfe3390c40baaff435ccc4ccd420.jpg)点击创建:![](https://i-blog.csdnimg.cn/img_convert/c1e2f0bc73d77f998303d50ffd04d970.png)

我们回到ai gateway的首页: https://dash.cloudflare.com/?to=/:account/ai/ai-gateway 可以看到网关创建好了,我们点击配置自定义服务商:

我这里以某个newapi开发的大模型分发站为例做演示,我这里用的是https://www.dmxapi.cn/,有免费的模型可供测试之用:![](https://i-blog.csdnimg.cn/img_convert/ed17a08299922d4aa353a7dd8aadbec0.png)先注册一个账号并添加一个令牌:![](https://i-blog.csdnimg.cn/direct/0403df153cb047c1b1a39c76caf4566d.jpg)创建好后我们打开cloudflare的配置自定义服务商页面,点击添加:![](https://i-blog.csdnimg.cn/img_convert/a83253e2839dacc30882d83ba117de58.png)api地址见各大模型厂商文档:![](https://i-blog.csdnimg.cn/img_convert/574d09d3d86a1a25ccc59bbb0d8a51ec.png)![](https://i-blog.csdnimg.cn/direct/6312935b387e4459ab27f412f441f38b.jpg)创建好了。

我们进到网关,点击设置,创建身份验证令牌:记下生成的令牌,通过cloudflare AI gateway请求自定义大模型的curl:

复制代码
curl https://gateway.ai.cloudflare.com/v1/{account_id}/{gateway_id}/compat/{endpoint} \  -H "Authorization: Bearer $PROVIDER_API_KEY" \  -H "cf-aig-authorization: Bearer $CF_AIG_TOKEN" \  -H "Content-Type: application/json" \  -d '{    "model": "custom-some-provider/model-name",    "messages": [{"role": "user", "content": "Hello!"}]  }'

上面有6个字段要获取,我们一个个来:

1、account_id
2、gateway_id
3、$PROVIDER_API_KEY

这个是在dmxapi添加的令牌

4、$CF_AIG_TOKEN
5、custom-some-provider

我们创建的自定义服务商的名称,我之前创建的名称为:拼接起来就是:

复制代码
custom-dmxapi
6、model-name

这个就是自定义服务商支持的模型名称了,比如dmxapi有这些免费模型:我这里任选一个:qwen-flash

7、endpoint

某些大模型厂商是:

复制代码
v1/chat/completions

这个需要简单测试一下即可。

最后我的curl就是(其他参数需要自己拼接起来):
复制代码
curl https://gateway.ai.cloudflare.com/v1/{account_id}/{gateway_id}/compat/v1/chat/completions \  -H "Authorization: Bearer $PROVIDER_API_KEY" \  -H "cf-aig-authorization: Bearer $CF_AIG_TOKEN" \  -H "Content-Type: application/json" \  -d '{    "model": "custom-dmxapi/qwen-flash",    "messages": [{"role": "user", "content": "Hello!"}]  }'

发起请求,拿到结果:查看日志:

这样的话,我们只需要配置一下就能代理请求某个自定义的大模型,我们可能配置多个custom-、每个custom可以有多个模型,这样的话对接就简单很多,还能看到每次自己请求的内容和ai返回的内容是啥。

ok,大家有啥疑问的也可以在评论区留言,喜欢的朋友可以帮我分享一下谢谢~

相关推荐
会飞的老朱44 分钟前
医药集团数智化转型,智能综合管理平台激活集团管理新效能
大数据·人工智能·oa协同办公
聆风吟º2 小时前
CANN runtime 实战指南:异构计算场景中运行时组件的部署、调优与扩展技巧
人工智能·神经网络·cann·异构计算
Codebee4 小时前
能力中心 (Agent SkillCenter):开启AI技能管理新时代
人工智能
聆风吟º5 小时前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
uesowys5 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_56785 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子5 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
智驱力人工智能6 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_160144876 小时前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能
Howie Zphile6 小时前
全面预算管理难以落地的核心真相:“完美模型幻觉”的认知误区
人工智能·全面预算