技术栈

token限流

庞轩px
3 小时前
网关·大模型·负载均衡·webflux·token限流·api密钥
大模型推理网关——从负载均衡到故障注入的完整设计在上一篇文章中,我们实现了AI课程问答助手,它能让用户通过SSE流式调用大模型。但这个方案有一个隐含的问题:API密钥直接暴露在后端代码中,单点调用,没有容灾。
我是有底线的