从Token吞吐到多租户隔离:F5 AI安全解决方案加速智能体AI工作流落地

西雅图 -- 作为全球领先的应用交付和AI安全解决方案提供商,F5(NASDAQ: FFIV)日前宣布进一步扩展与NVIDIA的深度合作。此次升级通过整合F5 BIG-IP Next for Kubernetes与NVIDIA BlueField-3 DPU,构建出智能化基础设施层。F5 AI安全解决方案在此架构中显著提升GPU利用率及Token吞吐量、降低时延,并支持大规模多租户AI平台的安全构建。这一合作旨在帮助企业与GPU即服务提供商从实验阶段迈向规模化创收,将基础设施效率作为关键衡量指标。

  

Token是AI推理过程中生成的基本单位。当前行业衡量标准正从单纯的GPU部署规模转向Token经济指标,包括Token吞吐量、首个Token时间、单Token成本及单GPU收入。F5 AI安全解决方案正是围绕这些核心指标进行优化设计。经The Tolly Group验证测试,基于NVIDIA BlueField-3 DPU加速的F5 BIG-IP Next for Kubernetes实现了最高40%的Token吞吐提升、首个Token时间加快61%,以及整体请求时延降低34%。F5 AI安全解决方案通过将网络处理、TLS加密、AI感知负载均衡及流量管理卸载至DPU,释放主机CPU资源,让GPU专注于AI推理计算。这一架构无需修改模型即可提升GPU利用率、减少排队延迟、增强Token产出能力,从而在固定基础设施规模下实现更低的单Token成本。

面向智能体驱动的AI工作流,F5 AI安全解决方案已深度集成NVIDIA NIM统计数据、Dynamo运行时信号及GPU遥测信息,实现推理前的状态感知流量调度。F5 BIG-IP Next for Kubernetes增强版支持推理感知路由、集成NVIDIA DOCA Platform Framework简化DPU部署、基于EVPN-VXLAN与动态VRF的网络级多租户隔离,以及在Kubernetes AI环境中内建安全与可观测性。

F5首席产品官Kunal Anand指出:"F5 AI安全解决方案助力AI工厂将Token产出转化为可量化的业务指标,提升GPU产出效率并更自信地扩展共享型AI平台。

NVIDIA网络业务高级副总裁Kevin Deierling表示:"NVIDIA加速计算基础设施与F5 AI安全解决方案相结合,能够显著提升AI工厂的Token经济效益。

通过深度融合NVIDIA基础设施遥测与DPU加速能力,F5 AI安全解决方案正演进为AI工厂经济学的战略级控制平面,实现治理Token消耗、优化流量路径并提升投资回报率。企业无需过度资源预留即可从现有GPU中释放更高经济价值,最终将AI工厂转化为高效、可变现的业务平台,为智能体时代做好充分准备。

相关推荐
用户938515635072 分钟前
从 Prompt 到 Harness:AI 工程化的三年跃迁与实战解码
javascript·人工智能
甲维斯34 分钟前
Agnes免费生图批图API+一键生图软件!
人工智能
April6661 小时前
Prompt-only 已死,Harness 才是 2026 的分水岭
人工智能
没落英雄1 小时前
从零开始搭建一个 AI Agent —— LangChain + TypeScript 实战手记
前端·人工智能·架构
web_Leon2 小时前
为什么越来越多的大厂抛弃MCP,转向CLI?
人工智能·ai编程
用户3615567288182 小时前
给VSCode写个扩展,选中代码就问AI,SSE坑不少
人工智能
武子康2 小时前
调查研究-203 SpaceX IPO 总览:先别急着讲故事,先把发行事实和信息边界立住
人工智能·openai·agent
IT_陈寒3 小时前
Redis内存飙升的锅,原来是我没搞懂这个过期策略
前端·人工智能·后端
东坡肘子4 小时前
SPI 加入 Apple,Swift 迈向自举 -- 肘子的 Swift 周报 #142
人工智能·swiftui·swift