从Token吞吐到多租户隔离:F5 AI安全解决方案加速智能体AI工作流落地

西雅图 -- 作为全球领先的应用交付和AI安全解决方案提供商,F5(NASDAQ: FFIV)日前宣布进一步扩展与NVIDIA的深度合作。此次升级通过整合F5 BIG-IP Next for Kubernetes与NVIDIA BlueField-3 DPU,构建出智能化基础设施层。F5 AI安全解决方案在此架构中显著提升GPU利用率及Token吞吐量、降低时延,并支持大规模多租户AI平台的安全构建。这一合作旨在帮助企业与GPU即服务提供商从实验阶段迈向规模化创收,将基础设施效率作为关键衡量指标。

Token是AI推理过程中生成的基本单位。当前行业衡量标准正从单纯的GPU部署规模转向Token经济指标,包括Token吞吐量、首个Token时间、单Token成本及单GPU收入。F5 AI安全解决方案正是围绕这些核心指标进行优化设计。经The Tolly Group验证测试,基于NVIDIA BlueField-3 DPU加速的F5 BIG-IP Next for Kubernetes实现了最高40%的Token吞吐提升、首个Token时间加快61%,以及整体请求时延降低34%。F5 AI安全解决方案通过将网络处理、TLS加密、AI感知负载均衡及流量管理卸载至DPU,释放主机CPU资源,让GPU专注于AI推理计算。这一架构无需修改模型即可提升GPU利用率、减少排队延迟、增强Token产出能力,从而在固定基础设施规模下实现更低的单Token成本。

面向智能体驱动的AI工作流,F5 AI安全解决方案已深度集成NVIDIA NIM统计数据、Dynamo运行时信号及GPU遥测信息,实现推理前的状态感知流量调度。F5 BIG-IP Next for Kubernetes增强版支持推理感知路由、集成NVIDIA DOCA Platform Framework简化DPU部署、基于EVPN-VXLAN与动态VRF的网络级多租户隔离,以及在Kubernetes AI环境中内建安全与可观测性。

F5首席产品官Kunal Anand指出:"F5 AI安全解决方案助力AI工厂将Token产出转化为可量化的业务指标,提升GPU产出效率并更自信地扩展共享型AI平台。

NVIDIA网络业务高级副总裁Kevin Deierling表示:"NVIDIA加速计算基础设施与F5 AI安全解决方案相结合,能够显著提升AI工厂的Token经济效益。

通过深度融合NVIDIA基础设施遥测与DPU加速能力,F5 AI安全解决方案正演进为AI工厂经济学的战略级控制平面,实现治理Token消耗、优化流量路径并提升投资回报率。企业无需过度资源预留即可从现有GPU中释放更高经济价值,最终将AI工厂转化为高效、可变现的业务平台,为智能体时代做好充分准备。

相关推荐
阿部多瑞 ABU2 小时前
法律-社会悖论:一种根本矛盾的辩证分析
安全
纤纡.2 小时前
从零搭建 AI 智能 PDF 问答工具:Streamlit+LangChain + 千问大模型实战
人工智能·阿里云·语言模型·langchain
莱歌数字2 小时前
汽车外流场仿真+深度学习预测:风阻优化的“秒级革命”
人工智能·科技·汽车·电脑·制造·散热
LaughingZhu2 小时前
Product Hunt 每日热榜 | 2026-05-12
大数据·人工智能·经验分享·神经网络·产品运营
Resistance丶未来2 小时前
从零构建大语言模型:核心原理与实战落地
人工智能·ai·语言模型·自然语言处理·nlp·多模态大模型·ai工具
eastyuxiao2 小时前
数字孪生(Digital Twin)从入门到实战教程
大数据·人工智能·数字孪生
皮皮学姐分享-ppx2 小时前
上市公司数字技术风险暴露数据(2010-2024)|《经济研究》同款大模型测算
大数据·网络·数据库·人工智能·chatgpt·制造
Jay-r2 小时前
ChatGPT 官网入口(2026 年最新版)——简明指南
人工智能·语言模型·chatgpt·ai助手·chatgpt5.5
小星AI2 小时前
LangGraph 超详细教程,附源码
人工智能·agent
JavaAgent架构师2 小时前
前端AI工程化(一):AI通信协议深度解析
前端·人工智能