从Token吞吐到多租户隔离:F5 AI安全解决方案加速智能体AI工作流落地

西雅图 -- 作为全球领先的应用交付和AI安全解决方案提供商,F5(NASDAQ: FFIV)日前宣布进一步扩展与NVIDIA的深度合作。此次升级通过整合F5 BIG-IP Next for Kubernetes与NVIDIA BlueField-3 DPU,构建出智能化基础设施层。F5 AI安全解决方案在此架构中显著提升GPU利用率及Token吞吐量、降低时延,并支持大规模多租户AI平台的安全构建。这一合作旨在帮助企业与GPU即服务提供商从实验阶段迈向规模化创收,将基础设施效率作为关键衡量指标。

  

Token是AI推理过程中生成的基本单位。当前行业衡量标准正从单纯的GPU部署规模转向Token经济指标,包括Token吞吐量、首个Token时间、单Token成本及单GPU收入。F5 AI安全解决方案正是围绕这些核心指标进行优化设计。经The Tolly Group验证测试,基于NVIDIA BlueField-3 DPU加速的F5 BIG-IP Next for Kubernetes实现了最高40%的Token吞吐提升、首个Token时间加快61%,以及整体请求时延降低34%。F5 AI安全解决方案通过将网络处理、TLS加密、AI感知负载均衡及流量管理卸载至DPU,释放主机CPU资源,让GPU专注于AI推理计算。这一架构无需修改模型即可提升GPU利用率、减少排队延迟、增强Token产出能力,从而在固定基础设施规模下实现更低的单Token成本。

面向智能体驱动的AI工作流,F5 AI安全解决方案已深度集成NVIDIA NIM统计数据、Dynamo运行时信号及GPU遥测信息,实现推理前的状态感知流量调度。F5 BIG-IP Next for Kubernetes增强版支持推理感知路由、集成NVIDIA DOCA Platform Framework简化DPU部署、基于EVPN-VXLAN与动态VRF的网络级多租户隔离,以及在Kubernetes AI环境中内建安全与可观测性。

F5首席产品官Kunal Anand指出:"F5 AI安全解决方案助力AI工厂将Token产出转化为可量化的业务指标,提升GPU产出效率并更自信地扩展共享型AI平台。

NVIDIA网络业务高级副总裁Kevin Deierling表示:"NVIDIA加速计算基础设施与F5 AI安全解决方案相结合,能够显著提升AI工厂的Token经济效益。

通过深度融合NVIDIA基础设施遥测与DPU加速能力,F5 AI安全解决方案正演进为AI工厂经济学的战略级控制平面,实现治理Token消耗、优化流量路径并提升投资回报率。企业无需过度资源预留即可从现有GPU中释放更高经济价值,最终将AI工厂转化为高效、可变现的业务平台,为智能体时代做好充分准备。

相关推荐
小雨下雨的雨3 小时前
井字棋AI机器人实现详解 - Minimax算法实战-鸿蒙PC Electron框架完成
前端·人工智能·算法·华为·electron·鸿蒙
aaaffaewrerewrwer5 小时前
免费在线 AVIF 转 WebP 工具推荐(支持批量转换 + 浏览器本地处理 + 无需上传)
安全·个人开发
我没胡说八道6 小时前
高校论文AI检测优化工具对比研究与实测分析(2026)
人工智能·深度学习·机器学习·计算机视觉·aigc·论文
秦亚伟6 小时前
AI浪潮重塑融资租赁行业新格局
人工智能
love530love6 小时前
LiveTalking 数字人项目 Windows 部署完全指南(EPGF 架构)
人工智能·windows·python·架构·livetalking·epgf
元启数宇6 小时前
喷淋AI布点实战:8小时人工布点→20分钟自动出图
人工智能
哈哈,柳暗花明6 小时前
人工智能专业术语详解(H)
人工智能·专业术语
圣殿骑士-Khtangc6 小时前
AI 编程工具 2026 实战横评:Cursor 3 vs Claude Code vs Copilot,开发者选型完全指南
人工智能·copilot
云器科技6 小时前
云器Lakehouse 2026年5月版本发布:拥抱 AI Agent,重塑数据智能开发新范式
人工智能
小鹰-上海鹰谷-电子实验记录本6 小时前
第六届党建引领科创生态座谈会 | 邓光辉博士出席分享AI赋能创新药科研新范式
人工智能·ai·电子实验记录本·药企合规