随着 DigitalOcean 的 Agentic Inference Cloud 持续扩展,现在推出全新的搭载了 AMD Instinct™ MI350X GPU 的高性能 GPU Droplets云服务器。通过将这一旗舰款 GPU 集成到 DigitalOcean 的云平台中,DigitalOceean 将继续为领先的 AI 企业和开发者提供可规模化运行复杂推理工作负载的算力资源与服务。
使用 AMD Instinct™ MI350X 优化生产级推理
AMD Instinct™ MI350X 系列为生成式 AI 和高性能计算(HPC)树立了新的标杆。该系列基于 AMD CDNA™ 4 架构打造,专为最严苛的任务而设计,包括大规模模型训练、高速推理以及复杂的科学仿真。
这款 GPU 专门针对计算密集型的 prefill 阶段进行了优化,同时在低延迟条件下保持较高的 token 生成吞吐量。它不仅可以承载更大的模型和更长的上下文窗口,还能在单张 GPU 上处理更多并发的推理请求。配合 DigitalOcean 优化过的推理平台,整体性能进一步提升,实现更低延迟和更高吞吐。
为 AI 创新者带来的验证成果
我们已经看到,当客户将 DigitalOcean 优化的平台与 AMD 硬件结合时,可以释放出怎样的潜力。今年早些时候,我们帮助 Character.AI将生产环境中的请求吞吐量提升了 2 倍,同时将推理成本降低了 50%。
如今,像 ACE Studio 这样的客户正使用 DigitalOcean 软件与 AMD 硬件的组合,推动音乐创作的边界。"在 ACE Studio,我们的使命是打造面向未来音乐创作的 AI 驱动音乐工作站,"联合创始人兼 CTO Sean Zhao 表示。"随着我们在 DigitalOcean 上持续扩展部署,下一代 AMD Instinct™ MI350X 架构,以及 AMD 与 DigitalOcean 在推理优化方面的紧密合作,为我们进一步提升客户侧的性能与成本效率奠定了坚实基础。"
企业级性能,成本可控,运维简单
除了提供最新的 AMD GPU,我们也始终坚持透明与简洁的原则,确保这项强大的技术能够被开发者和成长型企业轻松采用:
可预测且高性价比的定价:我们提供透明的按使用量计费模式,支持灵活合约,无隐藏费用。
简单部署:GPU Droplets 可在数次点击内完成创建与配置,涵盖安全、存储和网络需求,相比复杂的云环境大幅简化部署流程。
企业级特性支持:GPU Droplets 提供企业级 SLA、可观测性功能,并支持 HIPAA 合规和 SOC 2 认证。
未来计划
全新的搭载了AMD Instinct™ MI350X 的 GPU Droplets 云服务器目前已在亚特兰大(ATL1)数据中心上线。下个季度,我们还将部署 AMD Instinct™ MI355X GPU,并引入液冷机架,以支持更大规模的数据集和模型。
准备好扩展你的 AI 生产环境了吗?欢迎联系DigitalOcean中国区战略合作伙伴卓普云AI Droplet团队,了解更多关于 AMD Instinct™ MI350X 在 DigitalOcean 上的能力,并立即开始在 Agentic Inference Cloud 上构建你的应用。