百度百舸

百度智能云技术站

百度百舸全栈 AI Infra 助力具身模型加速迭代本文整理自 2026 年 5 月 14 日 Create2026 百度 AI 开发者大会 - 具身智能专场，百度智能云主任架构师应茹的同名主题演讲。

百度智能云技术站

国产 AI Infra 规模化落地实践：软硬协同与极致加速本文整理自 2026 年 5 月 14 日 Create2026 百度 AI 开发者大会 - AI Infra 专题论坛，百度智能云混合云部总经理杜海的同名主题演讲。

百度智能云技术站

Agent Native：重构 AI 云基础设施本文整理自 2026 年 5 月 13 日 Create2026 百度 AI 开发者大会 - 技术与产品主论坛，百度集团副总裁侯震宇的主题演讲《Agent Native：重构 AI 云基础设施》。

百度智能云技术站

百度百舸 x 昆仑芯，加速 GLM-5.1 从开源发布到规模化应用今日，智谱正式开源新一代大模型 GLM 5.1。作为智谱 GLM 系列的最新力作，GLM-5.1 的整体能力得到了全面提升。尤其在代码能力上：在最接近真实软件开发的 SWE-bench Pro 基准测试中，GLM-5.1 超过 GPT-5.4、Claude Opus 4.6，刷新全球最佳成绩。此外，GLM-5.1 还在长程任务（Long Horizon Task）处理能力上实现了显著突破，有别于当前以分钟级交互为主的模型，GLM-5.1 可在单次任务中持续、自主地工作长达 8 小时，凭借自主规划、执行与迭

百度智能云技术站

百度百舸 Day0 完成昆仑芯和智谱 GLM-5 适配，实现「发布即可用」今日，智谱正式发布新一代大模型 GLM-5。与此同时，百度百舸 Day0 完成昆仑芯 P800 和 GLM-5 适配，用户可以在 vLLM、SGLang 等推理框架上第一时间进行业务部署。

百度智能云技术站

百度百舸基于昆仑芯 XPU 完成 GLM-4.x 在 SGLang 与 vLLM 上的适配落地近日，百度百舸基于 SGLang 与 vLLM 主流推理框架，成功完成智谱 GLM-4.x 系列语言模型（GLM-4.5 / GLM-4.5-Air / GLM-4.6 / GLM-4.7）在昆仑芯 XPU 平台上的适配与验证。

百度智能云技术站

百度百舸 X 昆仑芯 | 开源 vLLM-Kunlun Plugin，快速适配新模型、跑出极致性能为解决国产芯片部署开源大模型的效率与性能瓶颈，百度百舸联合昆仑芯正式推出 vLLM-Kunlun Plugin —— 一款面向百度昆仑芯 XPU 的高性能 vLLM 平台插件，该 Plugin 现已全面开源。

百度智能云技术站

百度百舸 DeepSeek 一体机发布，支持昆仑芯 P800 单机 8 卡满血版开箱即用在私有云环境中成功部署 DeepSeek 满血版并实现性能调优，并不是一件容易的事情。选择合适的 GPU 配置、安装相应的环境、成功部署上线业务、加速推理任务加速、支撑多用户并发 …… 完成业务测试，成功融入生产业务中。

百度智能云技术站

如何定量分析 Llama 3，大模型系统工程师视角的 Transformer 架构读完全文后，你将获得回答以下问题的能力（参考答案，请见最后一章节）：Llama 3 技术博客说 70B 模型、最长序列 8K、15T Tokens，训练了 640w GPU 时，这发挥了 H100 理论算力（989TFlops）的百分之多少?

我是有底线的