CloudWeGo 技术沙龙暨四周年庆典活动回顾:高性能微服务技术实践与 AI 新范式

2025年9月20日,CloudWeGo "高性能微服务技术实践与 AI 新范式" 主题沙龙暨四周年庆典在北京圆满举办。作为 CloudWeGo 开源项目四周年的重要纪念活动,本次沙龙聚焦微服务与AI 技术的深度融合,吸引了来自企业、开发者社区的百余位参与者,共同探讨高性能技术实践与 AI 新范式的落地路径,见证 CloudWeGo四年的发展成果。

活动全程包含 8 场主题演讲,覆盖微服务流式能力优化、企业级落地案例、Rust 框架迭代、高性能编译器创新、Go2Rust 工程迁移、AI 代码深度理解、Java 生态扩展及多 Agent 构建实践,全面展现 CloudWeGo 在技术深耕与生态拓展上的成果。其中,王宇轩详细解读了 Kitex/Hertz 对大模型应用的流式支撑,马永真分享了抖音搜索核心链路的 Kitex 流式改造实践,王杰介绍了Volo 框架在 HTTP 与 RPC 领域的易用性及性能升级,陈卓钰揭秘了基于 Rust 的高性能 Go 编译器 ROG,范广宇提出了 "半空" 富脚手架模式助力 Go2Rust 迁移,尹旭然介绍了 Deep Code Research 与 ABCoder 的结合应用,马跃伟拓展了ABCoder 的 Java 生态落地,王德政提出了 Eino adk 与 a2a 构建 Multi-Agent 的方案。主题演讲后设置自由问答环节,观众结合自身业务痛点提问,嘉宾分享更多实操经验,推动技术落地思路碰撞。

本次技术沙龙的演讲视频和 PPT 可通过文末链接🔗获取!

演讲亮点

> 提升流式开发效率与易用性:Kitex/Hertz 为大模型应用保驾护航

字节跳动服务框架团队研发工程师、Kitex/Hertz 项目 Maintainer 王宇轩分享了过去一年 CloudWeGo 的 Kitex 与 Hertz 框架在流式能力上的升级。从大模型应用框架来看,Kitex 和 Hertz 提供适配 "一问多答" 模式的流式能力。Hertz 用 SSE 协议实现端上交互,Kitex Streaming 依靠 gRPC 与自研 TTHeader Streaming 协议处理服务间通信。以 Chat 场景为例,API 服务、Chat 服务、大模型通过流式接口串联,但落地面临会话中断、流式异常、流式监控问题。

针对这些问题,Kitex gRPC 用 ctx cancel 控制 Stream 生命周期,优化 gRPC 错误描述补充关键信息,新增 Recv/Send QPS 与 Stream 状态事件完善监控;同时推出 StreamX 新接口统一 ctx 设计,拆分 Option 配置、提供三类流式中间件,自研 TTHeader Streaming 协议解决排查难题,并支持流式泛化 Server 与调试。未来计划开源最佳实践、提供 open-telemetry 版本监控、迭代协议并优化 WebSocket 适配语音场景。

视频回放:www.bilibili.com/video/BV1iq...

> 企业级落地案例:抖音搜索核心链路基于 Kitex 流式改造的技术实践

抖音搜索的产品性能与核心业务指标强相关,此前存在预取命中率低、结果可取消、优化难度高的痛点。字节跳动抖音搜索服务端架构研发工程师马永真介绍了团队结合业务特点优化对抖音搜索的 Kitex 流式改造实践全过程,先通过 "首屏结果拆分" 将打包请求拆为两次返回,优先推首屏数据;后推出 "首屏预测" 方案,API 层同时请求引擎与缓存,校验后再推端上以减短等待。

技术选型上,团队选择 "HTTP 流式" 避免 "多次请求" 的请求量翻倍与实例不匹配问题,早期因为 Kitex 不支持流式用临时方案致架构复杂、风险高;改造后,API 与 loader 服务仅需一次打包,借流式接口简化交互,降低请求量与内存占用,打包成功率提升。在业务收益方面,热点卡 / 活动卡场景首屏加速平均提 14%、部分达 50%,搜索核心指标正向优化。未来计划将流式优化拓展至引擎检索层,针对特型卡优先返回数据以降链路耗时。

视频贡献:www.bilibili.com/video/BV1uv...

> Volo 新能力:面向易用性与性能的 HTTP & RPC 框架迭代

Volo 作为 Rust 微服务生态的高性能框架,通过统一抽象解耦 "协议、治理、传输",已实现 volo-thrift、volo-grpc、volo-http 三大协议框架,配套 pilota 编解码工具、metainfo 元信息透传、volo-cli 命令行工具。

字节跳动服务框架团队研发工程师、Volo/Pilota 项目 Maintainer 王杰,介绍了 Rust 框架 Volo 的迭代升级,聚焦 RPC 能力补全、HTTP 生态优化及 Rust 工程成本解答。2025 年重点升级 RPC 生成代码能力,支持 pb unknown fields 以零拷贝保留 proto 未定义字段,支持 pb options实现编解码控制,实现 thrift field mask 动态裁剪字段,且与 Kitex 体验一致降低迁移成本。volo-http 0.4 新增 HTTP/2 支持、连接池优化与 Trace 增强,提升高并发稳定性;Rust 生态同步更新 sonic-rs 0.5、linkedbytes。未来计划扩展 thrift 相关能力、适配 shmipc 降低通信开销,并完善服务发现与治理组件。针对小公司关注的 Rust 工程成本,她表示字节内部实践显示 Go 迁移 Rust 后 CPU 占用降 40%-50%,降本增效收益显著;Volo 生态已覆盖微服务核心能力且持续优化易用性,适合新业务选型或核心链路性能优化。

视频回放:www.bilibili.com/video/BV1ii...

>ROG 技术剖析和业务落地

字节跳动服务框架团队研发工程师陈卓钰提出ROG 的设计源于字节内部海量 Go 服务的性能需求 ,原版 Go 编译器为追求编译速度牺牲优化空间,而 LLVM 后端具备成熟的高性能优化能力。ROG 采用 "Rust 重构前端 + LLVM 后端 + Rust runtime" 架构,既实现与 Go 100% 语法兼容,又能借助 LLVM 支持 LTO、PGO 等高级优化,结合 Rust runtime 的高效内存管理与 GC 设计,显著提升执行性能。

核心模块上,内存分配器通过分级管理支持 1TB 堆大小与批量释放,高频分配无需加锁且优化缓存局部性;GC 默认采用 STW 算法,流程涵盖 "标记准备 - 多线程并发标记 - 终止标记 - 清理未标记对象",未来计划支持多 GC 策略。同时,ROG 还解决了 LLVM 对带 GC 语言的适配难题,比如插入 GC 写屏障防止指针丢失、处理栈动态扩展、通过 checkpoint 实现抢占式调度。纯计算程序中,ROG 编译后执行耗时2.912 秒远低于原版 Go12.99 秒;Kitex 压测时,ROG QPS较 Go提升 10%-20%,线上试点服务 CPU 占用也明显下降。此外,ROG 支持 Go 与 Rust 混编链接,可替代 CGo 实现 FFI 调用,有效降低跨语言开发成本。

视频回放:www.bilibili.com/video/BV1td...

>「半空」富脚手架模式:字节 Go2Rust 工程落地

字节跳动服务框架团队研发工程师范广宇介绍到Go2Rust 源于字节内部迁移实践。ROG 能让 Go 服务 "零改造" 享 Rust 性能收益,但完全迁移需突破 Rust 学习门槛与依赖收敛难题;"半空" 富脚手架模式基于 ABCoder 工具,解析 Go 项目为带调用关系的语法树,结合大模型与迁移经验,输出 "100% 可编译且含业务逻辑的 Rust 脚手架",支持渐进式迁移。

整体迁移可以分成三阶段:翻译前自动生成项目文档、梳理依赖标记难度、规划迁移资源;翻译中通过 IDE 插件触发,完成框架映射与 IDL 搜集,以 "节点" 为单位递归翻译并生成符合 Rust 最佳实践的代码;翻译后借 Agent 修复编译报错,用 IDE 插件校验 Rust 与 Go 代码一致性。目前内部迁移仓库平均编译度 80%,Agent 优化后可全量编译。未来计划引入 Deep Research 架构重构为 Rust 原生风格,同时建立用户反馈机制优化翻译质量。

视频回放:www.bilibili.com/video/BV1L6...

>Deep Code Research:当 Deep Research 遇上 ABCoder

传统大模型处理代码理解时,存在两大痛点:一是 "原料不精准",语义化搜索或关键词匹配易引入无用信息,导致上下文溢出;二是 "流程繁重",面对几十万行代码,分段落阅读难以覆盖所有关键节点。字节跳动服务框架团队研发工程师尹跃然给出Deep Code Research,通过模拟人工读码逻辑,从起始节点向深层探索,仅保留有用信息,同时拆解任务,如将 "找所有 API" 拆分为 "找 API 列表→查每个 API 详情",降低模型注意力负担。

落地案例中,查找工厂类实现时,结合 ABCoder 的节点定位与 Deep Code Research 的逐层探索,可精准识别 Spring Boot 的 @Service 注解与对应的 Handle 逻辑,相比传统搜索效率提升显著。目前已在知识库多维度增强,火焰图分析、稳定性优化、CodeCR 等场景落地,未来计划从 AICoding 向全流程 AI Development 拓展,助力开发者降本增效。

视频回放:www.bilibili.com/video/BV1Xy...

>ABCoder Java 扩展和应用落地

字节跳动集团信息系统研发工程师马跃伟详细解读了ABCoder 的核心功能,将代码仓库解析为结构化 AST,建立 "仓库 - 包 - 类 - 方法" 的层级关系。它能为大模型提供精准的代码知识,支撑业务知识库搭建、AICoding、BUG 修复、源码问答等多种场景。此前 ABCoder 仅支持 Go 和 Rust,针对 Java 扩展采用 "Treesitter+LSP" 方案。其中 Treesitter 实现毫秒级语法解析,可快速识别类、方法等符号;LSP负责处理语义依赖,比如类的调用关系。这两种方案均为语言无关设计,既能避免重复开发,又能提升解析性能。

从技术原理来看,整个流程分三步:首先扫描 Java 项目,通过 Treesitter 解析语法符号并生成 AST;接着借助 LSP 获取符号的调用与依赖关系,比如某方法的定义位置和 57 次引用记录;最后构建 "节点 - 关系" 图,生成结构化数据承载仓库信息。该方案能精准提取关键代码节点,相比随机截取代码,大幅提升大模型对代码的理解精度。业务实践中,面对几十万行代码的系统,通过 ABCoder 构建结构化知识库后,可支撑需求映射、技术方案生成、执行计划落地。在部分场景下,代码准确率能达到 90%,且输出结果稳定可控,很适合工程化推广。

视频回放:www.bilibili.com/video/BV1hY...

>如何构建 MultiAgent------Eino adk 与 a2a 实践

字节跳动 AI 应用开发平台研发工程师、Eino 项目 Maintainer 王德政介绍道,Eino 是 Golang 开源 AI 应用开发框架,此前已支持组件抽象与 Graph 编排。新增的 ADK 提供 Agent 级抽象,核心是统一 RUN 方法与数据结构,能实时返回 Agent 输出、指令和报错,支持上下文传递与中断恢复;还具备多 Agent 协作能力,内置多款开箱即用 Agent,降低开发成本。

A2A 协议适配层面,Eino 支持双向封装:可将本地 Agent 发布为 A2A 服务,也能把远程 A2A 服务转为本地 Agent,开发者无需关注底层协议。例如构建旅游规划 Multi-Agent 时,Planner 生成计划、Executor 执行、Replaner 优化,流程通过 ADK 的 Planandexecute Agent 串联,同时集成远程服务。目前 ADK 已随 Eino V5.0 发布,A2A 处于 Alpha 版本,后续将持续迭代优化。

视频回放:www.bilibili.com/video/BV1qi...

自由问答

活动尾声设置了自由问答环节,现场观众围绕社区资源获取、技术学习路径、工具落地场景、AI 辅助工具推荐及 Go2Rust 迁移验证等核心方向积极提问,涵盖开发者、运维转岗人员等不同群体的实际诉求,嘉宾针对各类疑问逐一进行专业回应,既解答了具体操作层面的问题,也分享了技术落地的规划与实践经验。

总结

本次北京站技术沙龙暨四周年庆典,不仅全面展示了 CloudWeGo 在微服务与 AI 领域的技术深从 Kitex/Hertz 的流式能力、Volo 的 Rust 生态,到 ROG 编译器、ABCoder 工具链、Eino 多 Agent 框架,覆盖从底层技术到上层应用的全链路实践;更见证了CloudWeGo 四年的发展成果:核心项目 Star 数突破 4 万,汇聚近 600 位贡献者,逐步成长为一个真正由开发者共建、共享、共治的开源社区。

CloudWeGo 自 2021 年开源以来,持续迭代 Kitex、Hertz、Volo、Eino 等核心组件,形成技术矩阵,同时通过技术沙龙、开源贡献、文档建设等方式,构建开发者共建共享的社区生态。未来,社区将继续聚焦微服务与 AI 的融合创新,开源更多工程实践方案,助力企业降本增效,推动云原生技术和AI技术生态发展,欢迎大家持续关注。

活动回顾资料

相关推荐
阿里云云原生5 小时前
20 万奖金池就位!Higress AI 网关开发挑战赛参赛指南
微服务·开源
IT技术分享社区5 小时前
IT运维干货:lnav开源日志分析工具详解与CentOS实战部署
linux·运维·服务器·开源·centos
酷讯网络_2408701606 小时前
PHP双轨直销企业会员管理系统/购物直推系统/支持人脉网络分销系统源码
学习·开源
IvorySQL6 小时前
灾难恢复工具内核细节探究与分享
数据库·postgresql·开源
开源能源管理系统9 小时前
MyEMS 核心功能拆解:数据采集、能耗分析、智能调控如何落地?
开源
开源能源管理系统9 小时前
从 “被动耗能” 到 “主动管控”:MyEMS 如何重构企业能源管理逻辑?
开源
海豚调度10 小时前
GSoC 成果公布!印度开发者为 DolphinScheduler 引入通用 OIDC 认证,实现无缝安全访问
大数据·开源·安全认证·oidc·大数据调度·apachedolphinscheduler
开源能源管理系统11 小时前
MyEMS 是什么?一文读懂企业能源管理系统的核心定位与应用场景
开源