如何做服务迁移、重构?

思维导图

0. 前言

本文意在提供服务迁移的完整思路,将思考题变成填空题,只需要按照本文提供的思路填空,服务迁移至少可以做到 80 分。

本文的服务迁移指:将老服务的代码迁移至新服务。

1. 服务资源梳理

服务资源,我总结为以下 4 个大类

  1. 程序对外暴露资源
    1. 正常如:http、dubbo
    2. 需要梳理调用量、使用场景、影响点、重要性(重要性的评估需要和产品、使用方一起确定)
  2. 程序侧使用的资源
    梳理这部分资源是为了能够知道,如果迁移至新服务,老服务使用的资源是否可下线?从而实现降本。例如:Mysql、Redis,等
  3. 运维侧资源
    包含 jenkins、maven、历史镜像、k8s 相关、代码资源,配置中心等等。
  4. 上下游资源
    要梳理老服务使用到的上下游资源。一般来说老服务下线后,上下游的资源都可以释放掉了。
    常见的如:运营后台管理界面,以及数据组使用到的统计任务,等等...

2. 接口逻辑梳理

建议使用流程图或者时序图整理接口的逻辑。

3. 下线方案

下线方案包含以下 4 个部分。

  1. 接口逻辑如何处理?

    例如,迁移至新接口后,默认返回空;例如,从查询老表转换为查询新表,并将老表下线

  2. 接口如何下线?

    对于将老服务迁移至新服务,一般采用的是在 ingress 层面配置新老服务的灰度处理。

    重构完毕后。我们可以配置灰度比例,慢慢将老服务的流量切到新服务上。

    这里提供流量切换参考。

    新服务 1% 流量 -> 最低风险验证新服务是否正常

    新服务 20% 流量

    新服务 50% 流量

    新服务 80% 流量

    新服务 100% 流量

  3. 资源如何下线?

    如果资源可以下线,一般会牵扯到多个不同的团队,这里做好沟通即可

  4. 迁移失败可能带来的问题,这些问题如何处理

    需要做好方案,并提前演练,降低迁移风险。

4. 功能验证方案

功能验证包含以下几个内容:

  1. 压测
  2. 新老接口的下发是否一致?

以上 2 个点,我们都可以通过流量回放来实现。

那么流量回放如何做呢?这里提供一个简单的方案

压测:

  1. 抓取线上真实用户请求日志
  2. 数据清洗,将数据转换为 jmeter 需要的格式
  3. 通过 jmeter 进行压测

新老接口下发是否一致:

  1. 抓取线上真实用户请求日志
  2. 通过脚本,分别请求线上和 QA。借用第三方 diff 功能,对比返回值。
  3. 如果有不正常的返回值,则将请求打到另外一个文件

5. 回滚方案

对于服务迁移,一般都是通过 ingress(网关) 来做。

在 ingress(网关) 层面做流量切换。

6. 开发计划

作为服务迁移、重构负责人,应该将大任务拆分为小任务,并对每个小任务进行工时评估。

每周需要对整个计划进行总结,梳理卡点,有可能延迟的地方,并进行相应调整。(可以在固定的时间,拉会对齐)

最重要的一点,进度要汇报给你的上级!!!

7. 成本核算汇总

做成本核算是为了能够更清楚的知道,本次服务迁移的总投入,以及带来的收益。

成本核算一般包含以下内容:

  1. 人力成本
  2. 下线资源成本
  3. 新增资源成本
相关推荐
一水鉴天3 小时前
智能代理体系 之2 20260325 (腾讯元宝)
人工智能·重构·架构·自动化
万岳科技系统开发8 小时前
教育培训系统开发正在重构培训机构的盈利结构
数据库·重构
C蔡博士9 小时前
OpenAI联合创始人Karpathy:AI降低开发门槛后,软件需求会爆发式增长
人工智能·重构·软件开发·ai agent
zandy10119 小时前
GEO 合规场景下技术革新的价值重构:从合规约束到竞争优势
人工智能·重构
草原猫10 小时前
公链开发:从技术筑基到生态共生,重构数字信任基础设施
重构·区块链
雷焰财经11 小时前
首都在线MaaS+ComfyUI:重构游戏美术生产,打造行业降本提效新标杆
人工智能·重构·游戏美术
Tony Bai11 小时前
【AI 智能体时代的软件工程】11 双态工作台:为何我们需要为 AI 重构 IDE?
ide·人工智能·重构
xdpcxq10291 天前
Redis 故障排查 + 跨语言重构场景实测
数据库·redis·重构
世岩清上1 天前
从静态陈列到数据活化:策展逻辑的升维与重构
重构·博物馆·展厅·数字展陈·数据活化·纪念馆
阳光普照世界和平1 天前
借力大模型,重构研发效能:全流程提效实战指南
大数据·人工智能·重构