如何做服务迁移、重构?

思维导图

0. 前言

本文意在提供服务迁移的完整思路,将思考题变成填空题,只需要按照本文提供的思路填空,服务迁移至少可以做到 80 分。

本文的服务迁移指:将老服务的代码迁移至新服务。

1. 服务资源梳理

服务资源,我总结为以下 4 个大类

  1. 程序对外暴露资源
    1. 正常如:http、dubbo
    2. 需要梳理调用量、使用场景、影响点、重要性(重要性的评估需要和产品、使用方一起确定)
  2. 程序侧使用的资源
    梳理这部分资源是为了能够知道,如果迁移至新服务,老服务使用的资源是否可下线?从而实现降本。例如:Mysql、Redis,等
  3. 运维侧资源
    包含 jenkins、maven、历史镜像、k8s 相关、代码资源,配置中心等等。
  4. 上下游资源
    要梳理老服务使用到的上下游资源。一般来说老服务下线后,上下游的资源都可以释放掉了。
    常见的如:运营后台管理界面,以及数据组使用到的统计任务,等等...

2. 接口逻辑梳理

建议使用流程图或者时序图整理接口的逻辑。

3. 下线方案

下线方案包含以下 4 个部分。

  1. 接口逻辑如何处理?

    例如,迁移至新接口后,默认返回空;例如,从查询老表转换为查询新表,并将老表下线

  2. 接口如何下线?

    对于将老服务迁移至新服务,一般采用的是在 ingress 层面配置新老服务的灰度处理。

    重构完毕后。我们可以配置灰度比例,慢慢将老服务的流量切到新服务上。

    这里提供流量切换参考。

    新服务 1% 流量 -> 最低风险验证新服务是否正常

    新服务 20% 流量

    新服务 50% 流量

    新服务 80% 流量

    新服务 100% 流量

  3. 资源如何下线?

    如果资源可以下线,一般会牵扯到多个不同的团队,这里做好沟通即可

  4. 迁移失败可能带来的问题,这些问题如何处理

    需要做好方案,并提前演练,降低迁移风险。

4. 功能验证方案

功能验证包含以下几个内容:

  1. 压测
  2. 新老接口的下发是否一致?

以上 2 个点,我们都可以通过流量回放来实现。

那么流量回放如何做呢?这里提供一个简单的方案

压测:

  1. 抓取线上真实用户请求日志
  2. 数据清洗,将数据转换为 jmeter 需要的格式
  3. 通过 jmeter 进行压测

新老接口下发是否一致:

  1. 抓取线上真实用户请求日志
  2. 通过脚本,分别请求线上和 QA。借用第三方 diff 功能,对比返回值。
  3. 如果有不正常的返回值,则将请求打到另外一个文件

5. 回滚方案

对于服务迁移,一般都是通过 ingress(网关) 来做。

在 ingress(网关) 层面做流量切换。

6. 开发计划

作为服务迁移、重构负责人,应该将大任务拆分为小任务,并对每个小任务进行工时评估。

每周需要对整个计划进行总结,梳理卡点,有可能延迟的地方,并进行相应调整。(可以在固定的时间,拉会对齐)

最重要的一点,进度要汇报给你的上级!!!

7. 成本核算汇总

做成本核算是为了能够更清楚的知道,本次服务迁移的总投入,以及带来的收益。

成本核算一般包含以下内容:

  1. 人力成本
  2. 下线资源成本
  3. 新增资源成本
相关推荐
Jinkxs13 小时前
测试工程师的AI转型指南:从工具使用到测试策略重构
人工智能·重构
gptplusplus2 天前
超越“调参”:从系统架构师视角,重构 AI 智能体的设计范式
人工智能·重构·系统架构
轻流AI2 天前
线索转化率翻3倍?AI重构CRM
大数据·人工智能·低代码·重构
weixin_177297220692 天前
剧本杀小程序系统开发:重构推理娱乐生态
小程序·重构·娱乐
思通数据3 天前
AI视频监控:重构安防行业智能化新生态
人工智能·安全·目标检测·机器学习·计算机视觉·重构·数据挖掘
萤丰信息3 天前
智慧工地从工具叠加到全要素重构的核心引擎
java·大数据·人工智能·重构·智慧城市·智慧工地
riveting3 天前
明远智睿SSD2351:以技术突破重构嵌入式市场格局
大数据·人工智能·重构·边缘计算·嵌入式开发·智能交通
MARS_AI_3 天前
云蝠智能 VoiceAgent:重构物流售后场景的智能化引擎
人工智能·自然语言处理·重构·交互·信息与通信
终端域名4 天前
教育元宇宙:一场重构教育生态的数字革命
重构·元宇宙
Deepoch4 天前
当机械臂装上「智能大脑」:Deepoc具身智能模型如何重构传统自动化
运维·重构·自动化