短信服务(二):实现动态判定服务商运作状态(策略二)

一、背景

接上文,这篇文章分享 应对如果短信服务商真的寄了的策略二:动态判定服务商状态 。不同于上文的轮询 failover 策略,本文的策略的思路是 计算服务商是否还运作正常 。常用的判断标准有:(根据自己调用的服务商的特点来确定使用哪个)

1)超时情况:如连续 N 个超时响应【本文将依据这个标准】

2)错误率:如错误率超过 10%

3)响应时间增长率:如响应时间从 100ms 突然变成 1s

这里我用一个比较简单的算法:只要连续超过 N 个请求超时了,就直接切换。如果有多个服务商,那么就是在这些服务商之间逐个切换过去。

二、实现

golang 复制代码
package failover

import (
    "context"
    "refactor-webook/webook/internal/service/sms"
    "sync/atomic"
)

type TimeoutFailoverSmsService struct {
    svcs []sms.Service
    // 当前使用的服务商
    idx int32
    // 记录已经超时的个数
    cnt int32
    // 切换的阈值,只读(所以没有并发安全的问题)
    threshold int32
}

func (t *TimeoutFailoverSmsService) Send(ctx context.Context, tplId string, args []string, numbers ...string) error {
    length := len(t.svcs)
    // 原子操作保证拿到的是最新的 idx 和 cnt
    idx := atomic.LoadInt32(&t.idx)
    cnt := atomic.LoadInt32(&t.cnt)
    if cnt >= t.threshold {
       // 先计算下一个idx
       newIdx := (idx + 1) % (int32)(length)
       // note 注意此处的并发问题:可能有两个请求同时获得 newIdx。我们期望 idx 只因一个请求超过 threshold 而被赋值成 newIdx 即可,其他请求共享这个 idx
       // note 利用原子操作的 CAS 若返回 false,则说明 idx 已经因为其他请求而被修改成 newIdx;若返回 true,则说明是因为本请求修改的,要进一步将 cnt 置为 0
       if atomic.CompareAndSwapInt32(&t.idx, idx, newIdx) {
          atomic.StoreInt32(&t.cnt, 0)
       }
    }
    svc := t.svcs[t.idx]
    err := svc.Send(ctx, tplId, args, numbers...)
    switch err {
    case nil:
       // 请求没超时,重置 cnt
       atomic.StoreInt32(&t.cnt, 0)
    case context.DeadlineExceeded:
       // 请求超时,cnt++
       atomic.AddInt32(&t.cnt, 1)
    default:
       // 不是超时的错误
       // note 可以考虑若是 EOF 错误,可直接切换
    }
    return err
}

注意:并发场景下,为了平衡性能和同步效果,采用了 原子操作 。所以,我们实现的并不是严格的 "连续 N 个超时就切换"。

三、单元测试

这里面涉及到并发问题,所以很难测试。也就是,你没办法通过 mock 之类的东西来判断你的代码是不是并发安全的。你只能说,在没有并发问题的情况下,这个代码的运行结果是符合你的预期的。

注意:并发代码的测试,大部分时候只能有限度的测试。更大程度上是依赖于代码 review 来保证的

相关推荐
uzong4 小时前
技术故障复盘模版
后端
GetcharZp4 小时前
基于 Dify + 通义千问的多模态大模型 搭建发票识别 Agent
后端·llm·agent
桦说编程5 小时前
Java 中如何创建不可变类型
java·后端·函数式编程
IT毕设实战小研5 小时前
基于Spring Boot 4s店车辆管理系统 租车管理系统 停车位管理系统 智慧车辆管理系统
java·开发语言·spring boot·后端·spring·毕业设计·课程设计
wyiyiyi5 小时前
【Web后端】Django、flask及其场景——以构建系统原型为例
前端·数据库·后端·python·django·flask
阿华的代码王国6 小时前
【Android】RecyclerView复用CheckBox的异常状态
android·xml·java·前端·后端
Jimmy6 小时前
AI 代理是什么,其有助于我们实现更智能编程
前端·后端·ai编程
AntBlack7 小时前
不当韭菜V1.1 :增强能力 ,辅助构建自己的交易规则
后端·python·pyqt
bobz9658 小时前
pip install 已经不再安全
后端
寻月隐君8 小时前
硬核实战:从零到一,用 Rust 和 Axum 构建高性能聊天服务后端
后端·rust·github