恭喜你发明了 Golang 的 sync.Once

欢迎访问我的个人小站 莹的网络日志 ,不定时更新文章和技术博客~

现在有一个命题作文,需要一个结构体,该结构体具有一个方法,方法的传参是一个函数,比如数据库客户端的初始化,需要保证无论如何或者多次调用该方法,传入的 函数只会执行一次,即数据库客户端只初始化一次,问该如何设计这个结构体。

方案一 If-Else

首先想到的就是在结构体内记录一下是否执行过传参的函数,如果没有执行过就执行并且记录下来,如果执行过就不再执行,如此看来只是 if-else 而已,写起来也非常顺畅,代码如下。

go 复制代码
type Once struct {
    done bool
}

func (o *Once) Do(f func()) {
    if !done {
        done = true
        f()
    }
}

但是这样做有一个问题,在多协程并发的时候无法保证只执行一次。为何,请听我细细讲解,本质是因为对于 done 的操作不是原子操作,多个协程执行顺序不确定,若一个协程判定 !done 成立但尚未执行 f(),此时如果有其他协程也判定了 !done 成立,就会重复执行 f(),流程图如下。
sequenceDiagram participant A as 协程A participant B as 协程B participant Once as Once实例 participant Func as f() Note over Once: 初始状态: done = false A->>Once: Do(f) B->>Once: Do(f) Note over A,B: 并发读取 done 字段 A->>Once: 检查 !done (true) B->>Once: 检查 !done (true) A->>Func: 执行 f() B->>Func: 执行 f() Note over Func: f() 被执行了两次! A->>Once: done = true B->>Once: done = true

方案二 CAS

既然问题根源是 done 的判断和修改两个操作无法保证原子性,那自然就会想到使用 Go 源码中的原子操作 CompareAndSwap,后面简称为 CAS,通过使用硬件的功能达成判断和修改两个操作的原子性。CAS 在 Go 中的应用十分广泛,比如 Go 源码中的 sync.Mutex 本质就是 for 循环 + CAS。

go 复制代码
type Once struct {
    done atomic.Uint32
}

func (o *Once) Do(f func()) {
    if o.done.CompareAndSwap(0, 1) {
        f()
    }
}

上面的问题算是告一段落了,但是还有另外一个问题,因为在我们的需求中 f 函数是一个前置操作,通常情况下后面会紧接着执行其他操作,比如访问数据库。同样是并发场景下,一个协程 CAS 成功开始执行 f 但尚未执行完,另外一个协程 CAS 失败就直接进行下一步,而客户端这个时候还没初始化完成还没准备好,就会访问数据库失败,流程图如下。
sequenceDiagram participant A as 协程A participant B as 协程B participant Once as Once实例(CAS) participant Func as f()初始化 participant DB as 数据库操作 A->>Once: Do(f) - CAS(0,1) Note over A: CAS成功 获得执行权 B->>Once: Do(f) - CAS(0,1) Note over B: CAS失败 直接返回 A->>Func: 开始执行f() Note over Func: 初始化数据库客户端ing B->>DB: 访问数据库 Note over B,DB: 客户端尚未初始化完成 A->>Func: f()执行完成 A->>DB: 正常访问数据库

方案三 Mutex

其实就是需要在上面的基础上增加一个等待机制,那说到阻塞或者等待资源释放,第一个想到的就是 Go 源码中的 sync.Mutex,互斥锁的作用是同一时间只能有一个协程持有锁去判断和操作 done,其他协程拿不到锁都会阻塞,于是第一个拿到锁的协程会执行初始化,后面并发过来的协程就乖巧地静静等待。

go 复制代码
type Once struct {
    done bool
    m    Mutex
}

func (o *Once) Do(f func()) {
    o.m.Lock()
    defer o.m.Unlock()
    if o.done == false {
       f()
       o.done = true
    }
}

这样一来完全足以满足我们的需求,流程图如下。
sequenceDiagram participant A as 协程A participant B as 协程B participant Once as Once实例(带Mutex) participant Func as f()初始化 participant DB as 数据库 A->>Once: Do(f) - 获取锁 B->>Once: Do(f) - 尝试获取锁 A->>Once: 检查 done == false (true) A->>Func: 执行f()初始化 A->>Once: done = true A->>Once: 释放锁 B->>Once: 成功获得锁 B->>Once: 检查 done == true B->>Once: 释放锁 A->>DB: 访问数据库 B->>DB: 访问数据库

方案四 Mutex + Atomic

一旦初始化之后就不需要再初始化了,而之后每次执行 Do 时还都去获取锁实在太浪费了,要知道高并发下获取锁的代价是很高的。自然而然就会想到 CAS 的操作消耗很少,那在获取锁的流程之前先 CAS 一下不就好了,虽然在初始化前是多了一步操作,但是毕竟只要初始化完成之后就会只走 CAS 的逻辑了,所以对于长时间持续运行的程序来熟还是更优的。

go 复制代码
type Once struct {
    done atomic.Uint32
    m    Mutex
}

func (o *Once) Do(f func()) {
    if o.done.Load() == 0 {
        o.doSlow(f)
    }
}

func (o *Once) doSlow(f func()) {
    o.m.Lock()
    defer o.m.Unlock()
    if o.done.Load() == 0 {
        defer o.done.Store(1)
        f()
    }
}

这里也有一些小技巧

  • 持有互斥锁的期间不用担心并发问题,所以不再用 CAS 了,但是需要提前判断 done,所以依旧用了原子操作的 Load 和 Store。
  • 使用 defer 执行 Store(1) 是有些思考在里面的,试想一下如果 f 发生了 panic,如果不加 defer 那么 done 依旧是 0,后面仍会重复执行 f,这就违背了 f 只执行一次的初衷。
  • 而且 defer 的执行顺序是栈的顺序,所以 Store(1) 先执行,再释放锁,这也是对的。

至此,恭喜你发明了 sync.Once!

Sugar

为了方便开发时快速使用 sync.Once, Go 源码中还有下面有两个工具函数。

OnceFunc

基础款式需要保存 Once 结构体和 f 函数,而宝宝款式 OnceFunc 将两者整合成了一个闭包函数,可以作为全局变量直接调用,可以小幅度减少代码量,同时逻辑内敛减少阅读代码时的心智负担。只不过内部 once,valid,p 三个变量都内存逃逸了,如果追求性能的话还是用基础款式比较好。

go 复制代码
func OnceFunc(f func()) func() {
    var (
       once  Once
       valid bool
       p     any
    )
    // Construct the inner closure just once to reduce costs on the fast path.
    g := func() {
       defer func() {
          p = recover()
          if !valid {
             // Re-panic immediately so on the first call the user gets a
             // complete stack trace into f.
             panic(p)
          }
       }()
       f()
       f = nil      // Do not keep f alive after invoking it.
       valid = true // Set only if f does not panic.
    }
    return func() {
       once.Do(g)
       if !valid {
          panic(p)
       }
    }
}

OnceValue

OnceValue 则是在 OnceFunc 的基础上增加了一个返回值,感兴趣的可以去看下源码,这里就不多做介绍了

go 复制代码
// OnceValue returns a function that invokes f only once and returns the value
// returned by f. The returned function may be called concurrently.
//
// If f panics, the returned function will panic with the same value on every call.
func OnceValue[T any](f func() T) func() T

欢迎访问我的个人小站 莹的网络日志 ,不定时更新文章和技术博客~