Go 并发控制 errgroup.Group

errgroup (golang.org/x/sync/errgroup) 为一组协程 goroutines 在执行共同任务的子任务时,提供同步、错误传播和上下文取消的功能。

对于要等待 n 个线程完成后再进行下一步的同步操作的做法,常见使用 sync.WaitGroup 来等待一组事件。

errgroup.Group 与 sync.WaitGroup 类似,但它增加了对返回错误任务的处理能力,以及限制协程并发数的能力

使用方法与 WaitGroup 类似,只是封装了 WaitGroup 的 Add() 和 Wait() 方法,解决 WaitGroup 无法返回错误的问题。

go 复制代码
package main

import (
 "fmt"
 "time"

 "golang.org/x/sync/errgroup"
)

func main() {

 g := &errgroup.Group{}
 for i := 0; i < 5; i++ {
  index := i
  g.Go(func() error {
   fmt.Printf("start to execute the %d gorouting\n", index)
   time.Sleep(time.Duration(index) * time.Second)
   if index%2 == 0 {
    return fmt.Errorf("something has failed on grouting:%d", index)
   }
   fmt.Printf("gorouting:%d end\n", index)
   return nil
  })
 }
 if err := g.Wait(); err != nil {
  fmt.Println(err)
 }
}

// Output:
// start to execute the 4 gorouting
// start to execute the 1 gorouting
// start to execute the 0 gorouting
// start to execute the 2 gorouting
// start to execute the 3 gorouting
// gorouting:1 end
// gorouting:3 end
// something has failed on grouting:0

如果多个 goroutine 出现错误,errgroup 只会获取到第一个出错的 goroutine 的错误信息。不管是否有协程执行失败,wait() 都要等待所有协程执行完成。

支持 context :

css 复制代码
g, _ := errgroup.WithContext(context.Background()) // 支持 context

Wait() 方法可多次调用,依然可以得到 group 的 error 信息:

go 复制代码
 ...
 if err := g.Wait(); err != nil {
  fmt.Println(err)
 }

 if err := g.Wait(); err != nil { // 可再次调用 Wait,依然可以得到 group 的 error 信息
  fmt.Println(err)
 }

限制最大并发数:

SetLimit() 方法用于限制该组中最多同时运行的 goroutine 数量,参数代表的是当前同时处于活动状态(处理业务)的 goroutine 的最多数量。

go 复制代码
package main

import (
 "log"
 "time"

 "golang.org/x/sync/errgroup"
)

func main() {
 jobs := make(chan int, 10)
 go func() {
  for i := 0; i < 8; i++ {
   jobs <- i + 1
  }
  close(jobs)
 }()

 eg:= &errgroup.Group{}
 eg.SetLimit(3)

 for j := range jobs {
  j := j
  eg.Go(func() error {
   log.Printf("handle job: %d\n", j)
   time.Sleep(2 * time.Second)
   return nil
  })
 }
 eg.Wait()
}

上面的示例创建了一组 goroutines 来处理 job,同一时间允许最多 3 个 goroutine 处于活动状态。

Output:

yaml 复制代码
2024/12/17 18:28:19 handle job: 3
2024/12/17 18:28:19 handle job: 1
2024/12/17 18:28:19 handle job: 2
2024/12/17 18:28:21 handle job: 4
2024/12/17 18:28:21 handle job: 6
2024/12/17 18:28:21 handle job: 5
2024/12/17 18:28:23 handle job: 7
2024/12/17 18:28:23 handle job: 8

从示例运行结果中的时间戳我们可以看到:虽然我们创建了很多 goroutine,但同一时间内处理活动状态(正在处理 job)的 goroutine 的数量最多为 3 个。

其内部实现就是将带缓冲 channel 用作计数信号量 (counting semaphore) 来限制最大并发数。

相关推荐
Pedantic1 小时前
SwiftUI 手势笔记
前端·后端
金銀銅鐵1 小时前
[Python] 从《千字文》中随机挑选汉字
后端·python
飘尘4 小时前
前端转型全栈(Java后端)的快速上手指引
前端·后端·全栈
浏览器工程师5 小时前
AI Agent 接浏览器任务,先别让它一路点到底
前端·后端
行者全栈架构师5 小时前
Maven dependency:tree 的 8 个高级用法
java·后端
Chenyiax5 小时前
从一次请求看懂 OkHttp:架构、调度与连接管理
后端
爱勇宝6 小时前
深扒 Anthropic 1680 位工程师简历:应届生几乎没机会,AI 公司最缺的不是博士
前端·后端·程序员
AskHarries6 小时前
工具失败时怎么办:重试、回滚、人工确认和风险提示
后端·程序员
苏三说技术7 小时前
Claude Code从失控到起飞,只用了这些技巧
后端
长栎8 小时前
写 for 循环写了十年,你却从没用过迭代器模式最狠的那一面
后端