使用kratos这个框架有近一年了,最近了解了一下kratos关于程序优雅退出的具体实现。
这部分逻辑在app.go文件中,在main中,找到app.Run方法,点进入就可以了
它包含以下几个部分:
-
App结构体:包含应用程序的配置选项和运行时状态。
-
New函数:创建一个App实例。
-
Run方法:启动应用程序。主要步骤包括:
- 构建ServiceInstance注册实例
- 启动Server
- 注册实例到服务发现
- 监听停止信号
-
Stop方法:优雅停止应用程序。主要步骤包括:
- 从服务发现中注销实例
- 取消应用程序上下文
- 停止Server
-
buildInstance方法:构建用于服务发现注册的实例。
-
NewContext和FromContext函数:给Context添加AppInfo,便于后续从Context获取。
核心的逻辑流程是:
- 创建App实例
- 在App.Run()里面启动Server,注册实例,监听信号
- 接收到停止信号后会调用App.Stop()停止应用
我们先对Run方法进行一个源码进行查看
go
// Run executes all OnStart hooks registered with the application's Lifecycle.
func (a *App) Run() error {
// 构建服务发现注册实例
instance, err := a.buildInstance()
if err != nil {
return err
}
// 保存实例
a.mu.Lock()
a.instance = instance
a.mu.Unlock()
// 创建错误组
eg, ctx := errgroup.WithContext(NewContext(a.ctx, a))
// 等待组,用于等待Server启动完成
wg := sync.WaitGroup{}
// 启动每个Server
for _, srv := range a.opts.servers {
srv := srv
eg.Go(func() error {
// 等待停止信号
<-ctx.Done()
// 停止Server
stopCtx, cancel := context.WithTimeout(a.opts.ctx, a.opts.stopTimeout)
defer cancel()
return srv.Stop(stopCtx)
})
wg.Add(1)
eg.Go(func() error {
// Server启动完成
wg.Done()
// 启动Server
return srv.Start(NewContext(a.opts.ctx, a))
})
}
// 等待所有Server启动完成
wg.Wait()
// 注册服务实例
if a.opts.registrar != nil {
rctx, rcancel := context.WithTimeout(ctx, a.opts.registrarTimeout)
defer rcancel()
if err := a.opts.registrar.Register(rctx, instance); err != nil {
return err
}
}
// 监听停止信号
c := make(chan os.Signal, 1)
signal.Notify(c, a.opts.sigs...)
eg.Go(func() error {
select {
case <-ctx.Done():
return nil
case <-c:
// 收到停止信号,停止应用------------- ⬅️注意此时
return a.Stop()
}
})
// 等待错误组执行完成
if err := eg.Wait(); err != nil && !errors.Is(err, context.Canceled) {
return err
}
return nil
}
核心逻辑就是这里⬇️,使用signal.Notify去监听操作系统给出的停止信号。
go
// 监听停止信号
c := make(chan os.Signal, 1)
signal.Notify(c, a.opts.sigs...)
eg.Go(func() error {
select {
case <-ctx.Done():
return nil
case <-c:
// 收到停止信号,停止应用
return a.Stop()
}
})
然后调用了Stop方法,我们再看下Stop的源码
go
// Stop gracefully stops the application.
func (a *App) Stop() error {
// 获取服务实例
a.mu.Lock()
instance := a.instance
a.mu.Unlock()
// 从服务发现注销实例
if a.opts.registrar != nil && instance != nil {
ctx, cancel := context.WithTimeout(NewContext(a.ctx, a), a.opts.registrarTimeout)
defer cancel()
if err := a.opts.registrar.Deregister(ctx, instance); err != nil {
return err
}
}
// 取消应用上下文
if a.cancel != nil {
a.cancel()
}
return nil
}
主要步骤是:
1. 获取已经保存的服务实例
2. 如果配置了服务发现,则从服务发现中注销该实例
3. 取消应用上下文来通知应用停止
在Run方法中,我们通过context.WithCancel创建的可取消的上下文Context,在这里通过调用cancel函数来取消该上下文,以通知应用停止。
取消上下文会导致在Run方法中启动的协程全部退出,从而优雅停止应用。
所以Stop方法比较简单,关键是利用了Context来控制应用生命周期。
我们可以注意到,在Run方法中,我们使用到了一个signal包下的Notify方法来对操作系统的关闭事件进行监听,这个是我们动作的核心,我把这部分单独整理在了另一篇文章中。
通过对操作系统事件的监听,我们就可以对一些必须完成的任务进行优雅地停止,如果有一些任务必须完成,我们可以在任务开始使用 wg := sync.WaitGroup{} 来对任务进行一个Add操作,当所有任务完成,监听到操作系统的关闭动作,我们需要使用wg.wait() 等待任务完成再进行退出。以实现一个优雅地启停。