深入理解 Go 语言并发编程之系统调用底层原理

用户协程是如何执行系统调用的?系统调用有可能会阻塞线程 M,如果所有的线程 M 都因系统调用阻塞了,这时候谁来调度协程呢?

1. 系统调用会阻塞线程吗

系统调用会阻塞线程吗?在这回答这个问题之前,我们先模拟一个 Go 程序执行阻塞式系统调用的情况。

第一个程序就是普通的 Go 程序,没有执行任何系统调用,代码如下所示:

Go 复制代码
package main

import (
	"runtime"
	"time"
)

func main() {
	//设置逻辑处理器 P 的数目为 4
	runtime.GOMAXPROCS(4)
	//创建 10 个用户协程
	for i := 0; i < 10; i++ {
		go func() {
			for {
			}
		}()
	}
	time.Sleep(time.Second * 1000)
}

上面的 Go 程序非常简单,本身没有任何意义,只是显式地设置逻辑处理器 P 的数目为 4,随后创建了多个用户协程。

参考上面的结果,Go 程序总共创建了 5 个子线程,暂时记录下这个结果,待会和第二个程序的输出做一个对比。当然,你可能会好奇为什么实际的线程数大于逻辑处理器 P 的数目,这里我们大不必纠结背后的原因(Go 语言还会创建辅助线程)。

第二个程序会执行一些阻塞式的系统调用,代码如下所示:

Go 复制代码
package main
import (
	"net"
	"runtime"
	"syscall"
	"time"
)

func main(){
	//目的 IP 地址
	var addr = "x.x.x.x"
	//设置逻辑处理器 P 的数目为 4
	runtime.GOMAXPROCS(4)
	for i :=0; i <10;i++{
		go func(){
			sa := ipv4Sockaddr(addr)
			fd,_:=syscall.Socket(syscall.AF_INET,syscall.SOCK_STREAM,syscall.IPPROTO_TCP)
			//阻塞式系统调用
			_= syscall.Connect(fd,sa)
		}()
		//普通的用户协程
		go func(){
			for {
				
			}
		}()
	}
	time.Sleep(time.Second*1000)
}

//解析IP地址
func ipv4Scockaddr(addr string) syscall.Sockaddr {
	ip := net.ParseIP(addr)
	sa := &syscall.SockaddrInet4{Port:80}
	copy(sa.Addr[:],ip.To4())
	return sa
}

上面的程序稍微有点复杂。同样,显式地设置逻辑处理器 P 的数目为 4,并且创建了多个用户协程,只是部分协程执行了一些阻塞式系统调用。注意,这里使用了原生的套接字相关系统调用,并没有使用 Go 语言基于 I/O 多路复用封装的函数(这些函数都是非阻塞调用,不会阻塞线程 M)。函数 syscall.Connect 对应的就是系统调用 connect,用于向远端地址发起 TCP 连接请求,那如果目的 IP 不存在或者与当前节点网络不通呢?这样是不是就会长时间阻塞线程 M 了呢?编译并运行 Go 程序,同时通过 pstree 命令查看该进程所有的线程,结果如下所示:

参考上面的结果,这一次 Go 程序总共创建了 15个子线程,对比第一个程序的输出结果,多创建了 10 个子线程,为什么会多创建这么多子线程呢?是因为用户协程执行了系统调用 syscall.Connect,导致线程 M 阻塞了,Go语言才创建了更多的线程 M 吗?有可能是。

再次回到最初的问题,系统调用阻塞线程 M 之后,Go 语言是如何处理的?参考上面两个程序的输出结果,我们是不是能猜测Go语言会创建更多的线程 M 用于调度协程?只是,线程 M 需要绑定逻辑处理器 P 才能调度协程,所以可想而知,Go语言还需要解除因系统调用而阻塞的线程与逻辑处理器 P 之间的绑定关系。

2. 系统调用与调度器

思考一下,既然系统调用有可能会阻塞线程 M 这一事实无法改变,那么在执行可能阻塞

Go 复制代码
//辅助线程 sysmon 每 10ms 执行一次该函数
func retake(now int64) uint32 {
	//遍历所有的逻辑处理器 P
	for i := 0;i< len(allp); i++{
		if s==_Psyscall {
			//如果不等于,说明系统调度已结否
			t := int64(_p_.syscalltick)
			if !sysretake && int64(pd.syscalltick) != t {
				pd.syscalltick = uint32(t)
				pd.syscallwhen = now
				continue
			}
			//更改逻辑处理器 P 的状态
			if atomic.Cas(&_p_.status,s,_Pidle){
				//创建新的线程 M 以执行调度程序
				handoffp(_p_)
			}
		}
	}
}

参考上面的代码,逻辑处理器 P 有两个变量:变量 syscalltick 用于计数,每执行一次系统调用都会加 1 ;变量 syscallwhen 记录最近一次系统调用的执行时间,当然这个时间其实不是真正的执行时间,可以理解为检测时间。检测的整体逻辑是,如果逻辑处理器 P 处于系统调用状态(_Psyscall),并且自从上次检测之后计数器 syscalltick 没有发生变化,说明当前逻辑处理器 P 近 10ms 内一直处于系统调用状态,即与其绑定的线程 M 近 10ms 内一直处于阻塞状态。此时,辅助线程就会将逻辑处理器 P 的状态修改为空闲状态(_Pidle),并调用函数 runtime.handoffp 创建新的线程 M 以执行调度程序。

相关推荐
Smile灬凉城6666 分钟前
反序列化为啥可以利用加号绕过php正则匹配
开发语言·php
lsx20240618 分钟前
SQL MID()
开发语言
Dream_Snowar21 分钟前
速通Python 第四节——函数
开发语言·python·算法
西猫雷婶22 分钟前
python学opencv|读取图像(十四)BGR图像和HSV图像通道拆分
开发语言·python·opencv
鸿蒙自习室23 分钟前
鸿蒙UI开发——组件滤镜效果
开发语言·前端·javascript
言、雲30 分钟前
从tryLock()源码来出发,解析Redisson的重试机制和看门狗机制
java·开发语言·数据库
汪洪墩1 小时前
【Mars3d】设置backgroundImage、map.scene.skyBox、backgroundImage来回切换
开发语言·javascript·python·ecmascript·webgl·cesium
云空1 小时前
《QT 5.14.1 搭建 opencv 环境全攻略》
开发语言·qt·opencv
Anna。。1 小时前
Java入门2-idea 第五章:IO流(java.io包中)
java·开发语言·intellij-idea
我曾经是个程序员2 小时前
鸿蒙学习记录
开发语言·前端·javascript