CloudWeGo-Netpoll:高性能NIO网络库浅析

一、Netpoll 简介

Netpoll 是由字节跳动开发的高性能 NIO(Non-blocking I/O)网络库,专注于 RPC 场景。在 RPC 场景中,通常有较重的处理逻辑,无法串行处理 I/O。而 Go 的标准库 net 设计了 BIO(Blocking I/O)模式的 API,在高并发下会产生大量的 goroutine,大幅增加调度开销。此外,net.Conn 没有提供检查连接活性的 API,使得 RPC 框架很难设计出高效的连接池。Netpoll 应运而生,借鉴了 evionetty 的优秀设计,具有出色的性能,更适用于微服务架构。

二、Netpoll 与 Go net 的区别

2.1 I/O 模式

  • Go net :使用阻塞 I/O(BIO)模式。在处理网络连接时,通常为每个连接分配一个 goroutine,当进行 I/O 操作时,线程会被阻塞,直到操作完成。例如,在服务端使用 net.Listen 创建监听套接字,客户端使用 net.Dial 发起连接请求,读写数据时使用 conn.Readconn.Write 方法,这些方法在没有数据或空间时会阻塞线程。
go 复制代码
// 服务端监听
ln, err := net.Listen("tcp", "localhost:8080")
// 客户端连接
conn, err := net.Dial("tcp", "localhost:8080")
// 数据读取
buf := make([]byte, 1024)
n, err := conn.Read(buf)
// 数据写入
data := []byte("Hello, World!")
n, err := conn.Write(data)
  • Netpoll :使用非阻塞 I/O(NIO)模式。通过操作系统的 I/O 多路复用机制(如 epoll),可以避免线程阻塞,提高系统的并发处理能力。服务端使用 EventLoopCreateListener 创建监听套接字,客户端使用 DialerDialTimeout 发起连接请求,读写数据时使用 ReaderWriter 接口,数据不足或空间不足时不会阻塞线程。
go 复制代码
// 服务端创建监听
ln, err := CreateListener("tcp", address)
// 客户端创建连接
dialer := NewDialer()
conn, err := dialer.DialTimeout("tcp", address, time.Second)
// 数据读取
buf, _ := reader.Next(n)
reader.Release()
// 数据写入
alloc, _ := writer.Malloc(len(write_data))
copy(alloc, write_data)
writer.Flush()

2.2 数据读写方式

  • Go net:在读写数据时通常需要进行数据复制。例如,在读取多个数据包时,需要将数据从读取缓冲区复制到新的内存区域。
go 复制代码
var conn net.Conn
var buf = make([]byte, 8192)
for {
    n, _ := conn.Read(buf)
    var pkgsize = 1024
    var i int
    for i = 0; i <= n-pkgsize; i += pkgsize {
        pkg := append([]byte{}, buf[i:i+pkgsize]...)
        go func() {
            // 处理数据包
        }()
    }
    buf = append(buf[:0], buf[i:n]...)
}
  • Netpoll :提供了 nocopy API,支持直接操作 buffer 的原地址,减少数据复制。通过 Reader.Slice 方法可以直接从 LinkBuffer 中获取数据,而不需要进行复制。
go 复制代码
var conn netpoll.Connection
reader := conn.Reader()
var pkgsize = 1024
for {
    pkg, _ := reader.Slice(pkgsize)
    go func() {
        // 处理数据包
        pkg.Release()
    }()
}

2.3 连接管理

  • Go net :没有提供直接检查连接活性的 API。当连接不再使用时,需要调用 conn.Close 方法关闭连接。
go 复制代码
conn.Close()
  • Netpoll :提供了 IsActive 方法检查连接是否存活,并且支持添加关闭回调函数。可以及时清理失效连接,提高连接池的效率。
go 复制代码
conn.AddCloseCallback(func(connection Connection) error {
    // 连接关闭时执行操作
    return nil
})

三、为什么要设计 Netpoll

3.1 高并发场景下的性能问题

在高并发场景下,Go net 的 BIO 模式会为每个连接分配一个 goroutine,导致大量的 goroutine 创建和调度,增加系统的资源消耗和调度开销。而 Netpoll 的 NIO 模式可以使用较少的线程处理大量的连接,减少线程切换开销,提高性能。

3.2 高效连接池的需求

Go net 的 net.Conn 没有提供检查连接活性的 API,使得 RPC 框架很难设计出高效的连接池,池中的失效连接无法及时清理。Netpoll 提供了 IsActive 方法和关闭回调函数,方便应用程序管理连接状态,及时清理失效连接。

3.3 数据处理效率的提升

在处理大量数据时,Go net 的数据复制会增加内存开销和 CPU 负担,降低数据读写效率。Netpoll 的 nocopy API 可以减少数据复制的开销,提高数据读写效率。

四、Netpoll 的实现方式

4.1 非阻塞 I/O 机制

Netpoll 利用操作系统的 I/O 多路复用机制(如 epoll),将监听套接字和连接套接字加入到内核的 I/O 多路复用机制中。当有数据可读或可写时,内核会通知 Netpoll,Netpoll 再进行相应的处理,避免了线程阻塞。

4.2 nocopy API

Netpoll 的 LinkBuffer 提供了 nocopy API,支持直接操作 buffer 的原地址。通过偏移量的方式区分不同的请求数据,减少了不必要的数据复制。例如,Reader.Slice 方法直接从 LinkBuffer 中获取一个大小为指定值的切片,这个切片是通过偏移量的方式从 LinkBuffer 中划分出来的,并没有进行数据的复制。

4.3 连接管理

Netpoll 提供了 IsActive 方法检查连接是否存活,并且支持添加关闭回调函数。在连接关闭时,会执行相应的回调函数,方便应用程序进行资源清理。

五、优劣势分析

5.1 Netpoll 的优势

  • 高性能:在高并发场景下,Netpoll 的非阻塞 I/O 模式和 nocopy API 可以减少线程切换开销和数据复制开销,提高系统的并发处理能力和数据读写效率。
  • 高效连接管理 :提供了 IsActive 方法和关闭回调函数,方便应用程序管理连接状态,及时清理失效连接,提高连接池的效率。
  • 适用于 RPC 场景:专注于 RPC 场景,满足 RPC 场景中较重处理逻辑和高效连接管理的需求。

5.2 Netpoll 的劣势

  • 学习成本较高:相比 Go net,Netpoll 的 API 和实现机制较为复杂,需要开发者花费更多的时间来学习和掌握。
  • 不支持 Windows 系统:目前 Netpoll 不支持 Windows 操作系统,限制了其在某些场景下的使用。

5.3 Go net 的优势

  • 简单易用:Go net 的 API 设计简单,易于理解和使用,适合简单场景下的网络编程。
  • 广泛的兼容性:Go net 是 Go 语言的标准库,具有广泛的兼容性,适用于各种操作系统和场景。

5.4 Go net 的劣势

  • 高并发性能差:在高并发场景下,Go net 的 BIO 模式会导致大量的 goroutine 创建和调度,增加系统的资源消耗和调度开销。
  • 数据处理效率低:读写数据时需要进行数据复制,增加了内存开销和 CPU 负担,降低了数据读写效率。

六、总结

Netpoll 在高并发场景下具有明显的性能优势,适合处理大量连接和数据的 RPC 场景。而 Go net 在简单场景下使用更加方便,代码实现简单。开发者可以根据具体的应用场景选择合适的网络库。如果是高并发的 RPC 场景,建议使用 Netpoll;如果是简单的网络编程场景,Go net 是一个不错的选择。

相关推荐
白总Server18 分钟前
GaussDB 分布式数据库调优(架构到全链路优化)
java·网络·c++·架构·go·scala·数据库架构
XiaoCCCcCCccCcccC25 分钟前
传输层协议 TCP 介绍 -- TCP协议格式,确认应答机制,超时重传机制,连接管理机制,滑动窗口,流量控制,拥塞控制,延迟应答,捎带应答
网络·网络协议·tcp/ip
我言秋日胜春朝★2 小时前
【Linux网络编程】基于udp套接字实现的网络通信
linux·网络·udp
搬码临时工3 小时前
域名访问内网网站知多少?通过自定义域名访问本地Web 服务
服务器·网络·tcp/ip
摘取一颗天上星️3 小时前
端到端记忆网络 vs 神经图灵机:外部记忆的两种哲学之争
网络·人工智能·深度学习·机器学习·lstm·外部记忆
数据与人工智能律师4 小时前
当机床开始“思考”,传统“制造”到“智造”升级路上的法律暗礁
大数据·网络·算法·云计算·区块链
开源的6lowpan4 小时前
无线USB转换器TOS-WLink露面1个月以来总结
网络·无线调试器·无线usb转换器·无线串口·无线jlink·无线stlink
~央千澈~5 小时前
WebSocket与XMPP:即时通讯技术的本质区别与选择逻辑优雅草卓伊凡|片翼|许贝贝
网络·websocket·网络协议
超级土豆粉5 小时前
OSI 七层网络模型
网络
盛满暮色 风止何安5 小时前
BGP基础
运维·服务器·网络·网络协议·tcp/ip·网络安全·智能路由器