pprof-CPU采样:
采样的是函数调用和占用的时间
100次/s的采样率
采样时间是手动启动到手动结束
pprof-堆内存Heap采样:
通过内存分配器在堆上分配和释放的内存
每分配512KB记录一次
pprof-Goroutine协程&线程创建采样:
记录所有用户发起、运行中的goroutine(入口非runtime开头)
记录程序创建的所有系统线程的信息
上面两者比较类似
pprof-Block&Mutex采样:
采样的是block的次数和耗时 阻塞得超过阈值才被记录
采样的是争抢锁的次数和耗时 只记录固定比例的锁操作
实际生产过程中性能优化
- 业务服务优化
- 基础库优化
- Go语言优化
如下
- 业务服务优化:
服务是:单独部署、有功能
有调用链路
单独的benchmark无法满足复杂逻辑分析 压测(单机器 集群)
性能数据采集(单机器 集群分析)
火焰图
看占用比较长的-定位代码-找到问题
并且问题还有:cpu占用80%和40%的数据是不一样的 都采样一下
做完优化还不能直接上线
-还得再测试一下修改后的
-
基础库优化
AB实验SDK优化 分析基础库的核心逻辑和性能瓶颈 压测验证 落地验证
-
Go语言优化
编译器 运行时优化 优化内存分配策略 也是压测-落地