79.Go 中如何对性能进行度量与分析(Benchmark)

Golang 程序进行性能优化,可以在提升业务收益的同时,起到降低成本的作用。

Benchmark 示例

go 复制代码
func BenchmarkConvertReflect(b *testing.B) {
var v interface{} = int32(64)
for i:=0;i<b.N;i++{ 
    f := reflect.ValueOf(v).Int()
	if f != int64(64){
            b.Error("errror")
        }
    }
}

函数固定以 Benchmark 开头,其位于_test.go 文件中,入参为 testing.B ,业务逻辑应放在 for 循环中,因为 b.N 会依次取值 1, 2, 3, 5, 10, 20, 30, 50,100.........,直至执行时间超过 1s

可以运行 go test -bench 命令执行 benchmark,其结果如下:

go 复制代码
go test -bench='BenchmarkConvertReflect' -run=none
goos: darwin
goarch: amd64
pkg: gotest666
cpu: Intel(R) Core(TM) i7-9750H CPU @ 2.60GHz
BenchmarkConvertReflect-12      520200014            2.291 ns/op
  • --bench='BenchmarkConvertReflect', 要执行的 benchmark。需注意:该参数支持模糊匹配,如--bench='Get|Set' ,支持./...-run=none,只进行 Benchmark,不执行单测

  • BenchmarkConvertReflect, 在12核下,1s内执行了520200014次,每次约2.291ns

高级用法

go 复制代码
go test -bench='Convert' -run=none -benchtime=2s -count=3 -cpu='2,4' -benchmem -cpuprofile=cpu.profile -memprofile=mem.profile -blockprofile=blk.profile -trace=trace.out -gcflags=all=-l
goos: darwin
goarch: amd64
pkg: gotest666
cpu: Intel(R) Core(TM) i7-9750H CPU @ 2.60GHz
BenchmarkConvertReflect-2       1000000000           2.286 ns/op           0 B/op          0 allocs/op
BenchmarkConvertReflect-2       1000000000           2.302 ns/op           0 B/op          0 allocs/op
BenchmarkConvertReflect-2       1000000000           2.239 ns/op           0 B/op          0 allocs/op
BenchmarkConvertReflect-4       1000000000           2.244 ns/op           0 B/op          0 allocs/op
BenchmarkConvertReflect-4       1000000000           2.236 ns/op           0 B/op          0 allocs/op
BenchmarkConvertReflect-4       1000000000           2.247 ns/op           0 B/op          0 allocs/op
PASS
  • -benchtime=2s, 依次递增 b.N 直至运行时间超过 2s
  • -count=3,执行 3
  • -benchmem,-b.ReportAllocs,展示堆分配信息,0 B/op, 0 allos/op 分别代表每次分配了多少空间,每个 op 有多少次空间分配
  • -cpu='2,4',依次在 2 核、4 核下进行测试
  • -cpuprofile=xxxx -memprofile=xxx -trace=trace.outbenmark 时生成 profiletrace 文件
  • -gcflags=all=-l,停止编译器的内联优化
相关推荐
jump_jump21 小时前
妙用 localeCompare 获取汉字拼音首字母
前端·javascript·浏览器
U.2 SSD21 小时前
Echarts单轴坐标系散点图
前端·javascript·echarts
不做无法实现的梦~21 小时前
jetson刷系统之后没有浏览器--解决办法
开发语言·javascript·ecmascript
德育处主任Pro21 小时前
前端玩转大模型,DeepSeek-R1 蒸馏 Llama 模型的 Bedrock 部署
前端·llama
Jedi Hongbin1 天前
Three.js NodeMaterial 节点材质系统文档
前端·javascript·three.js·nodematerial
前端小马1 天前
前后端Long类型ID精度丢失问题
java·前端·javascript·后端
用户1456775610371 天前
干净的图片批量处理,处理速度飞快
前端
赴前尘1 天前
Go 微服务框架排行榜(按 GitHub Star 排序)
微服务·golang·github
用户1456775610371 天前
亲测好用!简单实用的图片尺寸调整工具
前端
索西引擎1 天前
npm、yarn、pnpm
前端·npm·node.js