基于pyroscope-go项目性能数据持续收集

背景

在日常开发过程中,遇到类似崩溃或者cpu飚高时刻没法获取到有效的pprof数据,从而去优化修复项目。所以我们需要引入持续性分析且能够允许我们随着时间的推移了解系统资源的使用情况,从而定位、调试和修复性能相关的问题。

使用场景

  1. 查找代码中的性能问题

  2. 解决高 CPU 利用率的问题

  3. 定位并修复内存泄漏

  4. 理解应用程序的调用树

  5. 跟踪指标随时间的变化

性能及原理

  1. 关于采集文件存储:在官方文档有说明:为避免丢失最新数据,当它检测到数据路径所在的卷接近磁盘不足,Pyroscope 将删除最旧的块。

  2. pyroscope是定时从runtime提供的几个函数获取系统指标数据,以及pprof上报是通过http上传到远程server中,只要上传和获取频率不是非常大,对业务本身影响并不大

部署

colobu.com/2022/01/27/...

为便于使用,目前采用的是Go Agent ,采用push模式,参考文档

dockerfile 复制代码
docker run -it  --name=pyroscope-go -p 4040:4040 pyroscope/pyroscope:latest server
go 复制代码
go get github.com/grafana/pyroscope-go

package main

import "github.com/grafana/pyroscope-go"

func main() {
  // These 2 lines are only required if you're using mutex or block profiling
  // Read the explanation below for how to set these rates:
  runtime.SetMutexProfileFraction(5)
  runtime.SetBlockProfileRate(5)

  pyroscope.Start(pyroscope.Config{
    ApplicationName: "simple.golang.app", //自定义应用名称

    // replace this with the address of pyroscope server
    ServerAddress:   "http://pyroscope-server:4040", //本地是http://127.0.0.1:4040

    // you can disable logging by setting this to nil
    Logger:          pyroscope.StandardLogger,

    // you can provide static tags via a map:
    Tags:            map[string]string{"hostname": os.Getenv("HOSTNAME")},

    ProfileTypes: []pyroscope.ProfileType{
      // these profile types are enabled by default:
      pyroscope.ProfileCPU,
      pyroscope.ProfileAllocObjects,
      pyroscope.ProfileAllocSpace,
      pyroscope.ProfileInuseObjects,
      pyroscope.ProfileInuseSpace,

      // these profile types are optional:
      pyroscope.ProfileGoroutines,
      pyroscope.ProfileMutexCount,
      pyroscope.ProfileMutexDuration,
      pyroscope.ProfileBlockCount,
      pyroscope.ProfileBlockDuration,
    },
  })

  // your code goes here
}

只要以上两步,访问127.0.0.1:4040你就可以看到布灵布灵的火焰图了

目前我本地只是做了pprof的收集分析,大佬们后续可以考虑线上k8s环境中借鉴七猫技术团队的方案的引入holmes,发现业务性能问题,和上报机制

本文参考文档如下:

github.com/grafana/pyr...

github.com/mosn/holmes...

相关推荐
leobertlan5 小时前
2025年终总结
前端·后端·程序员
面向Google编程5 小时前
从零学习Kafka:数据存储
后端·kafka
易安说AI6 小时前
Claude Opus 4.6 凌晨发布,我体验了一整晚,说说真实感受。
后端
易安说AI6 小时前
Ralph Loop 让Claude无止尽干活的牛马...
前端·后端
易安说AI6 小时前
用 Claude Code 远程分析生产日志,追踪 Claude Max 账户被封原因
后端
颜酱8 小时前
图结构完全解析:从基础概念到遍历实现
javascript·后端·算法
Coder_Boy_10 小时前
基于SpringAI的在线考试系统-考试系统开发流程案例
java·数据库·人工智能·spring boot·后端
掘金者阿豪11 小时前
关系数据库迁移的“暗礁”:金仓数据库如何规避数据完整性与一致性风险
后端
ServBay11 小时前
一个下午,一台电脑,终结你 90% 的 Symfony 重复劳动
后端·php·symfony
sino爱学习11 小时前
高性能线程池实践:Dubbo EagerThreadPool 设计与应用
java·后端