Tracy Profiler 是目前 C++ 多线程程序实时性能分析工具

Tracy Profiler 是目前 C++ 多线程程序(游戏引擎、SLAM、视觉系统)里 最强的实时性能分析工具之一

它可以精确分析:

  • 线程运行时间
  • 线程等待时间
  • mutex 锁竞争
  • CPU cache miss
  • frame pipeline

对于 统计线程等待其他线程数据时间 ,Tracy 的 Zone + Lock Profiling 非常适合。


一、基础示例:统计线程等待数据时间

1 引入 Tracy

下载:

复制代码
https://github.com/wolfpld/tracy

项目中包含:

cpp 复制代码
Tracy.hpp
TracyClient.cpp

编译时需要:

cpp 复制代码
#define TRACY_ENABLE

2 示例代码

cpp 复制代码
#include <thread>
#include <mutex>
#include <condition_variable>
#include <queue>

#define TRACY_ENABLE
#include "Tracy.hpp"

std::mutex mtx;
std::condition_variable cv;
std::queue<int> dataQueue;

bool running = true;

void producer()
{
    while (running)
    {
        ZoneScoped;  // Tracy 统计该函数执行时间

        std::this_thread::sleep_for(std::chrono::milliseconds(30));

        {
            std::lock_guard<std::mutex> lock(mtx);
            dataQueue.push(rand());
        }

        cv.notify_one();
    }
}

void consumer()
{
    while (running)
    {
        ZoneScoped;

        std::unique_lock<std::mutex> lock(mtx);

        ZoneScopedN("Waiting Data");

        cv.wait(lock, [] { return !dataQueue.empty(); });

        int value = dataQueue.front();
        dataQueue.pop();

        lock.unlock();

        std::this_thread::sleep_for(std::chrono::milliseconds(10));
    }
}

int main()
{
    tracy::SetThreadName("Main Thread");

    std::thread t1(producer);
    std::thread t2(consumer);

    tracy::SetThreadName("Producer");
    tracy::SetThreadName("Consumer");

    std::this_thread::sleep_for(std::chrono::seconds(10));

    running = false;

    t1.join();
    t2.join();
}

二、Tracy 显示效果

运行后打开:

复制代码
Tracy.exe

可以看到 timeline:

复制代码
Producer Thread
██████ compute
     ██████ compute

Consumer Thread
██ wait data
████ compute
██ wait data

你会看到:

复制代码
Waiting Data

这段时间就是 线程等待数据时间


三、精确统计 Mutex 等待时间

Tracy 还可以直接统计 锁竞争

使用:

cpp 复制代码
#include "TracyLock.hpp"

代码改为:

cpp 复制代码
tracy::Lockable<std::mutex> mtx;

示例:

cpp 复制代码
tracy::Lockable<std::mutex> mtx;

void consumer()
{
    while (running)
    {
        ZoneScoped;

        std::unique_lock<tracy::Lockable<std::mutex>> lock(mtx);

        cv.wait(lock, [] { return !dataQueue.empty(); });

        int value = dataQueue.front();
        dataQueue.pop();
    }
}

Tracy 会显示:

复制代码
Lock contention

并告诉你:

复制代码
Thread A waited 2.1 ms
Thread B waited 5.4 ms

四、视觉 SLAM 示例(Tracking 等待 Frame)

视觉系统常见 pipeline:

复制代码
Camera Thread
     ↓
Tracking Thread
     ↓
Mapping Thread

Tracking 等待 Frame:

cpp 复制代码
void TrackingThread()
{
    while (running)
    {
        ZoneScoped;

        std::unique_lock<std::mutex> lock(frameMutex);

        ZoneScopedN("Wait Frame");

        frameCV.wait(lock, [] { return !frameQueue.empty(); });

        Frame f = frameQueue.front();
        frameQueue.pop();

        lock.unlock();

        ProcessFrame(f);
    }
}

Tracy timeline:

复制代码
Tracking Thread

████ ProcessFrame
██ Wait Frame
████ ProcessFrame
██ Wait Frame

可以直观看到:

复制代码
等待时间
计算时间

五、统计 Frame Pipeline

SLAM 中推荐这样标记:

cpp 复制代码
void ProcessFrame()
{
    ZoneScopedN("Tracking");

    ExtractORB();
    PoseEstimation();
    LocalBA();
}

Tracy timeline:

复制代码
Frame 1

Tracking
 ├─ ExtractORB
 ├─ PoseEstimation
 └─ LocalBA

可以直接看到:

复制代码
哪个模块最慢

六、Frame profiler(视觉系统强烈推荐)

Tracy 还有 frame profiler

使用:

cpp 复制代码
FrameMark;

例如:

cpp 复制代码
while (running)
{
    FrameMark;

    ProcessFrame();
}

Tracy会显示:

复制代码
FPS
Frame time
Frame jitter

非常适合 视觉前端优化


七、Tracy 的优势

相比传统计时:

复制代码
chrono
printf

Tracy优势:

功能 Tracy
线程时间线
mutex等待
CPU cache miss
实时可视化
纳秒精度

八、SLAM项目推荐 instrumentation

建议标记:

复制代码
Tracking
FeatureExtraction
PoseOptimization
LocalMapping
LoopClosing

示例:

cpp 复制代码
ZoneScopedN("FeatureExtraction");

九、实际项目性能优化示例

很多视觉系统优化流程:

复制代码
1 查看线程 timeline
2 找到等待时间
3 找到锁竞争
4 调整 pipeline

例如:

复制代码
Tracking wait frame 40ms
Mapping compute 200ms

说明:

复制代码
Mapping 成为瓶颈

相关推荐
wfbcg5 分钟前
每日算法练习:LeetCode 125. 验证回文串 ✅
算法·leetcode·职场和发展
We་ct6 分钟前
LeetCode 295. 数据流的中位数:双堆解法实战解析
开发语言·前端·数据结构·算法·leetcode·typescript·数据流
十年编程老舅8 分钟前
窥探内核心脏:深入解析 proc 虚拟文件系统
linux·服务器·数据库·c++·linux内核·文件系统·读写锁
迷藏49410 分钟前
**雾计算中的边缘智能:基于Python的轻量级任务调度系统设计与实现**在物联网(IoT)飞速发展的今天,传统云
java·开发语言·python·物联网
大鹏说大话19 分钟前
MySQL与PostgreSQL:底层架构差异与项目选型指南
开发语言
Aaron158823 分钟前
RFSOC+VU13P/VU9P+GPU通用一体化硬件平台
人工智能·算法·fpga开发·硬件架构·硬件工程·信息与通信·基带工程
c++逐梦人33 分钟前
DFS剪枝与优化
算法·深度优先·剪枝
量化炼金 (CodeAlchemy)35 分钟前
【交易策略】基于随机森林的市场结构预测:机器学习在量化交易中的实战应用
算法·随机森林·机器学习
番茄去哪了38 分钟前
任务调度功能实现
java·开发语言·spring boot
xiaoye-duck1 小时前
【C++:哈希表】从哈希冲突到负载因子:深入探索开放定址与链地址法的核心机密
数据结构·c++·散列表