从KB到字节：Qt行情数据压缩与传输优化的全链路透视——LZ4、Snappy与自定义二进制协议的极限压榨

深度剖析高频行情数据压缩算法选型、零拷贝传输架构、带宽与延迟的Trade-off平衡

一、行情数据的压缩必要性

Level-2行情每秒产生数千条tick，单条tick原始JSON约200-500字节。以沪深两市4000只股票、每秒500条tick计：

复制代码

4000 × 500 × 300字节 ≈ 600MB/s

即使1Gbps专线也无法承载。压缩后的数据量可降低10-20倍，将带宽需求压缩到30-60MB/s。

但压缩是一把双刃剑：压缩率高意味着计算开销大，增加延迟。在高频交易中，需要在压缩率与延迟之间找到最优平衡点。

二、压缩算法横向评测

2.1 候选算法

算法	压缩率	压缩速度	解压速度	特点
LZ4	2.5x	400MB/s	1000MB/s	极快解压
Snappy	2.2x	250MB/s	500MB/s	Google出品
Zstd	3.5x	350MB/s	1000MB/s	高压缩率
zlib	4x	50MB/s	150MB/s	通用但慢
LZMA	7x	5MB/s	50MB/s	最高压缩率

2.2 行情数据实测

使用沪深全市场Level-2快照（约1GB原始数据）：

算法	压缩后大小	压缩耗时	解压耗时	单tick延迟
LZ4	420MB	2.5s	1s	~0.5μs
Snappy	480MB	4s	2s	~1μs
Zstd	290MB	3s	1s	~0.5μs
zlib	250MB	20s	7s	~3.5μs

结论： LZ4和Zstd是高频交易的最佳选择，解压延迟控制在1μs以内。

2.3 LZ4源码集成

cpp 复制代码

#include <lz4.h>

class Lz4Compressor
{
public:
    static QByteArray compress(const QByteArray &src, int level = 1)
    {
        const int maxDstSize = LZ4_compressBound(src.size());
        QByteArray dst(maxDstSize, 0);

        int compressedSize;
        if (level <= 3) {
            // 快速模式，适合实时压缩
            compressedSize = LZ4_compress_default(
                src.constData(), dst.data(), src.size(), maxDstSize);
        } else {
            // 高压缩率模式
            compressedSize = LZ4_compress_HC(
                src.constData(), dst.data(), src.size(), maxDstSize, level);
        }

        dst.resize(compressedSize);
        return dst;
    }

    static QByteArray decompress(const QByteArray &src, int originalSize)
    {
        QByteArray dst(originalSize, 0);
        int result = LZ4_decompress_safe(
            src.constData(), dst.data(), src.size(), originalSize);
        if (result < 0) {
            qWarning() << "LZ4 decompression failed";
            return {};
        }
        return dst;
    }
};

三、行情数据结构优化：压缩前的基础功

压缩算法对结构化数据的效果远好于随机数据。行情tick中存在大量冗余：

3.1 Delta编码

相邻tick的价格、成交量通常变化很小，使用Delta编码大幅压缩：

cpp 复制代码

struct TickHeader {
    uint32_t timestampDelta;  // 相对上一tick的时间差
    uint32_t symbolId;        // symbol转为ID映射
};

struct TickDelta {
    int32_t priceDelta;       // 价格变化×10000（整数）
    int32_t volumeDelta;      // 成交量变化
    int32_t bidPriceDelta;    // 买价变化
    int32_t askPriceDelta;    // 卖价变化
};

class DeltaEncoder
{
public:
    TickDelta encode(const MarketTick &tick)
    {
        TickDelta delta;
        if (m_lastPrice > 0) {
            delta.priceDelta = static_cast<int32_t>((tick.price - m_lastPrice) * 10000);
            delta.volumeDelta = static_cast<int32_t>(tick.volume - m_lastVolume);
        } else {
            delta.priceDelta = static_cast<int32_t>(tick.price * 10000);
            delta.volumeDelta = static_cast<int32_t>(tick.volume);
        }
        m_lastPrice = tick.price;
        m_lastVolume = tick.volume;
        return delta;
    }

private:
    double m_lastPrice = 0;
    int64_t m_lastVolume = 0;
};

3.2 字典编码

将symbol字符串转为整数ID：

cpp 复制代码

class SymbolDictionary
{
public:
    uint32_t encode(const QString &symbol)
    {
        auto it = m_symbolToId.find(symbol);
        if (it != m_symbolToId.end()) {
            return it.value();
        }
        uint32_t id = m_nextId++;
        m_symbolToId[symbol] = id;
        m_idToSymbol[id] = symbol;
        return id;
    }

    QString decode(uint32_t id) const
    {
        return m_idToSymbol.value(id);
    }

private:
    QMap<QString, uint32_t> m_symbolToId;
    QMap<uint32_t, QString> m_idToSymbol;
    uint32_t m_nextId = 0;
};

3.3 优化前后对比

字段	原始大小	优化后	节省
symbol	8字节(string)	4字节(uint32)	4字节
timestamp	8字节(int64)	4字节(delta)	4字节
price	8字节(double)	4字节(int32 delta)	4字节
volume	8字节(int64)	4字节(int32 delta)	4字节
bid/ask	16字节	8字节(delta)	8字节
总计	48字节	24字节	50%

四、自定义二进制协议设计

4.1 协议帧结构

复制代码

+--------+--------+----------+-----------+------------+
| Magic  | Type   | Length   | Sequence  | Payload    |
| 4字节  | 1字节  | 4字节    | 8字节     | N字节      |
+--------+--------+----------+-----------+------------+

cpp 复制代码

#pragma pack(push, 1)
struct PacketHeader
{
    uint32_t magic;      // 0x54494B43 ('TICK')
    uint8_t type;       // 0x01=snapshot, 0x02=delta, 0x03=orderbook
    uint32_t length;    // payload长度
    uint64_t sequence;  // 序列号（用于重组和去重）
};
#pragma pack(pop)

enum PacketType : uint8_t
{
    SNAPSHOT = 0x01,
    DELTA = 0x02,
    ORDERBOOK = 0x03,
    HEARTBEAT = 0xFF
};

4.2 序列化框架

cpp 复制代码

class BinaryWriter
{
public:
    BinaryWriter& writeUint32(uint32_t v)
    {
        m_buffer.append(reinterpret_cast<const char*>(&v), 4);
        return *this;
    }

    BinaryWriter& writeDouble(double v)
    {
        m_buffer.append(reinterpret_cast<const char*>(&v), 8);
        return *this;
    }

    BinaryWriter& writeString(const QString &s, int maxLen = 32)
    {
        QByteArray utf8 = s.toUtf8();
        uint8_t len = qMin<uint8_t>(utf8.size(), maxLen);
        m_buffer.append(reinterpret_cast<const char*>(&len), 1);
        m_buffer.append(utf8.left(len));
        return *this;
    }

    QByteArray toByteArray() const { return m_buffer; }

private:
    QByteArray m_buffer;
};

class BinaryReader
{
public:
    BinaryReader(const char *data, int size)
        : m_data(data), m_size(size), m_pos(0) {}

    uint32_t readUint32()
    {
        if (m_pos + 4 > m_size) return 0;
        uint32_t v;
        memcpy(&v, m_data + m_pos, 4);
        m_pos += 4;
        return v;
    }

    double readDouble()
    {
        if (m_pos + 8 > m_size) return 0;
        double v;
        memcpy(&v, m_data + m_pos, 8);
        m_pos += 8;
        return v;
    }

private:
    const char *m_data;
    int m_size, m_pos;
};

4.3 批量打包优化

多条tick打包发送，减少网络往返：

cpp 复制代码

class TickBatcher
{
public:
    TickBatcher(int maxBatchSize = 100, int maxLatencyMs = 10)
        : m_maxBatch(maxBatchSize), m_maxLatency(maxLatencyMs) {}

    void addTick(const MarketTick &tick)
    {
        m_batch.append(encodeTick(tick));
        m_batchCount++;

        if (m_batchCount >= m_maxBatch ||
            m_timer.elapsed() >= m_maxLatency * 1000000LL) {
            flush();
        }
    }

    void flush()
    {
        if (m_batch.isEmpty()) return;

        PacketHeader header;
        header.magic = 0x54494B43;
        header.type = DELTA;
        header.length = m_batch.size();
        header.sequence = m_sequence++;

        QByteArray packet;
        packet.append(reinterpret_cast<const char*>(&header), sizeof(header));
        packet.append(m_batch);

        emit packetReady(packet);

        m_batch.clear();
        m_batchCount = 0;
        m_timer.start();
    }

signals:
    void packetReady(const QByteArray &data);

private:
    QByteArray encodeTick(const MarketTick &tick)
    {
        BinaryWriter w;
        w.writeUint32(m_symbolDict.encode(tick.symbol))
         .writeDouble(tick.price)
         .writeDouble(tick.volume);
        return w.toByteArray();
    }

    int m_maxBatch, m_maxLatency;
    QByteArray m_batch;
    int m_batchCount = 0;
    uint64_t m_sequence = 0;
    NanoTimer m_timer;
    SymbolDictionary m_symbolDict;
};

五、零拷贝传输架构

5.1 避免数据拷贝的链路

cpp 复制代码

// 传统方式（多次拷贝）
void processData(QByteArray data)  // 拷贝1: 参数传递
{
    QByteArray compressed = Lz4Compressor::compress(data);  // 拷贝2
    QByteArray packet = buildPacket(compressed);           // 拷贝3
    m_socket->write(packet);                              // 拷贝4: 内核态
}

// 零拷贝方式
void processData(const char *data, int size)  // 指针传递，无拷贝
{
    // 直接在原始buffer上操作
    const int maxCompressed = LZ4_compressBound(size);
    char *compressed = m_buffer.data();  // 预分配buffer
    int compressedSize = LZ4_compress_default(data, compressed, size, maxCompressed);

    // 构建header（栈上）
    PacketHeader header;
    header.magic = 0x54494B43;
    header.type = DELTA;
    header.length = compressedSize;
    header.sequence = m_sequence++;

    // scatter-gather I/O，避免额外拷贝
    struct iovec iov[2];
    iov[0].iov_base = &header;
    iov[0].iov_len = sizeof(header);
    iov[1].iov_base = compressed;
    iov[1].iov_len = compressedSize;

#ifdef Q_OS_LINUX
    writev(m_socketFd, iov, 2);
#elif defined(Q_OS_WIN)
    WSABUF wsabufs[2];
    wsabufs[0].buf = (char*)&header;
    wsabufs[0].len = sizeof(header);
    wsabufs[1].buf = compressed;
    wsabufs[1].len = compressedSize;
    DWORD sent;
    WSASend(m_socketFd, wsabufs, 2, &sent, 0, nullptr, nullptr);
#endif
}

5.2 环形缓冲区发送

cpp 复制代码

template<size_t Size = 1024 * 1024>  // 1MB发送缓冲
class RingBuffer
{
public:
    int write(const char *data, int len)
    {
        std::lock_guard<std::mutex> lock(m_mutex);
        int available = Size - (m_writePos - m_readPos);
        if (len > available) len = available;

        int firstPart = qMin(len, Size - (m_writePos % Size));
        memcpy(m_buffer + (m_writePos % Size), data, firstPart);
        if (firstPart < len) {
            memcpy(m_buffer, data + firstPart, len - firstPart);
        }
        m_writePos += len;
        return len;
    }

    int read(char *data, int maxLen)
    {
        std::lock_guard<std::mutex> lock(m_mutex);
        int available = m_writePos - m_readPos;
        int len = qMin(maxLen, available);

        int firstPart = qMin(len, Size - (m_readPos % Size));
        memcpy(data, m_buffer + (m_readPos % Size), firstPart);
        if (firstPart < len) {
            memcpy(data + firstPart, m_buffer, len - firstPart);
        }
        m_readPos += len;
        return len;
    }

private:
    char m_buffer[Size];
    size_t m_readPos = 0, m_writePos = 0;
    std::mutex m_mutex;
};

六、服务端与客户端完整实现

6.1 服务端行情推送

cpp 复制代码

class MarketDataServer : public QObject
{
    Q_OBJECT
public:
    void start(quint16 port)
    {
        m_server.listen(QHostAddress::Any, port);
        connect(&m_server, &QTcpServer::newConnection, this, [this] {
            QTcpSocket *client = m_server.nextPendingConnection();
            connect(client, &QTcpSocket::disconnected, client, &QTcpSocket::deleteLater);
            m_clients.append(client);
        });
    }

    void pushTick(const MarketTick &tick)
    {
        // Delta编码
        TickDelta delta = m_deltaEncoder.encode(tick);

        // 序列化
        BinaryWriter w;
        w.writeUint32(m_symbolDict.encode(tick.symbol))
         .writeUint32(static_cast<uint32_t>(tick.timestamp & 0xFFFFFFFF))
         .writeUint32(*reinterpret_cast<uint32_t*>(&delta.priceDelta))
         .writeUint32(*reinterpret_cast<uint32_t*>(&delta.volumeDelta));

        QByteArray payload = w.toByteArray();

        // LZ4压缩
        QByteArray compressed = Lz4Compressor::compress(payload);

        // 构建包
        PacketHeader header;
        header.magic = 0x54494B43;
        header.type = DELTA;
        header.length = compressed.size();
        header.sequence = m_sequence++;

        QByteArray packet;
        packet.append(reinterpret_cast<const char*>(&header), sizeof(header));
        packet.append(compressed);

        // 广播给所有客户端
        for (QTcpSocket *client : m_clients) {
            client->write(packet);
        }
    }

private:
    QTcpServer m_server;
    QList<QTcpSocket*> m_clients;
    DeltaEncoder m_deltaEncoder;
    SymbolDictionary m_symbolDict;
    uint64_t m_sequence = 0;
};

6.2 客户端行情接收

cpp 复制代码

class MarketDataClient : public QObject
{
    Q_OBJECT
public:
    void connectToServer(const QString &host, quint16 port)
    {
        m_socket.connectToHost(host, port);
        connect(&m_socket, &QTcpSocket::readyRead, this, &MarketDataClient::onReadyRead);
    }

signals:
    void tickReceived(const MarketTick &tick);

private:
    void onReadyRead()
    {
        m_buffer.append(m_socket.readAll());

        while (m_buffer.size() >= static_cast<int>(sizeof(PacketHeader))) {
            PacketHeader header;
            memcpy(&header, m_buffer.constData(), sizeof(header));

            if (header.magic != 0x54494B43) {
                m_buffer.remove(0, 1);
                continue;
            }

            if (m_buffer.size() < static_cast<int>(sizeof(header) + header.length)) {
                break;  // 数据不完整，等待更多
            }

            // 解压
            QByteArray compressed = m_buffer.mid(sizeof(header), header.length);
            QByteArray payload = Lz4Compressor::decompress(compressed, m_expectedPayloadSize);

            // 解析
            BinaryReader reader(payload.constData(), payload.size());
            MarketTick tick;
            tick.symbol = m_symbolDict.decode(reader.readUint32());
            tick.timestamp = reader.readUint32();
            // ...

            emit tickReceived(tick);

            m_buffer.remove(0, sizeof(header) + header.length);
        }
    }

    QTcpSocket m_socket;
    QByteArray m_buffer;
    SymbolDictionary m_symbolDict;
    int m_expectedPayloadSize = 24;
};

七、性能基准测试

7.1 测试场景

数据：沪深全市场Level-2快照（4000只股票，500tick/s/股）
网络：1Gbps专线
硬件：Intel i7-12700K，DDR4 3200MHz

7.2 结果对比

方案	带宽占用	端到端延迟	CPU占用
JSON原始	600MB/s	-	- (超带宽)
JSON+LZ4	240MB/s	15μs	30%
自定义二进制	300MB/s	8μs	15%
二进制+Delta+LZ4	60MB/s	5μs	20%

7.3 优化收益分析

复制代码

原始方案：600MB/s → 无法传输
优化后：  60MB/s → 带宽节省90%
延迟：    从15μs降至5μs → 降低66%

八、容错与断线重连

cpp 复制代码

class RobustClient : public QObject
{
    Q_OBJECT
public:
    void start()
    {
        connect(&m_reconnectTimer, &QTimer::timeout, this, &RobustClient::tryReconnect);
        tryReconnect();
    }

private:
    void tryReconnect()
    {
        if (m_socket.state() == QAbstractSocket::ConnectedState) {
            return;
        }

        m_socket.connectToHost(m_host, m_port);
        if (m_socket.waitForConnected(5000)) {
            m_reconnectTimer.stop();
            // 请求从上次序列号之后的数据
            requestResend(m_lastSequence);
        } else {
            m_reconnectTimer.start(5000);  // 5秒后重试
        }
    }

    void requestResend(uint64_t fromSeq)
    {
        QByteArray req;
        QDataStream out(&req, QIODevice::WriteOnly);
        out << QString("RESEND") << fromSeq;
        m_socket.write(req);
    }

    QTcpSocket m_socket;
    QTimer m_reconnectTimer;
    QString m_host;
    quint16 m_port;
    uint64_t m_lastSequence = 0;
};

九、总结

行情数据压缩与传输优化是高频交易系统的基础设施：

算法选型：LZ4/Zstd在延迟与压缩率间取得最佳平衡
数据优化：Delta编码、字典编码将数据量减少50%
协议设计：自定义二进制协议比JSON更紧凑、解析更快
零拷贝：scatter-gather I/O避免用户态↔内核态多次拷贝
批量发送：减少网络往返，但需控制最大延迟
容错机制：断线重连、序列号校验保证数据完整性

最终效果：带宽占用降低90%，端到端延迟从15μs降至5μs。

以上仅为技术分享参考，不构成投资建议

《注：若有发现问题欢迎大家提出来纠正》