1、使用 Class 代替 ProtoBuf 协议
因为 ProtoBuf 采用的是 Arena 内存分配器策略,有些场景会比 C++的 Class 内存管理复杂,当有大量内存分配和释放的时候会比 Class 的性能差很多。而且 Protobuf 会不断分配和回收小内存对象,持续地分配和删除小内存对象导致产生内存碎片,降低程序的内存使用率,尤其是当协议中包含 string 类型的时候,性能差距可能有几倍。对于包含了很多小对象的 Protobuf message,析构过程会导致堆上分配了许多对象,从而会变得复杂,导致析构函数执行速度变慢。
https://www.cnblogs.com/papering/p/18058309
2、使用 jemalloc/tcmalloc 代替普通的 malloc 方式
使用 C++的 STL(malloc),所以会出现以下几种缺点:
内存碎片:频繁分配和释放不同大小的对象,可能导致内存碎片,降低内存的使用效率。Cache 不友好:而且 STL 的普通内存分配器分散了对象的内存地址,降低了数据的缓存命中率。并发差:STL 的默认内存分配器可能使用全局锁,相当于给加了一把大锁,在多线程环境下性能表现很差。