D3000平台DDR4Stream单核性能高于多核性能情况说明

D3000 平台 DDR4 Stream 整体性能不变,下文对测试异常情况说明:

1、D3000 DDR 控制器的 2 种地址映射模式

为了均衡单核及多核使用场景,D3000 DDR 控制器设计了两种 BG_Rotate地址映射模式(如下图 1 和 2)。------目前选用的是模式 2 的方式。

  • 模式 1

bg_rotate = 0 时,相邻读/写为相同 bank group,自由 bank个数=16,如下图 1 所示,DDR4 单 RANK Stream 实际测试得分:呈现单核性能到多核性能线性增加。图中横轴是 D3000 的核数 1-8。

  • 模式 2

bg_rotate = 1 时,相邻读/写为不同 bank group,自由 bank个数=8,两个 bg 交替执行读/写传输,存在绑定关系,总线利用率高,自由 bank个数少,行冲突概率小,如下图 2 所示,DDR4 单 RANK Stream 实际测试得分:呈现单核性能高于多核性能。图中横轴是 D3000 的核数 1-8。

根据综上所述,关于 BG_Rotate 可配参数的优势在于客户可依据应用场景进行取舍,整体的最高性能基本无差异,差异点在于最高性能体现在单核还是多核的权衡。

2、BG_Rotate 模式影响 Stream 性能趋势的说明

3、优化方案建议

  • 软件:控制线程数;关闭 BG_Rotate 使能,整体的最高性能基本无差异,仅仅是不同线程时的变化
  • 硬件:DDR4->DDR5
相关推荐
张永清2 天前
每周读书与学习->Jmeter中如何使用Bean Shell脚本(一)Bean Shell的简介与安装
性能测试·性能调优·jmeter性能测试·性能分析·性能诊断·每周读书与学习
se-tester7 天前
性能测试(Performance Testing)、压力测试(Stress Testing)和 负载测试(Load Testing)三者的区别
性能测试
Felven7 天前
国产沐创N20 100G网卡性能测试
linux·性能测试·国产100g网卡·沐创
七夜zippoe10 天前
性能测试实战:Locust负载测试框架深度指南
分布式·python·性能测试·locust·性能基准
七夜zippoe12 天前
属性测试革命:Hypothesis框架深度实战指南
python·性能测试·数据驱动·hypothesis·状态机测试
xcLeigh13 天前
基于 IoT-benchmark 的时序数据库性能测试实战:从安装到结果分析
数据库·物联网·性能测试·时序数据库·iotdb
Felven21 天前
corundum 40G开源网卡测试结果
fpga开发·性能测试·dds·开源网卡·mqnic
dawdo22222 天前
自己动手从头开始编写LLM推理引擎(11)-xLLM的benchmark实现
llm·transformer·性能测试·qwen·benchmark·推理引擎
玉梅小洋1 个月前
iperf 网络性能测试完整指南(含多服务端测试)
网络·测试工具·性能测试·iperf