memset会导致一大块内存进cache吗

在Arm体系结构中,我们知道大多数的normal memory的配置都是write allocation和read allocation的,即当写一块内存或读一块内存的时候,如果miss了,那么会将该物理内存缓存到cache中。 那么就带来一个这样的思考,如果我执行memset(a, b, len),len是一个很大的数,即对一大块内存清0,那么这一大块内存数据(此时都是0的数据)都需要被缓存到cache吗? 这岂不是造成cache的浪费?一下就把cache占满了?

在之前的微架构,也许是真的存在此问题的。然后在近些年的微架构中,可通过"Write streaming mode"解决。具体介绍如下,我们就以Cortex-A720为例,进一步说明。

Cortex-A720核心支持Write streaming mode,有时也称为读分配模式,对于L1和L2缓存都支持。

在读不命中或写不命中时,会向L1或L2缓存分配缓存行。然而,写入大块数据可能会使缓存中充满不必要的数据。这不仅会浪费电力,也会降低性能,因为整个线路会被后续写入覆盖(例如使用memset()或memcpy())。在某些情况下,不需要在写入时分配缓存行。例如,当执行C标准库的memset()函数来将大块内存清零为已知值时。

为了防止不必要的缓存行分配,内存系统会检测core何时写入了一系列完整的缓存行。如果在可配置数量的连续线路填充上检测到这种情况,那么它会切换到写入流模式。

在写入流模式下,加载操作行为与正常情况相同,仍然可能引起线路填充。

写入仍然在缓存中查找,但如果未命中,则会写入L2或L3缓存,而不会启动线路填充L1。

在内存系统切换到写入流模式之前,CHI主控器或AXI主控器接口可能会观察到超过指定数量的线路填充。

写入流模式保持启用,直到以下情况之一发生:

• 检测到一个不是完整缓存行的可缓存写入突发。

• 存在后续加载操作,其目标与未完成的写入流相同。

当Cortex-A720核心切换到写入流模式后,内存系统会继续监视总线流量。当它观察到一系列完整的缓存行写入时,会向L2或L3缓存发出信号,以进入写入流模式。

写入流阈值定义了在存储操作停止引起缓存分配之前,连续写入的缓存行数量。您可以通过写入寄存器 IMP_CPUECTLR_EL1来配置每个缓存(L1、L2和L3)的写入流阈值。

相关推荐
Pasregret23 分钟前
多级缓存架构深度解析:从设计原理到生产实践
缓存·架构
我的golang之路果然有问题2 小时前
快速了解redis,个人笔记
数据库·经验分享·redis·笔记·学习·缓存·内存
道友老李3 小时前
【存储中间件】Redis核心技术与实战(五):Redis缓存使用问题(BigKey、数据倾斜、Redis脑裂、多级缓存)、互联网大厂中的Redis
redis·缓存·中间件
绿算技术11 小时前
存储新势力:助力DeepSeek一体机
人工智能·科技·缓存·fpga开发
zru_960216 小时前
Docker 部署 Redis:快速搭建高效缓存服务
redis·缓存·docker
axinawang17 小时前
springboot整合redis实现缓存
spring boot·redis·缓存
for6219 小时前
本地缓存大杀器-Caffeine
缓存·caffeine·本地缓存
听闻风很好吃1 天前
Redis高级数据类型解析(二)——Set、Sorted Set与Geo实战指南
数据库·redis·缓存
陈大大陈1 天前
基于 C++ 的用户认证系统开发:从注册登录到Redis 缓存优化
java·linux·开发语言·数据结构·c++·算法·缓存
编程在手天下我有1 天前
缓存与数据库数据一致性:旁路缓存、读写穿透和异步写入模式解析
数据库·缓存·oracle·软件开发·架构设计·数据一致性