Oracle筑基篇-调度算法-LRU的引入

图1 调度算法思维导图

什么时候用到页面置换算法呢？

当CPU发出指令需要访问某个地址时，若该地址在TLB（Translation Lookaside Buffer，快表）或页表中未命中，就会发生缺页异常（Page Fault）。此时，操作系统需要从磁盘加载缺失页面到物理内存中。如果物理内存已满，就需要选择一个页面置换出去腾出空间。

什么是LRU算法？

主要管理虚拟内存和物理内存之间的交换。内存中分成固定大小的页框(4K)，把程序(硬盘上)分成4K大小的块，用到哪一块，加载那一块，加载的过程中，如果内存已经满了，会把最不常用的一块放到swap分区，把最新的一块加载进来，这个就是著名的LRU算法。

LRU算法在此场景下的作用？

除了操作系统，LRU算法还广泛应用于各种缓存系统，用于管理有限的缓存空间：

1. 触摸计数， Oracle 引入触摸计数来测量对 LRU 列表上的缓冲区进行访问的频率**，**每当数据块被访问时，其触摸计数会增加；
2. LRU列表的热端和冷端，同时存在指向同一 LRU 上的脏缓冲区和非脏缓冲区的指针，冷缓冲区是最近未被使用的，热缓冲区是被频繁访问并在最近已使用的；
3. **中部插入机制，**当缓冲区必须从磁盘读入时, 数据库会将缓冲区插入到 LRU 列表的中部，通过这种方式，热块可以保留在缓存中，以使他们不需要再次从磁盘读取；

。。。。。。

在文件系统中，缓存文件块时也经常使用LRU算法。例如，文件读取缓存块满时，选择最久未访问的块进行替换。

**操作系统中当发生缺页异常时，如果内存中没有空闲页框，则需要根据某种策略（如LRU）选择一个页面从物理内存中置换到磁盘，以腾出空间加载需要访问的新页面。**也就是说选择⼀个物理⻚⾯换出到磁盘，然后把需要访问的⻚⾯换⼊到物理⻚。具体流程：

1. 根据置换算法（如LRU）选择一个页面置换到磁盘。
2. 如果被置换的页面是脏页（即内容被修改过），则先将其写回磁盘。
3. 将被置换页面对应的页表项状态改为"无效"。
4. 加载新的页面到该物理页框中，并更新页表项。

当操作系统物理内存已满并且访问的页面不在物理内存时（缺页中断） ，就需要进行换入换出操作，需要通过「⻚⾯置换算法」选择⼀个物理⻚，如果该物理⻚有被修改过（脏⻚），则把它换出到磁盘（写回），然后把该被置换出去的**⻚表项**的状态改成「⽆效的」，最后把正在访问的⻚⾯装⼊到这个物理⻚中。

在具体操作中，LRU算法需要完成以下步骤：

页表字段：页号、物理页、状态位、访问字段、修改位、硬盘地址

我们以数据库缓冲池为例，其中LRU有两个功能

假设buffer cache大小为6

我们依次读入buffer的数据分别是2、6、3、7、8、9、1、10，这时候数组已经满了，如果需要新调入一个数据块，这时候我们**怎么找出数组中哪一项时最不常用的？**实现方式很多，最常用的可以在每一个块上记录一个Timestamp，此时，3号块8s没被访问，时间最长。

但是问题又来了，查找最不常用的内存块需要遍历整个buffer cache，时间复杂度时O(n)，好一点的数组查找算法如二分查找也要 O(log n) ，哈希查找理想情况下是O(1)，但最坏情况下所有元素都映射到一个桶里可能是O(n)，也就是我们常说的存在哈希冲突，换链表试一下。

数组实现优劣：

使用尾插法维护一个单向链表，每次把新来的数据插入在链表尾部，头部就永远是最不常用的块，比如依次访问2、6、3、7、4、8六个块，

这时候缓存满了

当访问的块不在buffer里，直接把头去掉head=head.next,把新访问的数据块插入到链表尾部；put()写入数据是O(1)，删除最不常用的数据也是O(1).
当访问的块在buffer里，比如要再次访问块3的时候，需要把最后访问的放到链表尾部，也就是3放到链表尾部，这个时候缓冲区块的物理位置是不会改变的，变动指针方向即可。