性能:Java开发分布式存储系统都有哪些常用的编码技巧?

PageCache 调优和 Direct IO

有以下三种情况,PageCache 无法起作用。

  1. 使用 FIleChannel 读写时,底层可能走 Direct IO,不走页缓存。
  2. 在内存有限或者不够用的时候,频繁换页,导致缓存命中率低。
  3. 大量随机读的场景,导致页缓存的数据无法命中。

有一种解决思路是:通过使用 Direct IO 来模拟实现 PageCahce 的效果。

新的思路是:可以绕过操作系统,直接使用通过自定义 Cache + Direct IO 来实现更细致、自定义的管理内存、命中和换页等操作,从而针对我们的业务场景来优化缓存策略,从而实现比 PageCache 更好的效果。

Direct IO 可以通过 JNA/JNI 调用 Native 方法实来实现。GitHub 上有封装好了 Java JNA 库,实现了 Java 的 Direct IO,直接就可以使用。有兴趣的话,你可以去研究一下这个 GitHub 项目:github.com/smacke/jayd...

FileChannel 和 mmap

java.nio 包中的 FileChannel 属于 NIO 的一种;mmap 是调用 FileChannel.map() 实例出来的一种特殊读写文件的方式,被称为内存映射。

FileChannel 大多数时候是和 ByteBuffer 打交道的,你可以将 ByteBuffer 理解为一个 byte[] 的封装类。ByteBuffer 是在应用内存中的,它和硬盘之间还隔着一层 PageCache。

FileChannel 写的时候经历了应用内存 -> PageCache -> 磁盘三个步骤。

mmap 是一个把文件映射到内存的操作,因此可以像读写内存一样读写文件。它省去了用户空间到内核空间的数据复制过程,从而提高了读写性能。

mmap 在内存充足、数据文件较小且相对固定的场景下,性能比 FileChannel 高。但它有这样几个缺点:

  1. 使用时必须先指定好内存映射的大小,并且一次 Map 的大小限制在 1.5G 左右。
  2. 是由操作系统来刷盘的,手动刷盘时间不好掌握。
  3. 回收非常复杂,需要手动释放,并且代码和实现很复杂。

直接内存(堆外)和堆内内存

堆内内存就是指 JVM 堆内部的内存空间,堆外就是指除了 JVM 堆以外的内存空间。

关于堆内内存和堆外内存的选择,有下面五点建议:

  1. 当需要申请大块的内存时,堆内内存会受到限制,可以尝试分配堆外内存。

  2. 堆外内存适用于生命周期中等或较长的对象。

  3. 堆内内存刷盘的过程中,还需要复制一份到堆外内存,多了一步,会降低性能。

  4. 创建堆外内存的消耗要大于创建堆内内存的消耗,所以当分配了堆外内存之后,要尽可能复用它。

  5. 可以使用池化 + 堆外内存的组合方式。比如代码中如果需要频繁 new byte[],就可以研究一下 ThreadLocal<ByteBuffer> 和 ThreadLocal<byte[]> 的使用机制。


此文章为11月Day18学习笔记,内容来源于极客时间《深入拆解消息队列 47 讲》

相关推荐
獨枭12 分钟前
使用 163 邮箱实现 Spring Boot 邮箱验证码登录
java·spring boot·后端
维基框架18 分钟前
Spring Boot 封装 MinIO 工具
java·spring boot·后端
秋野酱18 分钟前
基于javaweb的SpringBoot酒店管理系统设计与实现(源码+文档+部署讲解)
java·spring boot·后端
☞无能盖世♛逞何英雄☜31 分钟前
Flask框架搭建
后端·python·flask
进击的雷神1 小时前
Perl语言深度考查:从文本处理到正则表达式的全面掌握
开发语言·后端·scala
进击的雷神1 小时前
Perl测试起步:从零到精通的完整指南
开发语言·后端·scala
豌豆花下猫2 小时前
Python 潮流周刊#102:微软裁员 Faster CPython 团队(摘要)
后端·python·ai
秋野酱2 小时前
基于javaweb的SpringBoot驾校预约学习系统设计与实现(源码+文档+部署讲解)
spring boot·后端·学习
北辰浮光2 小时前
[springboot]SSM日期数据转换易见问题
java·spring boot·后端
木梓辛铭2 小时前
Spring Cache的详细使用
java·后端·spring