说下数据存储

数据落盘是很重要的一个环节。数据库在落盘前都是要先写到日志文件的,防止文件丢失和系统崩溃恢复的。硬盘有个问题那就是慢,所以存储的数据提取一般都是要考虑这个问题的,一般有两个部分一个就是减少读取也就是减少IO,另一个就是需要一些数据结构的设计对数据提取和写入效率有一些保障的。

数据库有个WAL的机制

任何对数据文件的修改,必须先写入日志(log),然后才能写入数据文件(data file)。先写日志是因为担心真正写数据的时候发生崩溃可以补救,内存的数据又没法落地会丢失的。

简单的说下数据的文件

  • 因为从系统到硬盘每层都是缓存的。
  • 还有是写入的数据要读取是要序列化和反序列化的,最简单的比如写入一个文本的文件,在把文件的内容读取出来。但是存储数据肯定不能用这个搞法的写的都是字节码反解析出对应的数据。

  • 还有个问题是什么时候触发这个写盘的动作。批量还好;如果性能有要求的?有个阈值控制写盘的动作。

  • 还有个问题读写盘的时候顺序读写性能是最高的,这里就有个划分的问题

  • 还有就是后期有个合并得操作提高利用率

  • 还有个再提下了分布式文件系统数据分散开来。数据分片、冗余备份?

简单来个demo

因为写盘解析很麻烦这里就说个例子,不实操了。

定义一个简单的表结构

ini 复制代码
自动写入添加一个字段 _status 1个字节
表结构:id 32位
       name 100位
       msg  200位
一条数据最大的位数 1+32+100+200=333个字节       

划分

erlang 复制代码
|数据1|数据2|......
因为有些字段是变长的修改下结构,怎么办?
|数据长度-数据1|数据长度-数据2|......
这里面还有个问题就是你会发现数据提取的时候必须整个块一起提取才能找到数据,那再开辟一块地方记录索引数据
|主键-数据1位置|主键-数据2位置|......
这样已处理完后有个问题数据修改还像修改不了了
->打个删除标记->重新写条数据进去

划分分块

  • 整个文件我们可以拆分成一个一个的小块进行数据处理

简单的安全

为了方式文件的损坏这里可以再数据写入后主动添加有些校验数据CRC、MD5、sha。

数据分片?

数据拆分不同地方+拼接? 另存一份备份?完整的一个备份、切片数据有备份拼接 这里面有个问题份的数据量怎么控制?

相关推荐
大阿明6 小时前
Spring Boot(快速上手)
java·spring boot·后端
哆啦A梦15886 小时前
Springboot整合MyBatis实现数据库操作
数据库·spring boot·mybatis
Zzzzmo_7 小时前
【MySQL】JDBC(含settings.xml文件配置/配置国内镜像以及pom.xml文件修改)
数据库·mysql
墨香幽梦客7 小时前
API集成技术规范:RESTful与GraphQL在企业系统对接中的应用对比
后端·restful·graphql
FirstFrost --sy8 小时前
MySQL内置函数
数据库·mysql
2401_879693878 小时前
将Python Web应用部署到服务器(Docker + Nginx)
jvm·数据库·python
reembarkation8 小时前
光标在a-select,鼠标已经移出,下拉框跟随页面滚动
java·数据库·sql
eggwyw8 小时前
MySQL-练习-数据汇总-CASE WHEN
数据库·mysql
星轨zb8 小时前
通过实际demo掌握SpringSecurity+MP中的基本框架搭建
数据库·spring boot·spring security·mp
刀法如飞8 小时前
AI编程时代,为什么35岁以上程序员会更吃香?
人工智能·后端·ai编程