软考高级第四版备考---第四十四天(数据工程--数据运维)

一、数据存储

1.1数据存储介质:

数据存储首先要解决的是存储介质的问题。存储介质是数据存储的载体,是数据存储的基础。存储介质的类型主要有磁带、光盘和磁盘三种

1.2存储管理:

  1. 资源调度管理
  2. 存储资源管理
  3. 负载均衡管理
  4. 安全管理:防止恶意用户攻击系统或窃取数据:扰乱服务器正常工作为目的,如拒绝服务器攻击Dos等;以入侵或破坏服务器为目的,如窃取数据、修改网页等

二、数据备份

数据备份结构:DAS备份结构、基于LAN的备份结构、LAN-FREE备份结构、SERVER-FREE备份结构

备份策略:完全备份、差分备份、增量备份

三、数据容灾

3.1根据容灾系统保护对象不同,容灾系统分为应用容灾和数据容灾两类。数据容灾是应用容灾的一个子集,也是应用容灾最根本的基础

3.2数据备份是数据容灾的基础

3.3衡量容灾系统有两个主要指标:PRO和RTO,其中RPO代表了当灾难发生时允许丢失的数据量;二RTO代表了系统恢复的时间

四、数据质量评价与控制

4.1数据质量描述:数据质量可以通过数据质量元素来描述,数据质量元素分为数据质量定量元素和数据质量非定量元素

4.2数据质量评价过程:数据质量评价过程是产生和报告数据质量的一系列步骤

4.3数据质量评价方法:直接评价法:利用数据相关信息,如数据只对数据源、采集方法等的描述推断或评估数据质量

4.4数据质量控制:依据建库流程可分为前期控制、过程控制、系统检测、精度评价

4.5数据清理:

数据库精简以出去重复记录,并使剩余部分转换成符合标准的过程

一般说来,数据清理主要包括数据分析、数据检测和数据修正三个步骤

相关推荐
正经教主6 小时前
【问题】解决docker的方式安装n8n,找不到docker.n8n.io/n8nio/n8n:latest镜像的问题
运维·docker·容器·n8n
唯独失去了从容7 小时前
WebRTC服务器Coturn服务器中的通信协议
运维·服务器·webrtc
joker_zsl8 小时前
docker的安装和简单使用(ubuntu环境)
运维·docker·容器
Run1.8 小时前
深入解析 Linux 中动静态库的加载机制:从原理到实践
linux·运维·服务器
VI8664956I268 小时前
全链路自动化AIGC内容工厂:构建企业级智能内容生产系统
运维·自动化·aigc
264玫瑰资源库9 小时前
斗鱼娱乐电玩平台源码搭建实录
运维·服务器·游戏·娱乐
Jogging-Snail10 小时前
从零开始掌握Linux数据流:管道与重定向完全指南
linux·运维·管道·重定向·linux 数据流·管道原理
niuTaylor10 小时前
Linux驱动开发快速上手指南:从理论到实战
linux·运维·开发语言·驱动开发·c#
fxshy11 小时前
ai聊天流式响应,阻塞式和流式响应 nginx遇到的坑
运维·javascript·nginx
mit6.82411 小时前
[OS_8] 终端和 UNIX Shell | 会话和进程组 | sigaction | dash
运维·服务器