软考高级第四版备考---第四十四天(数据工程--数据运维)

一、数据存储

1.1数据存储介质:

数据存储首先要解决的是存储介质的问题。存储介质是数据存储的载体,是数据存储的基础。存储介质的类型主要有磁带、光盘和磁盘三种

1.2存储管理:

  1. 资源调度管理
  2. 存储资源管理
  3. 负载均衡管理
  4. 安全管理:防止恶意用户攻击系统或窃取数据:扰乱服务器正常工作为目的,如拒绝服务器攻击Dos等;以入侵或破坏服务器为目的,如窃取数据、修改网页等

二、数据备份

数据备份结构:DAS备份结构、基于LAN的备份结构、LAN-FREE备份结构、SERVER-FREE备份结构

备份策略:完全备份、差分备份、增量备份

三、数据容灾

3.1根据容灾系统保护对象不同,容灾系统分为应用容灾和数据容灾两类。数据容灾是应用容灾的一个子集,也是应用容灾最根本的基础

3.2数据备份是数据容灾的基础

3.3衡量容灾系统有两个主要指标:PRO和RTO,其中RPO代表了当灾难发生时允许丢失的数据量;二RTO代表了系统恢复的时间

四、数据质量评价与控制

4.1数据质量描述:数据质量可以通过数据质量元素来描述,数据质量元素分为数据质量定量元素和数据质量非定量元素

4.2数据质量评价过程:数据质量评价过程是产生和报告数据质量的一系列步骤

4.3数据质量评价方法:直接评价法:利用数据相关信息,如数据只对数据源、采集方法等的描述推断或评估数据质量

4.4数据质量控制:依据建库流程可分为前期控制、过程控制、系统检测、精度评价

4.5数据清理:

数据库精简以出去重复记录,并使剩余部分转换成符合标准的过程

一般说来,数据清理主要包括数据分析、数据检测和数据修正三个步骤

相关推荐
一拳一个娘娘腔8 分钟前
【SRC漏洞挖掘系列】第15期:自动化与AI赋能 —— 打造你的专属“漏洞挖掘机”
运维·人工智能·自动化
老毛肚43 分钟前
Docker Desktop 介绍
运维·docker·容器
j_xxx404_43 分钟前
Linux 线程日志系统设计:从策略模式、RAII 到 pthread 线程安全与内核写入路径|附源码
linux·运维·服务器·开发语言·c++·人工智能·策略模式
学Linux的语莫1 小时前
deepagent知识
linux·运维·服务器
浮生若城1 小时前
Linux库制作与原理(1):静态库、动态库和ELF文件
linux·运维·服务器
STDD2 小时前
ATLAS MMO 专用服务器搭建教程:海盗生存 MMO 服务器开服指南
运维·服务器·php
ThinkPet2 小时前
记事-vue3项目部署Jenkins实现CICD流程
运维·nginx·jenkins·jenkinsfile·cicd流水线
j_xxx404_2 小时前
Linux 线程同步硬核解析:从条件变量、阻塞队列到信号量环形队列
linux·运维·服务器·c++·人工智能·ai·中间件
minji...2 小时前
Linux高级IO(五)epoll 的两种工作模式(LT/ET),多路转接之epoll版本的TCP服务器,对比 select/poll/epoll
linux·运维·服务器·epoll·epoll的工作模式·selectpollepoll·水平触发边缘触发
JP-Destiny2 小时前
docker报错-无法解析 registry-1.docker.io
运维·docker·容器