软考高级第四版备考---第四十四天(数据工程--数据运维)

一、数据存储

1.1数据存储介质:

数据存储首先要解决的是存储介质的问题。存储介质是数据存储的载体,是数据存储的基础。存储介质的类型主要有磁带、光盘和磁盘三种

1.2存储管理:

  1. 资源调度管理
  2. 存储资源管理
  3. 负载均衡管理
  4. 安全管理:防止恶意用户攻击系统或窃取数据:扰乱服务器正常工作为目的,如拒绝服务器攻击Dos等;以入侵或破坏服务器为目的,如窃取数据、修改网页等

二、数据备份

数据备份结构:DAS备份结构、基于LAN的备份结构、LAN-FREE备份结构、SERVER-FREE备份结构

备份策略:完全备份、差分备份、增量备份

三、数据容灾

3.1根据容灾系统保护对象不同,容灾系统分为应用容灾和数据容灾两类。数据容灾是应用容灾的一个子集,也是应用容灾最根本的基础

3.2数据备份是数据容灾的基础

3.3衡量容灾系统有两个主要指标:PRO和RTO,其中RPO代表了当灾难发生时允许丢失的数据量;二RTO代表了系统恢复的时间

四、数据质量评价与控制

4.1数据质量描述:数据质量可以通过数据质量元素来描述,数据质量元素分为数据质量定量元素和数据质量非定量元素

4.2数据质量评价过程:数据质量评价过程是产生和报告数据质量的一系列步骤

4.3数据质量评价方法:直接评价法:利用数据相关信息,如数据只对数据源、采集方法等的描述推断或评估数据质量

4.4数据质量控制:依据建库流程可分为前期控制、过程控制、系统检测、精度评价

4.5数据清理:

数据库精简以出去重复记录,并使剩余部分转换成符合标准的过程

一般说来,数据清理主要包括数据分析、数据检测和数据修正三个步骤

相关推荐
007php0074 小时前
linux服务器上CentOS的yum和Ubuntu包管理工具apt区别与使用实战
linux·运维·服务器·ubuntu·centos·php·ai编程
人类群星闪耀时4 小时前
深度学习在灾难恢复中的作用:智能运维的新时代
运维·人工智能·深度学习
djykkkkkk4 小时前
ubuntu编译遇到的问题
linux·运维·ubuntu
LinkTime_Cloud4 小时前
GitLab 将停止为中国区用户提供服务,60天迁移期如何应对? | LeetTalk Daily
大数据·运维·gitlab
qq_429856574 小时前
linux 查看服务是否开机自启动
linux·运维·服务器
Smile丶凉轩5 小时前
Docker核心技术和实现原理
运维·docker·容器
清风细雨_林木木5 小时前
Docker使用——国内Docker的安装办法
运维·docker·容器
运维&陈同学5 小时前
【Kibana01】企业级日志分析系统ELK之Kibana的安装与介绍
运维·后端·elk·elasticsearch·云原生·自动化·kibana·日志收集
dessler6 小时前
Docker-Dockerfile讲解(三)
linux·运维·docker
cnsinda_sdc6 小时前
信创数据防泄漏中信创沙箱是什么样的安全方案
运维·网络·安全·源代码管理·源代码防泄密·源代码加密