软考高级第四版备考---第四十四天(数据工程--数据运维)

一、数据存储

1.1数据存储介质:

数据存储首先要解决的是存储介质的问题。存储介质是数据存储的载体,是数据存储的基础。存储介质的类型主要有磁带、光盘和磁盘三种

1.2存储管理:

  1. 资源调度管理
  2. 存储资源管理
  3. 负载均衡管理
  4. 安全管理:防止恶意用户攻击系统或窃取数据:扰乱服务器正常工作为目的,如拒绝服务器攻击Dos等;以入侵或破坏服务器为目的,如窃取数据、修改网页等

二、数据备份

数据备份结构:DAS备份结构、基于LAN的备份结构、LAN-FREE备份结构、SERVER-FREE备份结构

备份策略:完全备份、差分备份、增量备份

三、数据容灾

3.1根据容灾系统保护对象不同,容灾系统分为应用容灾和数据容灾两类。数据容灾是应用容灾的一个子集,也是应用容灾最根本的基础

3.2数据备份是数据容灾的基础

3.3衡量容灾系统有两个主要指标:PRO和RTO,其中RPO代表了当灾难发生时允许丢失的数据量;二RTO代表了系统恢复的时间

四、数据质量评价与控制

4.1数据质量描述:数据质量可以通过数据质量元素来描述,数据质量元素分为数据质量定量元素和数据质量非定量元素

4.2数据质量评价过程:数据质量评价过程是产生和报告数据质量的一系列步骤

4.3数据质量评价方法:直接评价法:利用数据相关信息,如数据只对数据源、采集方法等的描述推断或评估数据质量

4.4数据质量控制:依据建库流程可分为前期控制、过程控制、系统检测、精度评价

4.5数据清理:

数据库精简以出去重复记录,并使剩余部分转换成符合标准的过程

一般说来,数据清理主要包括数据分析、数据检测和数据修正三个步骤

相关推荐
广东大榕树信息科技有限公司13 分钟前
如何运用国产信创动环监控系统来保障生产安全与效率提升?
运维·网络·物联网·国产动环监控系统·动环监控系统
野猪佩挤15 分钟前
jenkins-ci/cd yaml模版配置
运维·ci/cd·jenkins
斯普信云原生组21 分钟前
开源软件日志统一管理方案-Filebeat
运维·jenkins
飞Link40 分钟前
【Anaconda】Linux(CentOS7)下安装Anaconda教程
linux·运维·python
Ama_tor1 小时前
docker|F盘安装の1键部署软件及数据储存+2个保姆级运行实例
运维·docker·容器
@时间旅行者@1 小时前
LINUX离线安装postgres,rpm方式安装
linux·运维·服务器·postgresql·离线安装
whlqjn_12111 小时前
Ubuntu 20.04图形界面卸载
linux·运维·ubuntu
杨云龙UP1 小时前
SQL Server 2016通过SSMS(SQL Server Management Studio)图形界面完成创建用户和授权_20251230
运维·服务器·数据库
斯普信云原生组1 小时前
Linux 平台 Redis Insight 安装卸载与常见问题
linux·运维·redis
qq_416276421 小时前
linux bashrc写各种离线库路径并验证
linux·运维·服务器