软考高级第四版备考---第四十四天(数据工程--数据运维)

一、数据存储

1.1数据存储介质:

数据存储首先要解决的是存储介质的问题。存储介质是数据存储的载体,是数据存储的基础。存储介质的类型主要有磁带、光盘和磁盘三种

1.2存储管理:

  1. 资源调度管理
  2. 存储资源管理
  3. 负载均衡管理
  4. 安全管理:防止恶意用户攻击系统或窃取数据:扰乱服务器正常工作为目的,如拒绝服务器攻击Dos等;以入侵或破坏服务器为目的,如窃取数据、修改网页等

二、数据备份

数据备份结构:DAS备份结构、基于LAN的备份结构、LAN-FREE备份结构、SERVER-FREE备份结构

备份策略:完全备份、差分备份、增量备份

三、数据容灾

3.1根据容灾系统保护对象不同,容灾系统分为应用容灾和数据容灾两类。数据容灾是应用容灾的一个子集,也是应用容灾最根本的基础

3.2数据备份是数据容灾的基础

3.3衡量容灾系统有两个主要指标:PRO和RTO,其中RPO代表了当灾难发生时允许丢失的数据量;二RTO代表了系统恢复的时间

四、数据质量评价与控制

4.1数据质量描述:数据质量可以通过数据质量元素来描述,数据质量元素分为数据质量定量元素和数据质量非定量元素

4.2数据质量评价过程:数据质量评价过程是产生和报告数据质量的一系列步骤

4.3数据质量评价方法:直接评价法:利用数据相关信息,如数据只对数据源、采集方法等的描述推断或评估数据质量

4.4数据质量控制:依据建库流程可分为前期控制、过程控制、系统检测、精度评价

4.5数据清理:

数据库精简以出去重复记录,并使剩余部分转换成符合标准的过程

一般说来,数据清理主要包括数据分析、数据检测和数据修正三个步骤

相关推荐
kcarly1 小时前
如何科学测算AI业务场景所需算力服务器?——以Qwen3 32B模型与海光K100为例
运维·服务器·人工智能
青芒亭1 小时前
泰山派RK3566编译命令
linux·运维·服务器
kaikaile19951 小时前
windows配置supervisor实现nginx自启
运维·windows·nginx
K·Herbert1 天前
最新CentOS 7 yum源失效的解决方案(2025年6月)
linux·运维·centos
别骂我h1 天前
部署KVM虚拟化平台
linux·运维·服务器
showmethetime1 天前
优化nginx参数(基本通用参数)
运维·nginx
老六ip加速器1 天前
获取ip地址安全吗?如何获取静态ip地址隔离ip
运维·网络·智能路由器
净心净意1 天前
浅谈DaemonSet
运维·jenkins
Apex Predator2 天前
jenkins流水线打包vue无权限
运维·jenkins
哲讯智能科技2 天前
苏州SAP代理商:哲讯科技助力企业数字化转型
大数据·运维·人工智能