2.2 信息系统运维的组织
信息系统运维的任务
- 数据资源管理
- 数据收集、数据校验、数据录入、数据处理
- 软件资源管理
- 采购、保存、相关文档保管、分发、安装、支持、评价、培训
- 硬件资源管理
- 检查、维护、故障处理、更新、修复、扩充
- 系统安全管理
- 可用性、完整性、保密性、可控性、可靠性
- 信息服务需求管理
信息系统运行日志记录、检查及评价
运行日志记录
工作数量、工作效率、质量、故障和维护情况
- 系统评价需要考虑的方面
- 系统是否达到预定目标,目标是否需要修改
- 系统的适应性、安全性评价
- 系统的社会经济效益评价
流程视角下的信息系统运维管理职责
信息系统运维流程 | 人员 | 职责 |
---|---|---|
事件管理 | 技术和应用管理人员 | 指定、设计、确保 |
事件管理 | IT运维管理人员 | 监控响应创建 |
事故管理 | 事故管理者 | 监控管理开发生成 |
事故管理 | 一二三线支持者 | 执行 |
问题管理 | 问题管理者 | 组织联络 |
问题管理 | 问题解决小组 | 指定解决方案 |
配置管理 | 配置管理者 | 负责制定评估 |
配置管理 | 配置管理实施人员 | 实施 |
变更管理 | 变更管理者 | 接受变更、评估变更 |
发布管理 | 发布管理者 | 更新 |
发布管理 | 发布团队 | 设计构建配置 |
知识管理 | 知识提交人员 | 提交归类 |
知识管理 | 知识管理者 | 识别、建立、维护 |
知识管理 | 知识审核人员 | 审核 |
对象视角下的信息系统运维管理职责
对象 | 人员 | 职责 |
---|---|---|
系统管理 | 系统主管人员 | 组织各方面人员协调一致地完成系统所担负的信息处理任务 |
数据 | 数据收集人员 | 及时、准确、完整地收集各类数据,并按照要求把它们送到专职工作人员手中 |
数据 | 数据效验人员 | 保证送到录入人员手中的数据从逻辑上讲是正确的 |
数据 | 数据录入人员 | 把数据准确地录入计算机 |
软硬件 | 硬件和软件操作人员 | 按照系统规定的工作规程进行日常的运行管理 |
软硬件 | 程序员 | 在系统主管人员的组织之下,为满足使用者的临时要求编写所需要的程序 |
信息系统运维人员的管理(内容)
- 明确的规定每个人的工作任务及职权范围,尽可能确切地规定出各类人员在各项业务活动中应负的责任、应做的事情、办事的方式、工作的次序。既要有
明确的授权
- 对于每个工作岗位的工作要有定期的检查及评价,为此,对每种工作都要有一定的评价指标。即必须有
检查和评价
。 - 要在工作中对工作人员
进行培训
,以便使他们的工作能力不断提高,工作质量不断改善,从而提高整个系统的效率。
信息系统运维人员的管理(责任分配和绩效评定)
- 系统主管人员的责任:组织各方面人员协调一致的完成系统所担负的信息处理任务、掌握系统的全局,保证系统结构的完整,确定系统改善或扩充的方向,并按此方向组织系统的修改及扩充工作。评价标准:整个应用系统在管理中发挥的作用及其效益。
- 数据收集人员的责任:及时、准确、完整的收集各类数据,并通过所要求的途径把他们送到专职人员的手中。
- 数据校检人员的责任:保证送到录入人员手中的数据从逻辑上讲是正确的,即保证进入信息系统的数据正确的反映客观事实。
- 数据录入人员的任务:把数据准确的录入计算机
- 硬件和软件操作人员的任务:按照系统规定的工作流程进行日常的运行管理。
- 程序员的任务:在系统主管人员的组织之下,完成系统的修改和扩充,为满足使用者的临时要求编写所需要的程序。
信息系统运维人员的管理(意识)
- 服务意识
- 学习意识
- 创新意识
- 专业意识
- 主动意识
- 安全意识
- 团队意识
信息系统运行管理制度的建立与实施
- 设立网络中心的目的
- 给网络设备和中心服务器创造一个良好的运行环境,保证信息系统的安全运行
- 防止各种非法人员进入,保护网络设备、服务器内的程序与数据安全
- 网路中心管理机房的主要内容
- 有权进入网络中心人员的资格审查
- 网络中心内的各种环境应达到相应要求
- 与数据安全相关的环境要求
- 网络中心明令禁止的活动或行为
- 设备和材料进出网络中心的管理要求
- 保持机房和各种设备的整洁
- 管理制度的主要内容
- 操作人员的操作行为
- 出入机房人员的规定
- 机房的店里供应
- 机房的温度、湿度、清洁度
- 机房安全防火等
- 为防止计算机病毒感染和传染,建立完善的计算机病毒预防和处理机制
- 对非热拨插设备,禁止在带电状态下拔、插机器部件和各电线、电缆
- 专用机房由专人负责管理
- 运行日记的内容
- 时间
- 操作人
- 运行情况
- 异常情况
发生时间、现象、处理人、处理过程、处理记录文件名、在场人员等。
- 值班人签字
- 负责人签字
信息系统的运维模式
- 自主运维模式:是指企业自行负责对拥有的所有IT资源的运维工作
- 完全外包运维模式:是指企业通过与其他单位签署运维外包协议,将所拥有的全部IT资源的运维工作外包给其他单位。
- 混合运维模式:是指企业对所拥有的一部分IT资源自行运维;同时,通过与其他单位签署运维外包协议,将所拥有的另一部分IT资源的运维工作外包给其他单位。
企业通过混合运维模式能够充分发挥自主运维和外包运维的优势。但是,由于存在两种运维人员,也增加了运维工作的复杂度,延长了运维流程
。
考法1:概念
采用(D)时,增加了运维工作的复杂度,延长了运维的流程。
A.自主运维模式 B.完全外包运维模式
C.代维模式 D.混合运维模式
系统运行的文档管理
- 信息系统运行文档管理的意义
- 良好的文档管理是系统工作连续进行的保障
- 良好的文档管理是信息系统维护的保障
- 理解别人精心设计的程序很困难,文档不全很难
- 当要求对系统进行维护时,不能依赖系统开发人员
- 信息系统是一个非常庞大的系统,了解、维护难
- 良好的文档管理是保证系统内数据信息安全的关键环节
- 良好的文档管理是系统各种信息得以充分利用,更好的为管理服务的保证
- 信息系统运行文档管理的任务
- 监督、保证按要求生成各种文档
- 保证各种文档的安全与保密
- 保证各种文档得到合理、有效的利用
- 信息系统运行的文档管理制度
- 信息系统运行文档包括计算机打印输出的各种报告、报表、凭证等,存有数据的磁性介质及其他介质,信息系统开发的全套文档资料。
- 文档管理制度的内容:
- 存档的手续
- 各种安全保证措施
- 文档管理员的职责与权限
- 文档的分类管理办法
- 文档使用的各种审批手续
- 各类文档的保存期限及销毁手续
- 文档的保密规定
系统运行的故障管理
故障种类:
硬件故障
软件故障
网络故障
人为故障
由于不可抗力和自然灾害造成的故障
故障预防策略
故障约束
:就是在信息系统中通过预防性约束措施,防止错误发生或在检测出来之前错误的影响范围继续扩大。故障监测
:就是对系统的信息处理过程和运行状态进行监控和检测,使已经发生的错误在一定的范围或步骤之内就能被发现出来。故障恢复
:就是将系统从错误状态恢复到某一个已知的正确状态,并为了减少数据损失而尽可能接近发生系统奔溃的时刻。
考法1:概念
为了提高系统可靠性,预防系统故障发生,需制定的故障预防策略主要有(C)、故障检测、故障恢复。
A.故障评估 B.故障分类 C.故障约束 D.故障预警
软件故障
- 系统文件丢失
- 添加/卸载 复制
- 文件版本不匹配
- 同一个DLL文件不同版本支持
- 应用程序非法操作
- 两个程序同时使用同一段内存
- 蓝屏错误信息
- 与系统发生冲突
- 系统资源耗尽
- 计算机病毒破坏
硬件故障
- 电源电压不稳定或经常断电引起的故障
- 部件之间接触不良引起的故障
- 由CMOS引起的故障
- 硬件本身的故障
硬件故障解决方法:
- 直接观察法
- 拔插法
- 交换法
- 比较法
- 原理分析法
- 高级诊断程序检测法
- 测量法
- 综合判断法
网路故障
硬件故障
- 网络设备故障
- 网络设备冲突
- 设备驱动程序问题
软件设置故障
- 网络协议配置问题
- 服务安装的问题
- 安装相应的网络用户
- 网络标识的设置问题
- 网络应用中的其他故障
网络故障排除顺序与解决方法
咨询 询问 收集整理分类 分析 故障点
服务器硬盘故障的解决方案
磁盘冗余阵列(RAID)
存储子系统
虚拟存储环境
- 存储子系统可以根据用户的实际数据量和实际配备的物理硬盘空间。自动选择一种最佳的RAID组合方式进行配置。
- 日后随数据量的增加,可对RAID设置自动优化
- 利用虚拟技术,可将任意大小的物理硬盘先分割成若干细小的部分,然后针对这些细小的部分进行优化RAID组合,得到精细、灵活的容错和存储性能。
服务器系统部件故障的解决方案
- 采用全硬件冗余的主机硬件系统
- 采用多机切换系统
- 主机集中存放,双主机连接同一个存储子系统
- 主机异地存放,双主机分别连接一个存储子系统
- 其他灵活的设计方案
信息系统容灾的解决方案
- 企业业务数据必须存储在不同地域。
- 在不同地域之间必须建立稳定、冗余的高速网络连接,以保证其网络的可靠性
故障信息搜索与记录
- 故障时间信息
- 故障现象信息
- 故障部件信息
- 故障性质信息,即种类
- 故障处理信息
故障分析
- 根据故障的表征,分清故障的类型和性质,找出故障的根源
- 通过对统计资料的分析,获取有价值的信息
故障报告
按规定程序报主管部门,以便派人处理
硬件故障----设备厂商
软件故障----软件厂商
网路故障----网络服务商
以得到技术支持