小型公司机房运维如何管理

本人从业五年+,基本是中小型公司。经手的机房也基本是从0-1。今天浅谈一下如果管理小型公司的机房。

机房管理,一般分成以下几个方面:

1、环境管理:比如弱电、强点线路是否排列整齐;机柜门是否做到全部关闭;是否堆放了杂物以及其他易燃、腐蚀性等各类物质;

2、出入管理:包括设备、人2方面。人出入,要有完整的出入记录,并确定好是否需要他人陪同、以及由谁来陪同,避免误操作或破坏行为;设备的出入,要有相关流程。因为上设备是占用机房资源的,比如说机柜空间、电力、网络、制冷等。下架设备,也是要相关的流程,非常重要的一点,这涉及到了资产转移,所以一定要留痕;

3、设备管理:比如设备的日常维保、在保状态,供应商联系人、故障通知方(出了故障要通知谁)、合格证、操作说明、设备位置记录、设备登陆信息等等,也可以判断出设备是否需要备件等等。

4、安全管理:门禁的定期审计:对比门禁记录和纸质出入记录是否一致;机房内作业时软件的管理,是否正版、是否经过杀毒软件扫描。甚至安装一些检测设备:比如入侵检测(一般是红外感应人体的活动)、墙壁振动检测(来检测有人暴力破坏墙壁)、视频监控等,并且检测到异常检测行为要做到报警,金融级别机房甚至可以对接到警察。提高可用性的设备:UPS、空调、气体式消防等等。做机房巡检等。

根据以上几点,小机房容易出现什么问题呢:

1、环境乱:线路乱、乱拉线导致机柜门无法关闭;堆放杂物;

2、设备乱:同事张三半个月不来机房,就多了很多设备,自己都不认识了。时间长了,也不知道是做什么的,不敢关机,不敢碰它,担心出事故;

3、进机房,包括公司及第三方的人,随意操作,导致事故;

4、机房设备出问题,不知道找谁,比如说运营商线路通讯中断,不知如何联系供应商。

这些,都是非常容易出现的问题,那么如何避免呢,可以从以下几个方面做:

1、先要有制度,规定以上所有,获得管理层的同意和支持;

2、控制好门禁,确保门禁权限在机房管理员手中。这样,机房内的设备、人员出入都需要经过机房管理员同意,那么机房管理员可以依照制度严格把控;

3、做好台账管理:一方面是设备登陆信息;另外一方面是维保、供应商联系信息、谁受影响等。确保设备调试、出现故障时都知道要通知哪些人。很多公司这些信息就掌握在一个人手里,这个人休假了,公司有事还是要找这个人,这个就是公司没有做好工作信息的沉淀;

4、有应急响应规范,这一点很重要,对一线工作人员意义非常大。有了应急响应规范,那么机房出事情时,值班人才可以知道如何去处理,去响应这个故障、采取哪些措施、去通知哪些人。避免自己擅作主张:比如不处理、拖慢处理、想当然的盲目处理导致更大事故。

5、如果机房里的信息系统非常重要,一定要做好安全和数据备份的事情。比如防火墙、安全态势感知、定期的数据备份等。

再简单聊下机房建设,机房建设的标准,往往和其建设的需求、或者机房内运行的业务相关,一般参考以下几方面:

1、业务需求:比如是只有办公网络、还是有业务机器;

2、企业上是否有相关要求,去安装相关等级机房标准去建设(比如A类、B类);

3、上级单位或监管行业的要求;

4、建设成本以及后期的运维成本。

机房建设时,需要考虑的点及设备介绍:

1、强点设计:是否需要冗余的电路(比如来自2个不同的电力公司),是否需要安装UPS以及对应的电力供应时间。并考虑到未来扩展;

2、弱电线路的设计,以及要考虑到未来扩展性;

3、空调:管路的设计,必须保证不能漏水,这一点非常重要。是否考虑空调主备;

4、气体式消防;

5、防盗报警检测:比如区域入侵、未授权的开门、墙壁振动检测等。