中心机房日常巡检制度及操作规范
一、巡检时间
巡检时间:日常巡检在每周一上午进行。
二、巡检目的
进行机房网络设备的检查;进行机房网络状态的检测。及时查找、发现网络及信息系统设备隐患,排除故障。
三、巡检流程
1.巡检期间,进行状态检查,若发现问题,如计算机机房物理环境异常、设备状态异常、网络或应用系统故障,应立即按操作规程执行进行恢复操作。
(1)电源、UPS:检查机房供电状况,UPS工作情况、指示状态。UPS每两个月充放电一次。
(2)服务器:检查服务器是否宕机,服务器硬盘灯指示是否正常。
(3)机房环境:检查机房空调工作状态,机房温度,湿度等。
(4)网络设备:检查网络设备,包括交换机、路由器、防火墙等及其它设备工作状态。
(5)基础链路:检查内外网络通道状态,包括教育网和电信网的网络链路状态。
(6)短信通道:检查短信系统通信是否畅通。
2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知相关领导,由相关领导协调资源进行故障处理。
四、机房现场管理要求
1.除机房的工作人员外,其他工作人员进出机房,需经信息中心批准后方可进入,同时机房人员要在现场,检查监督其人员工作。
2. 寒暑假期间,如遇紧急情况,该时段值班人员应第一时间到达现场,确保假期网络设备正常运行。
五、常见异常现象及处理方法
序号 |
项目 |
异常现象 |
处理方法 |
1 |
报警系统 |
温湿度报警 |
①做好通风降温应急措施。 ②调节空调湿度,使其符合标准。 |
烟感报警 |
①检查是否有烟火产生,有则立即处理;若无则做好记录,联系厂商检查探头状态。 |
2 |
空调系统 |
空调停止运行 |
①检查空调的电源连接。 ②做好空调应急处理,联系厂商进行检修。 |
空调制冷不正常 |
①检查空调运行状态。 ②联系厂商进行检修。 |
水泄漏 |
①清理水渍,检查空调运行状态。 ②联系厂商进行检修。 |
3 |
供配电系统 |
UPS参数显示异常 |
①检查UPS主机工作状态是否不正常,如确认无问题,应切换为正常状态。 |
UPS存在异常声响 |
①检查UPS面板报警提示。 ②联系厂商进行处理。 |
4 |
消防系统 |
消防设备外观破损 |
①应及时报告并登记,并做好相关的处理计划。 |
5 |
服务器 |
指示灯告警(一般为红色或黄色) |
①检查并确定服务器哪部分设备引起指示灯告警。 |
系统日志异常 |
①分析日志事件,确定事件原因,并进行相关处理。 |
6 |
存储备份系统 |
可用空间不足 |
①查看当前空间与设计空间是否相符,清理存储空间 |
存储执行等告警 |
①检查存储硬盘的工作状态,是否存在坏盘。 ②检查存储系统其它部件是否处于正常状态。 |
7 |
网络设备 |
网络指示灯为红色 |
①检查网络设备工作状态是否处于正常状态。 |
网络流量异常 |
①检查是否存在ARP攻击、网络设备中毒现象或是否存在环路现象。 |
网络日志异常 |
①分析异常原因,如网络攻击、病毒情况等。 |
六、常用联系人
电信网:10000或 张工 17737511010
教育网:66995447 或 董峰 18537107687
机房动环:张工 15686049336
机房其他:樊二伟 15003800216