第一篇:核心机房电力中断不间断电源系统应急预案
核心机房电力中断不间断电源系统应急预案
核心机房电力的保障一直是维护体系的头等重要事项,通过实施应急发电演练,建立了可靠的应急预案机制,最大限度的降低电源中断对网络传输质量的影响。现分享核心机房电源中断应急预案,希望分公司尽快建立一套统一指挥、职责明确、反应迅速、处置有力的机房安全保障机制。组织架构:
责任领导、工程维护、网络监控、网络运维、质量管理等相关人员。机房电源系统说明:
1.机房电力是两路三相四线制供电,进线线缆规格为:RVV50*4+16*1铜芯护套线。2.机房电源系统采用三级防雷系统,三级防雷分别位于电源进线端、UPS输入前端。3.机房现有两台60KVA-UPS电源,均处于正常运行状态。4.机房现有设备机柜已编号,均通过UPS电源和市电供电,每个机柜有独立的20A空气开关。空调、墙壁插座开关、应急灯、照明等都是单独空开接市电。5.运行中的UPS电源所带负荷,在逆变运行状态下能正常工作约4小时(已经过UPS放电测试)。
一.核心机房电源中断预案 1.在接到停电通知的情况下:
1)计划性停电通知要确保综合部、工维机房管理部对口人接到通知(提前将对口联系人备案在物业处),机房管理员接到计划停电通知后,升级到调度中心进行信息发送,同步进行邮件通知相应应急小组成员。并与负责组长及责任领导电话告知,确保已经接收到本次停电的时间及可能发生的情况。
2)维部进行发电应急预案小组成员通知,提前做好机房发电预案要求的准备工作,将相应的发电机、连接线、人员安排到位,各司其职,随时待命现场,做发电准备工作。确保停电时刻的电力安全及机房用电的保障措施,提前调度安排好相应人员做好保障用电的措施。3)计划停电时间开始后,马上启动应急发电操作,按照机房发电操作步骤实施阶梯供电的步骤,恢复市电保障。并进行现场值守及设备工作确认,确保全部正常后电话告知调度中心及维护体系领导。
2.在没有接到任何通知,突然发生停电的情况下:
确认停电线路,停电时刻,停电时间等要素,启动核心机房发电应急预案。1)值班网管工作流程:
⑴值班网管监控到核心机房停电,第一时间告知工维部、网络部、运维部应急小组组长。信息传达到工维部机房管理员(一主一备),告知停电开始时间。
要求在停电5分钟内将消息传达到调度中心,各应急小组组长。如无法联系上,进行升级到责任领导-工维部经理经理处。⑵网管将停电信息电话传达后,进行调度派单,确保全部的应急小组成员都收到本次故障停电的信息。然后进行机房中设备的检查,包括:UPS设备主机、各核心设备、汇聚设备、服务器、语音系统等。检查是否受影响。同时启动机房降温措施(降温方案:初步为加装抽排风设备、增加大风扇排风形成热量流动降温)
⑶实时监控设备及UPS工作情况,包括:电量下降情况,设备工作正常情况,每15分钟通报一次电量情况。
2)运维部应急工作流程:
⑴运维应急同事接到故障通告后,第一时间往停电现场赶,到现场配合网管/工维部门进行设备仪器的检查、客服语音系统的保障,应急发电的协助。⑵现场配合进行机房降温散热措施实施,实时检查网络设备的工作情况。3)运营质量管理应急工作流程:
⑴调度中心值班人员接到网管监控调度信息后,第一时间将故障信息记录并发故障通告到相关应急成员,并电话通知各应急小组组长是否知悉。
⑵进行客服调度系统的设备工作运行系统检查,特别语音系统级坐席电脑,是否有问题,如发现工作系统有异常,及时与运维应急小组成员沟通,进行检查处理。⑶实时关注故障工单流程进度登记,配合应急小组进行人员调度通告。4)工维部应急工作流程:
⑴机房管理员第一时间往停电现场赶,同时进行电话沟通供电公司、物业方等,咨询停电原因,是属于计划性还是突发性停电,预计停电时长,将咨询清楚的结果反馈到应急小组成员中,电话联系物业沟通好需要发电需求申请。
⑵工维应急小组组长接到时间后第一时间往停电现场赶,同时进行发电应急小组成员调度,安排第一时间到场工作开展,并升级通报告知主管领导,对口集团维护中心上报信息。⑶工维应急小组成员接到停电时间后第一时间往停电现场赶,要求30分钟内必须到场(住机房附近的人员往现场去,较远同事可以进行打车往现场去),先行到处同事配合网管、运维同事启动做好应急发电前的准备:连接线布放、接续、发电机发电前检测油/电/水路检查,确保正常。确保一切就绪后,确认可以进行发电操作后,按照发电操作流程进行发电恢复市电。
⑷网管将监控到停电的相应信息及级别同步发送到运营质量管理部调度岗,由调度岗将相应信息进行工维、运维、网络关联同事进行信息告知,同时报工维主管领导知悉。5)应急机房发电操作流程:
⑴机房用电系统包括四方面:空调制冷、主/备UPS主机、照明系统、客服调度系统。⑵发电前考虑4方面系统设备用电功率情况,为保障发电机带动的正常,不能进行同步供电,要区分优先恢复的步骤实施,确认发电机的工作正常。在发电前将需要供电的“空调制冷、主/备UPS主机、照明系统、客服调度系统”的市电输入主开关关闭。防止同步启动时发电机的无法供电保证。
⑶启动发电机,检测发电输出电流通断,待发电机运行稳定后。第一步启动空调制冷系统的市电输入开关,运维应急小组成员重新启动空调主机(空调因为市电恢复后需要重新启动)观察空调制冷工作是否正常。
第二步启动主UPS设备的市电输入开关,观察发电机运行稳定情况,主UPS主机工作稳定情况,网络设备的工作正常与否。
第三步启动客服系统的市电输入开关,包括(客服坐席电脑、UPS设备、空调制冷等),观察发电机运行稳定情况,设备恢复工作情况。
第四步启动备UPS设备、市电照明的市电输入开关,观察发电机运行稳定情况,备UPS主机工作稳定情况,网络设备的工作正常与否。
⑷发电机启动,市电输入正常后,网管将降温系统的抽排风设备关闭,与运维同事进行所有设备的运行进行全面的检查,确保设备已经是运行正常。
⑸发电机发起市电正常后,工维应急小组安排专人现场值守,及时关注发电机油量情况,同时与油品供应商确认油品配送要求及时间要求,并实时与供电部门确认市电恢复时间。6)停电过程中突发事项预防:
⑴网管在停电时进行机房确认运行中的UPS工作组、设备组工作状态。主/备UPS工作切换是否正常,在市电中断时UPS是否已经开始进行供电保护。⑵值班网管对机房中的所有设备进行全面检查,确保所有的设备已经是有主备供电,市电中断后UPS已经正常保障设备工作。同时对机房的温度进行观察,温度是否突然升高。⑶停电后,UPS处于逆变工作状态,当班人员要每隔15分钟观察一次UPS的蓄电池容量、带负荷情况、机房环境温度,尽量使蓄电池容量大于60%,带负荷小于85%(因为已经有自购发电机应急,尽快要求短时间发起电,减少UPS的放电过度)。
⑷发现机房环境温度大于26℃。当以上指标不能保证时,要及时向机房管理员汇报,同时上报责任领导知悉,网管预案小组成员经过慎重讨论,适时采取关闭不必要网络的网络设备、加强通风降温等措施尽量延长关键设备运行时间。二.核心机房应急发电流程图及岗位责任
三.应急发电机的油品保障措施
发电机正常启动后,需要做到油品及时供应,具体保障措施方案为: 1.确认多家供应商进行油品供应,签署油品供应协议,确保油品的供应充足。2.油品的供应以应急小组成员通知后开始准备,协议要求是6小时内送货到场。
3.只要进行发电一小时以上,则必须在停止发电后补充满油品,确保发电机随时都是满配油品保障中。
4.油品的零购是属于公安部门的监管,所以分公司提前将资料向公安部门报备,在公司因为特殊原因有零购油品需求,在公安部门已经有分公司备案资料下,每次使用零购油品进行公安部门盖章申请。可以随时进行购买。四.恢复交流电后的处理措施
1.打开电力室和网络机房空调市电开关,并将调节温度设定为20℃。首先恢复机房制冷系统的正常工作。
2.等供电稳定后(一般在恢复市电10分钟后),闭合主/备UPS设备空气开关,恢复给主/备UPS交流供电。观察并确认UPS转换为交流稳压和浮充状态。
3.闭合客服系统的主空气开关,恢复客服系统的交流供电,并观察设备工作运行情况。4.观察10分钟后,确保所有网络及设备、UPS设备组工作稳定后,将发电机停止发电,并将情况报告给调度及主管领导。
5.应急小组将发电的物资进行收拾整理存放好,并进行记录发电机的工作时间及油/水/电路的切断。机房的降温设备的关闭确认及物资收拾整理存放好。6.将处理情况做详细书面记录,请相关人员签字确认并报集团公司信息化系统管理平台上填写相关记录。
五.发电机的日常维护措施 对于柴油发电机来说,由于它不是日常的主要供电设备,所以日常的维护保养主要包括以下几个方面:
1.定期检查和更换柴油过滤器和机油过滤器;
2.定期清理检查进气过滤器,并在固定的周期进行更换(或者根据现场的工况和进气过滤器的透气程度进行更换);
3.定期检查和清理电池组接线柱,保持接线柱清洁; 4.定期检查电池组的充电状态,保证良好的充电效果;
5.定期检查风扇皮带的状态,确保无损伤和处于正常的松紧度; 6.定期检查冷却液的状态,确保满足要求;
7.定期检查或者更换柴油机机油,确保油位正常;
8.冬天寒冷季节要确保机组预热装置正常工作,以便在需要启动发电机时能正常启动;
来源:UPS电源专家www.xiexiebang.com
www.xiexiebang.com
www.xiexiebang.com
第二篇:银行电力中断应急处置预案
电力中断应急处置预案
为了确保网点正常营业和银行自助设备的正常运行,网点应配备相当容量的发动机、不间断电源和应急灯等应急设备,当营业网点发生突发性电力中断时,应采取以下应急措施:
一、立即查明原因,首先网点负责人主动与供电部门联系,查明供电部门是否停电,明确停电所需时间长短等情况,根据本网点不间断电源供电情况确定是否发电;其次是委派会计查明属本单位发生线路故障,应立即联系农合行水电专职人员检查本单位电力设施是否出现短路、断路和人为破坏等情况,并组织当班后台人员配合水电专职人员立即修复,及时恢复供电。
二、副行工立即与监控中心联系,报告是否停电及恢复供电时间等情况,以便监控中心准确判断发生停电或网络故障。
三、在营业期间停电不能正常营业时,应开启应急灯,安排外勤人员对顾客进行解释,营业室、ATM机等重要部位安排外勤人员进行值守和巡查,防止他人进行趁机破坏。
四、恢复供电,检查用电设施和营业设备是否正常;有无其他异常情况和安全隐患;属营业时间,恢复对外营业。
第三篇:机房消防报警系统(应急预案)
消防报警系统及气体灭火系统应急预案
机房消防系统包括火灾自动报警及联动控制系统,主机房采用IG541气体灭火系统。
机房消防报警及灭火系统采用有管网全淹没方式,并采用气体灭火剂,探测器配置方式为智能感烟探测器、智能感温探测器搭配,只有两种探测器同时报警,气体灭火系统才会发生联动,同时还设有远程手动启动及机械手动方式。1 火灾自动报警系统
火灾自动报警系统是现代机房必不可少的组成部分,对火灾采用多种方式进行探测、报警:
智能感烟探测器,它可通过连续上升的烟雾浓度确认火警的真实性,从而做到准确报警;
智能感温探测器,当温度到达一定温度时,此探测器即会发出报警; 为保证系统中的探测器随时能正常工作,系统对各类探测器随时进行监测,一旦出现异常,将发出报警,提醒工作人员进行检修、保养。2 自动控制系统
自动灭火系统由一台高可靠性的智能型气体灭火控制主机组成。主机集报警与气体灭火控制于一体。各类探测器安装在现场。
系统能对所属设备进行自动检查和定期自诊断;
系统接口及通信协议易于与其他系统相连;
监测系统具有自动巡检功能,周期小于一秒;
当故障或火灾发生时,中央监控系统有声光报警信号,使值班人员迅速明确故障或火灾发生的位置;
打印机自动记录每次报警时间、位置及系统内所有设备状态的变化和值班人员发出的指令。
在每个机房灭火区的入口、通道等有人通过的地方设紧急启动按钮,这样可以通过手动将启动信号及时的传送到控制主机,将火灾消灭在初期状态,确保人员生命财产的安全。
3气体灭火系统
(1)灭火方式
机房采用IG541气体灭火系统的灭火方式,即在规定的时间内,喷射一定浓度的IG541气体并使其均匀地充满整个保护区,此时能将在其区域里任一部位发生的火灾扑灭。
灭火系统的控制方式为自动、电气手动、机械手动。
即在有人工作或值班时,应采用电气手动控制,在无人的情况下,应采用自动控制方式,自动、手动控制方式的转换,可在灭火控制盘上实现(在保护区的门外设置手动控制盘,手动控制盒内设有紧急停止与紧急启动按钮。
(2)保护区要求: 保护区耐压强度>1200Pa;
保护区的通风系统在喷放灭火剂前应关闭,并设置防火阀门;
喷放气体前,必须切断可燃、助燃气体的气源,并停止一切影响灭火效果的设备;
在保护区外设置声、光报警及释放信号标志。
为保证人员的安全撤离,在释放灭火剂前,应发出火灾报警,火灾报警至释放灭火剂的延时时间为30秒。
为保证灭火的可靠性,在灭火系统释放灭火剂之前或同时,应保证必要的联动操作,即灭火系统在发出灭火指令时,由控制系统发出联动指令,切断电源、关闭或停止一切影响灭火效果的设备。
保护区应有排风设备,释放灭火剂后,应将废气排尽后,人员方可进入进行检修,废气未排尽前,如需进入作用区,则需佩带氧气呼吸器。
灭火系统的使用环境温度为0℃~50℃。灭火启动方式
本工程的灭火系统设计分为自动、电气手动、机械手动三种情况; 自动情况:
即自动探测报警,发出火警信号,自动启动灭火系统进行灭火; 电气手动情况:
即自动探测报警,发出火警信号,经人工电气手动启动灭火系统执行灭火,上述自动情况的电气手动情况的转换在灭火控制盘上实现,然而不论灭火控制按钮处于哪一种情况,当人为发出火警时,都可以使用该火警区的手动控制盒,电气手动启动灭火系统进行灭火。手动控制盒的另一项功能是它可以在灭火系统动作前,撤消灭火控制盘发出的本区域的指令,以防止不需由灭火系统进行灭火时启动灭火系统。
机械手动情况: 只探测报警,发出火警信号,但电气控制部分出现故障,不能执行灭火指令的情况下;
发现火警,由于电源发生故障或者自动探测报警系统失灵,不能执行灭火指令的情况下;
机械手动情况必须在钢瓶间进行,首先拔去所需灭火区域的启动装置电磁阀上的保险,按下应急手柄,使灭火系统工作,执行灭火功能,但这务必在提前关闭影响灭火效果的设备,通知并确认人员已经撤离后方可实施。
无论什么情况下达指令,自指令下达后延时30s左右启动灭火系统,以保证人员在规定的时间内从灭火区域内撤离,自灭火系统释放七氟丙烷灭火剂时包括释放后相当长的时间内,绝对不允许有人停留在灭火区域内。
灭火系统动作释放灭火剂后,经检验确认火灾已经扑灭的情况下,打开通风系统,向灭火作用区送入新鲜的空气,废气排除干净后,才允许人员进入。废气未排尽前,如需进入作用区,则需佩带氧气呼吸器。
灭火系统必须有专人负责,经常进行检查和维护、保养,保持良好的工作状况。灭火系统的IG541灭火剂储瓶和启动装置充装介质不允许发生泄漏,当灭火剂储瓶,启动装置的压力指示下降10%时,应及时充装和更新,恢复正常工作状况。
5应急行动的基本制度 a)值班制度
应急程序启动后,应立即进行问题解决,需要较长时间的,应设相关人员24小时电话在线值班,必要时组织人员进行现场轮流值守。b)请示汇报制度
应急程序实施期间,所有成员在遇有重大情况和自身不能处理的事项应
立即向上级领导请示汇报。
1、工作程序 1)报警方式
向公司领导报告和当地消防队报警,报警电话联络号码:119(手机拔打:所在地的区号+)119 2)常规火灾扑救、火灾报警、报告与伤员救护的工作程序
(1)步骤
发现火情——立即高声报警,联络附近的人员开展火情扑救工作——根据火情的严重程度,确定向当地消防部门求急(拔打119)——联络义务消防队员——向公司报告——救助因火灾而受伤的人员——火灾扑灭后保护事故现场——公司指挥部门安排伤员的后勤保障——开展事故调查与处理工作。(2)急救方案
① 火情发现人员立即高声报警,并首先考虑切断电源线路(但必须此人懂得电工知识,如不懂,则不要冒险),附近的工作人员立即赶赴火灾事故现场,如报警人没有切断电源,应先切断电源,按照救火知识,正确使用灭火器材,开展救援工作,并注意自我防护。
② 现场的最高负责人作为现场的消防指挥员,指挥现场救援工作,根据火情的严重程度,确定当地消防部门求急(拔打119电话),联络业务消防队员,指挥救火工作,向公司领导报告灾情。
③ 如现场有人员受伤,应组织人员对伤者进行救护,必要时使用手机或其他通讯设施拔打“120”电话,与救护中心联系,要求紧急救护。
④ 公司领导和质量安全办公室接到报告后,立即赶到事故现场,并由专业的消防管理人员接替现场指挥工作,如消防队赶到,应服从消防队的指挥,直至灾情得到控制并消除。
⑤ 质量安全办公室在事后,如有伤者,要问清楚救护中心地点,与救护中心取得联系,落实后勤保障工作,确保伤员能立即得到救护,不因后勤不到位而影响急救。
(3)在事故发生后,现场的最高负责人为现场的最高指挥人员,统一指挥与调度,最高指挥员应保持冷静的头脑,有序的指挥现场灭火,并在事故后报告事故经过。
(4)现场参与救火的人员,应积极参与紧急救援工作,服从指挥人员的指挥与调度,有救援经验的人员要及时赶到事故现场,参加灭火救援,其他人员应保持现场的秩序,配合救援人员工作,并注意保护事故现场,事后配合调查组对事故进行调查。
4)电器设备的火灾扑灭知识
初起火场所的扑灭:现场人员利用配备的灭火器材进行扑灭火灾。
火势较大的扑救:立即切断火场电源,组织人员利用各种灭火器材进行扑救。当火势不能控制时要进行火灾报警,在报警中组织人员疏散火场上的爆炸物品和清理通道障碍,以保障消防车进入火场,全体人员协助消防队扑救。
低压、控制、保护等设备起火,初起火的设备,因断电会造成严重影响,扩大事故的,可带电灭火,扑救中使用干粉、1211、干砂灭火。为保证人身安全,应保证人体与带电设备的距离,不得用水灭火。当火势较大不能控制时要切断电源,用水扑救,并进行火灾报警。
2、消防灭火演练方法和过程控制
(1)消防报警和气体灭火系统具有的三种控制方式
感温、感烟火灾探测器自动控制方式; 现场电气手动控制方式;
钢瓶间启动装置机械应急控制方式。(2)灭火演练程序
现场看到或接收到人员及消防主机的火情报警。(烟雾、探测器、警报声)
值班人员要立即判断真伪火警。若是假火警,查明原因;若是真火警,立即组织人员就近携带灭火器材赶到现场进行灭火,并通知消防总指挥及相关人员。
火势不能控制时,立即按下机房门前的气体灭火紧急启动按钮,进行灭火。并向社会寻求支援;火势能控制时,增加灭火人员,以尽快扑灭。
灭火后保护好现场,并查明引起火灾的原因。
第四篇:机房应急预案
应急处置方案
第一节 总 则
1、保证人员和财产的安全为前提的原则:在由于火灾或电力问题造成的主机故障,在解决故障前,应以保证人员的生命安全和财产的安全为前提,然后进行故障的解决。
2、最快时间恢复业务的原则:本着先想尽一切方法,尽快恢复业务的原则来处理故障,如在有备用设备的情况下,主设备产生了故障,应先尽快将应用切换到备用机上,使业务能够运行,再对故障设备进行诊断和维修。
3、故障应急人员高度负责的原则:当故障应急人员在节假日接到故障通知时,本着高度负责的态度,应迅速接手处理障碍,如远程无法处理解决,应迅速赶到故障设备所在地,进行现场处理,处理故障的同时应及时向领导汇报。应急人员不可互相推卸责任,如因特殊情况,确实无法处理障碍,部门领导必须安排好其他人员处理。
4、尽可能全面的保留故障现场的原则:当故障发生后,应急人员应尽可能全面的备份出能够反映故障现象的各种日志、记录、受损文件等,便于业务恢复后,对故障的分析、解决,杜绝故障的再次发生。
应急方案的目标:保证预付卡运营系统连续安全稳定地运行。
第二节 应急领导小组
应急领导小组成员:
组 长: 副组长: 成 员:
第三节 电源系统故障应急处理
定期检查信息中心机房电源设备的运行状况,当发生下列突发事件时,按以下方案进行处置:
当中心机房发生市电供电突然停电或远程报警电源异常时。首先确认是否为正常停电及预计停电时间。检查不间断电源的电池可供电时间,需在不间断电源供电时效内关闭所有服务器及网络设备。
联系工程部查看停电原因,尽快恢复供电,并将情况报告相关领导
工程部联系电话:
第四节 空调系统故障应急处理
定期对空调的运行情况进行检查,如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。
当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,并关闭所有服务器及网络设备。对于无法自行处置的空调系统异常情况,及时与设备提供商联系,并报告公司领导。空调问题联系人:
第五节 中心机房自动消防系统应急处理
当中心机房发生火警时,按以下方案进行处置:
1.上班工作时间发生火警,听到自动消防系统发出的声光报警后,中心机房附近办公室人员应及时紧急撤离,避免气体自动消防系统启动后,消防气体对附近人员造成人身伤害。确认火警后,立刻拨打119报警,并说明尽量使用气体灭火器进行灭火,减少电子设备的损坏。
2.发生火警后,信息中心相关人员应马上赶赴现场,并向有关领导报告事故情况。同时立即联系联通等相关公司,及时评估事故损失情况,研讨尽快恢复信息系统正常运行的最佳方案。安保消防中控电话:
第六节 设备、网络系统故障应急处理
设备、网络应用系统故障应由发现人通知技术部,技术部门立即检查故障,进行初步故障定位,解决;
1.网络设备、服务器、储存设备均有备份,当设备存在硬件问题时,可随时把业务切换到备份主机上,保证业务正常运行; 2.应用系统每更新一次则做一次远程备份,在远程主机上分别备份旧的应用系统和更新后的应用系统,以当天的更新日期命名; 3.对磁盘柜上的数据库文件有定时任务,每天凌晨4:00会把数据库里的数据文件倒出到远程备份主机上,以确保磁盘柜出现硬件故障的时候,数据文件不丢失;对于网络、应用系统出现硬件方面的故障,比较严重的问题,对业务的正常运行造成较大的影响,立即向有关领导报告。
4、网络中有监控服务器,运用Cacti v10最新的版本,监控网络所有设备(路由器,防火墙,交换机以及服务器设备);对设备本身的硬件检测、外部入侵检测、外部攻击等多种对系统不利因素以发送mail的形式报警;相关人员收到报警信息,分析收到的log日志以做出相应的处理。
5、每周周五对网络设备进行日志及配置文件采集,对数据库数据文件定期下载,和远程备份;在本地电脑上保存最近的配置文件,以便在发生毁灭性的灾难时,用来重组。
对简单故障,运维人员应迅速排除故障,解决问题并记录。如果需要更换设备,应上报有关领导,经批准后马上更换故障设备,尽快恢复网络、应用系统运行。运维部门判断无法及时修理时,应立即通知相关的系统运行服务提供商,在最短的时间内安排修理或更换系统。
如发现属外部线路的问题,应与线路服务提供商联系,敦促对方尽快恢复故障线路。
启用备份线路、设备、系统,迅速恢复相关的应用。
联通联系电话:
第七节 黑客入侵的应急处理
发现网络上有黑客攻击行为,任何人员都有义务向技术部门报告。技术部立即启动应急响应,切断受攻击计算机与网络的连接,停止一切操作、保护现场,并上报有关领导。
对于黑客攻击,由计算中心组织应急响应专家小组查找入侵踪迹,分析入侵方式和原因。由安全管理员根据对入侵事件的分析,组织相关人员对内部网计算机整改,防止黑客用同样的手段再次入侵其他系统。安全管理员检查确定无安全隐患后,才可将受攻击计算机重新连接网络,或启用备份计算机来恢复应用。
安全管理员应做好记录,保护现场,进行日志收集等工作。如果能追查到攻击者的相关信息,可以对其发出警告,必要时可以采取进一步的行动,乃至采取法律手段。根据破坏程度,经有关领导同意后,上报公安部门。
若系统已被黑客破坏,无法恢复,应将受黑客攻击的计算机上的重要数据备份到其他存储介质,确保计算机内重要的数据不丢失。如果数据无法恢复,经有关领导同意后,可与国家指定的部门联系,由他们来协助恢复,为保证数据信息安全,需在安全管理部门作记录。
第八节 生产系统、数据库故障处理
生产系统出现故障,技术部做出应急处理
1.因软件设计缺陷、设计漏洞等引起的故障,通知公司研发部门在2小时内查明原因,解决问题。
2.数据库出现故障,运维人员应在2小时内查清故障原因,其他相关部门应积极配合,解决问题。
3.如出现数据丢失情况,确认不能自行恢复后,启用备份恢复数据,24小时内恢复运营。
本方案自发布之日起施行
第五篇:机房应急预案
中心机房突发事件应急预案
第一条
机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的 物理破坏、人为失误造成的安全事件等等。针对突发事件的预防措施如下:
1.建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘; 建立备份电源系统;加强所有人员防火、防盗等基本技能培训。
2.服务器采用可靠、稳定的硬件设备,落实数据备份机制,安装有效的防病毒软件,及时 更新升级扫描引擎;加强对局域网内所有用户和信息系统管理员的安全技术培训。
第二条
机房漏水应急预案如下:
1.发生机房漏水时,第一目击者应立即通知机房管理人员。
2.若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及 时联系设备供应方处理,同时启动备用空调,必要情况下可临时用电扇对服务器进行降温。3.若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通 知办公室,及时清除积水,维修墙体或窗户,消除渗漏水隐患。
第三条
机房火灾应急预案如下:
1.完善机房环境,确保机房具备二氧化碳灭火器;禁止携带易燃易爆物品进入机房。2.机房管理人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理,掌握消防 应急处理步骤、措施和要领,懂得灭火的方法,会扑救初起火灾,并定期组织灭火演习。3.一旦发生火灾,迅速切断机房电源,避免灾情的扩散,并迅速拨打物业管理和119火警电话。
4.等待消防车到来期间,应组织物业保安或工作人员在保证安全的前提下灭火,应急领导小组应在第一时间内集中所有二氧化碳灭火器,抓住时机,尽可能的把火扑灭。
5.配合消防部门调查事故原因,对造成的损失和起火原因做好记录,以便进行灾后总结。
第四条
雷击事故应急预案如下:
1.遇雷暴天气,机房管理人员在下班后应及时关闭所有服务器,切断电源,暂停内部计算 机网络工作。
2.雷暴天气结束后,机房管理人员应及时开通服务器,恢复内部计算机网络工作,对设备 和数据进行检查。出现故障的,事发部门应将故障情况及时报告机房管理人员。
3.因雷击造成损失的,机房管理人员应会同相关部门进行核实、报损,并在调查工作结束 后一日内书面报告领导。
第五条
设备防盗被盗或人为损害应急预案如下:
1.机房管理人员每日查看、清点设备并锁好机房大门。
2.机房管理人员每日检查录像监控服务器状态,确保监控画面正常,并检查每日录像正常性、完整性。
3.发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告相关负责人,同时保护好现场。
4.机房维护人员接报后,通知保安及公安部门,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
5.事发单位和当事人应积极配合公安部门进行调查,并将有关情况向机房管理人员汇报。
第六条
机房停电应急预案如下:
1.接到停电通知后,机房管理人员应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求用户在停电前停止业务、保存数据。
2.机房管理人员每日检查UPS电源的状态,确保在突发停电时,UPS电源能自动供应服务器正常工作半个小时,保证员工工作的数据及时保存。
第七条
通信网络故障应急预案如下:
1.发生通信线路中断、流量异常等故障后,员工应及时通知机房管理人员。
2.机房管理人员在接到报告后,迅速组织相关技术人员检测故障区域,并作相关故障处理,必要时通知通信网络运营商查清原因;逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
3.应急处理结束后,机房管理人员应在一日之内提交故障分析报告,以便备案。
第八条
服务器故障应急预案如下:
1.机房管理人员每日检查服务器状态,检查邮箱服务器状态,确保系统运行的完善。
2.机房管理人员定期备份服务器数据,并将备份资料刻录成光盘或拷贝到移动硬盘。
第九条
1.发生机房突发事件后,机房管理人员应采取有效措施开展先期处置,恢复信息网络正常状态。应急处置工作结束后,机房管理人员对事件发生原因、性质、影响、后果、责任及应急处置能力、恢复重建等问题进行全面调查评估,根据应急处置中暴露出的管理、协调和技术问题,改进和完善预案,实施针对性演练,总结经验教训,整改存在隐患,组织恢复正常工作秩序。