第一篇:机房停电应急预案
机房停电事件应急预案
1.总则 1.1目的
为更好的应对机房停电此类突发事件,提高处理各类停电事件的能力,建立健全可靠的应急机制,最大限度地降低各类停电事件对公司各部门的影响,特制定《杭州博日有限公司机房停电事件应急预案》(以下简称预案)。1.2工作原则
(1)预防为主。立足安全防护,加强预警,重点保护公司重要系统信息,数据安全。(2)快速反应。发生突发事件时,及时获取充分而准确的信息,迅速处置,最大程度地减少突发事件影响。
(4)坚持“统一领导、协调配合、明确责任、坚守岗位”的原则。1.3适用范围
所有机房临时停电,突发停电以及较长时间停电的事件。2.组织机构及职责
2.1组织机构(联系人名单及联系方式每半年更新一次)设备计量课 主要联系人及联系方式 Helpdesk:分机:XXXX。(7 X 24工作)各主要设备供应商联系人及联系方式: 2.2各组织机构职责
1)设备计量课应尽可能及时通知所有部门停电信息,且准备好应急措施。
2).设备计量课应及时做好停电应急措施,通知各相关部门做好重要数据备份,并通知到机房设备供应商,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,设备计量课所有相关人员在此期间必须保持随时待命状态。
3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;突发临时停电应尽可能做好远程技术支持工作。
3.设备计量课应急预案
3.1机房长时间停电应急预案
⑴ 接到长时间停电通知后,应询问停电原因及具体停电时间并及时通过邮件发布或电话通知停电公告,要求各部门尽可能在停电前停止业务、保存数据,关闭所有能关闭的用电设备。⑵ 根据停电时间长短情况,协同有关部门部署应急措施,检查应急设备是否正常,若时间条件许可模拟停电测试应急设备性能。
(3)对机房设备用电做好统计,做好拉闸限电预案。
(4)各相关技术支持人员部署到位,确保停电期间重要系统和设备运行正常,以及恢复供电后所有系统,设备运行正常。(5)通知相关部门,停电期间加强对存在安全隐患的设备及区域的巡查(如电梯间,水房等),保障公司人员和财产安全。
(6)机房管理人员详细记录事件原因及此期间采取的应急措施,备案。3.2 机房突发性临时停电应急预案
(1)相关人员发现突发性停电时应立即报告部门领导,及时了解停电原因及停电时间,并立即检查机房设备是否运行正常,检查各系统是否运行正常,同时查询机房设备相关记录,计算UPS当前状况下可供电时间,并向相关部门领导汇报。(2)告知各业务部门停电相关信息,判断停电时间长短做好相应应急措施,提醒各部门做好数据备份以防万一。
(3)通知相关部门检查存在重大安全隐患的设备运行情况(譬如电梯,水房等),保障公司人员和财产安全。
(4)通知IT部门机房管理人员及机房设施相关人员进入紧急待命状态。
(5)恢复正常后,查明停电原因,记入机房安全管理日志。4.培训和演习4.1培训
IT运维部门及机房相关人员每年至少开展一次机房停电等突发事件处理的培训,提高机房管理人员及其相关人员的应急能力。4.2预案演习
各应急组织机构每年至少安排一次演练,通过演练发现应急工作体系和工作机制以及各备用设备,系统存在的问题,不断完善应急预案,提高应急处理能力。
5.附则
5.1预案更新
本预案结合演练和实施情况,及时进行修订和完善。5.2责任与奖惩
各应急机构对在应急事件处置中作出突出贡献的集体和个人,提出表扬和奖励;对玩忽职守,造成不良影响或严重后果的,按有关规定提出处理意见,并追究其责任。5.3制定和解释
本预案由设备计量课制定并解释。5.4本预案实施或生效时间
本预案制定后提交部门讨论,审批通过后执行。
第二篇:机房停电应急预案
应急预案指面对突发事件如自然灾害、重特大事故、环境公害及人为破坏的应急管理、指挥、救援计划等。以下是小编整理好的机房停电应急预案,欢迎大家阅读参考!
机房安全应急预案【1】
机房是我单位的重要场所,重要仪器、设备相对集中,一旦发生事故,会造成严重后果。为此特制定本应急预案。
一、触电
(1)一旦发生触电事故,应迅速安全切断电源,切忌直接接触触电者。
(2)即刻拨打紧急电话120并通知相关领导,同时开展现场应急救护。
二、火灾
1、报警程序:
即刻通知领导及相关部门,根据火情大小如需报警立即就近用电话或手机报告消防中心(电话119).。
2、组织实施:
机房管理员一旦发现火情后,应即刻切断电源,并使用灭火器扑救起火设备。
三、空调漏水
若空调系统出现渗漏水,应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时临时用电扇进行降温。
四、设备发生被盗或人为损害事件
(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告中心负责人,同时保护好现场。
(2)中心负责人接报后,通知保卫处,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
(3)当事人应当积极配合公安部门进行调查,并将有关情况向领导汇报。
五、机房停电
(1)接到长时间停电通知后,应及时发布相关信息,部署应对具体措施。
(2)如遇临时停电,且停电时间在3小时之内,管理员要检查UPS是否正常工作,以确保机房设备的正常运行。
六、网络故障
(1)发生通信线路中断、路由故障、流量异常等故障后,网络管理员应及时查清通信网络故障位置,隔离故障区域,组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
(2)事态或后果严重的,应及时报告领导并请求协助解决。
七、不良信息和病毒事件
(1)发现不良信息或网络病毒时,管理员应立即断开网线,终止不良信息或网络病毒传播,并报告。
(2)中心负责技术人员应采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。
(3)事态或后果严重的,应及时报告相关领导以及相关部门。
八、服务器软件系统故障
(1)发生服务器软件系统故障后,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;
(2)若重启失败,应立即安排备份服务器启用,并请求技术人员支援,作好技术处理。
九、注意事项:
第一、机房管理员要加强日常监控,及时处理、消除及上报安全隐患。
第二、备齐安全相关装备。
第三、及时做好备份。
网络及机房故障应急预案【2】
为科学应对网络与信息安全突发事件,提高信息中心机房处理突发信息网络事件的能力,建立健全信息安全应急机制,有效预防、及时控制和最大限度地消除信息安全各类突发事件的危害和影响,特制订网络及教育技术中心机房故障应急预案。
本预案坚持“统一领导、协调配合、明确责任、依法规范、条块结合、整合资源、防范为主、加强监控”的原则。适用于网络及教育技术中心机房可能发生的网络与信息安全突发事件。
一、设备发生被盗或人为损害事件应急预案
⑴ 发生设备被盗或有人为损害设备情况时,使用者或管理者应立即报告科长,同时保护好现场。
⑵ 科长接报后,应立即报告处长,并通知安全公安处,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
⑶ 事件当事人应当积极配合公安部门进行调查,并将有关情况向科长和处长汇报。
二、机房停电应急预案
⑴ 接到停电通知或遇不可预知的停电后,应立即报告科长,并通过网站发布或电话通知停电通告。
⑵ 停电已经发生,应立即检查机房供电情况,如UPS是否正常供电,设备是否出现关机等情况,并积极查看机房当前温度情况。
⑶ 机房温度超过30度且制冷空调无法开启,积极组织人员开始对次要设备进行关机。
⑷ 机房温度超过35度且制冷空调无法开启,积极组织人员开始对绝大部分设备进行关机。
⑸ 机房来电后先与物业部门确认供电是否恢复正常,如完全正常,先开制冷空调,并根据设备关机的反序开机,并检查各项服务是否正常开启。
三、网络故障应急预案
⑴发生通信网络故障后,网络管理员应第一时间明确网络故障的位置和程度,及时给科长汇报,并隔离故障区域,切断故障区与服务器的网络联接。
⑵针对故障原因,网络管理员及时制定故障解决预案,并报上级领导批准,情况严重时告知相关通信网络运营商,请求协助查清原因。
⑶网络管理员会同电信技术人员或公司技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
⑷网络管理员以及关责任人负责写出故障分析报告,上报上级领导备案。
四、不良信息和网络病毒事件应急预案
⑴当发现不良信息或网络病毒时,网络管理员应立即断开该处网络,第一时间给上级领导汇报,并终止不良信息或网络病毒传播。
⑵立即通告局域网内所有计算机用户防病毒方法,隔离网络,指导各计算机操作人员进行杀毒处理,直至网络处于安全状态。
⑶对不良信息要进一步追查来源,对未经相关领导同意擅自发布信息,造成不良影响且触犯法律者,移交执法部门追究法律责任。
⑷情况严重时,应立即向上级领导报告,请求支援,作好应对措施。
五、黑客攻击事件应急预案
⑴当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,及时给网络管理人员报告,网络管理员接到报告后立即给上级领导汇报。
⑵接到报告后,网络管理员立即关闭网络,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道。
⑶及时清理系统、恢复数据、程序,尽力将系统和网络恢复正常;情况严重时,应立即级领导报告,请求支援,作好应对措施。
六、机房设备硬件故障应急预案
⑴发生机房设备硬件故障后,网络管理员立即确定故障设备及故障原因,并及时给领导汇报,制定处理预案。
⑵若故障设备在短时间内无法修复,应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。
⑶故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,应立即级领导报告,请求支援,作好应对措施。
七、应急处置
发生信息网络突发事件后,网络管理人员应在第一时间内向上级领导报告,并且成立应急小组,组织人员开展先期处置。发生重大事件应向上级领导部门报告。
第三篇:机房停电事件应急预案
XXXXXX机房停电应急预案(V 1.0)运维
IT 2008-11-4
目 录 1.总则.................................................................................3 1.1目的.........................................................................3 1.2工作原则.................................................................3 1.3适用范围.................................................................3 2.组织机构及职责.............................................................3 2.1组织机构.................................................................3 2.2各组织机构职责......................................................4 3.IT部门应急预案..........................................................4 3.1机房长时间停电应急预案....错误!未定义书签。3.2机房突发性临时停电应急预案错误!未定义书签。4.培训和演习...................................................................5 4.1培训.........................................................................5 4.2预案演习.................................................................5 5.附则...............................................................................5 5.1预案更新.................................................................5 5.2责任与奖惩..............................................................5 5.3制定和解释..............................................................5 5.4本预案实施或生效时间..........................................5 机房停电事件应急预案
1.总则 1.1目的
为更好的应对机房停电此类突发事件,提高处理各类停电事件的能力,建立健全可靠的应急机制,最大限度地降低各类停电事件对公司各部门的影响,参照《XXXX数据中心突发事件应急处理程序V2.1》,特制定《XXXX 机房停电事件应急预案》(以下简称预案)。
1.2工作原则
(1)预防为主。立足安全防护,加强预警,重点保护公司重要系统信息,数据安全。
(2)快速反应。发生突发事件时,《XXXX数据中心突发事件应急处理程序V2.1》,及时获取充分而准确的信息,迅速处置,最大程度地减少突发事件影响。
(4)坚持“统一领导、协调配合、明确责任、坚守岗位”的原则。
1.3适用范围
所有机房临时停电,突发停电以及较长时间停电的事件。
2.组织机构及职责
2.1组织机构(联系人名单及联系方式每半年更新一次)
规划运营:主要联系人及联系方式: IT 主要联系人及联系方式
Helpdesk:分机:XXXX。(7 X 24工作)各主要设备供应商联系人及联系方式:
2.2各组织机构职责
1).规划运营部门应尽可能及时通知所有部门停电信息,且准备好应急措施,若需要柴油发电机工作应提前检查柴油机性能,输出电压是否稳定以及柴油等辅助设备是否充足。
2).IT部门应及时做好停电应急措施,通知各相关部门做好重要数据备份,并通知到机房设备供应商,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,IT所有相关人员在此期间必须保持随时待命状态。
3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;突发临时停电应尽可能做好远程技术支持工作。
3.IT部门应急预案
3.1机房长时间停电应急预案
⑴ 接到长时间停电通知后,应询问停电原因及具体停电时间并及时通过System Helpdesk发布或电话通知停电公告,要求各部门尽可能在停电前停止业务、保存数据,关闭所有能关闭的用电设备。
⑵ 根据停电时间长短情况,协同规划运营部门部署应急措 4 施,检查应急设备是否正常,若时间条件许可模拟停电测试应急设备性能。
(3)对机房设备用电做好统计,做好拉闸限电预案。(4)各相关技术支持人员部署到位,确保停电期间重要系统和设备运行正常,以及恢复供电后所有系统,设备运行正常。
(5)通知相关部门,停电期间加强对存在安全隐患的设备及区域的巡查(如电梯间,水房等),保障公司人员和财产安全。
(6)机房管理人员详细记录事件原因及此期间采取的应急措施,备案。
3.2 机房突发性临时停电应急预案
(1)相关人员发现突发性停电时应立即报告部门领导,及时了解停电原因及停电时间,并立即检查机房UPS及其它设备是否运行正常,检查各系统是否运行正常,同时查询机房设备相关记录,计算UPS当前状况下可供电时间,并向相关部门领导汇报。具体事件操作流程参照《XXXX数据中心突发事件应急处理程序V2.1》执行。
(2)告知各业务部门停电相关信息,判断停电时间长短做好相应应急措施,提醒各部门做好数据备份以防万一。
(3)通知相关部门检查存在重大安全隐患的设备运行情况(譬如电梯,水房等),保障公司人员和财产安全。
(4)通知IT部门机房管理人员及机房设施相关人员进入紧急待命状态。
(5)恢复正常后,查明停电原因,记入机房安全管理日志。
4.培训和演习4.1 培训
IT运维部门及机房相关人员每年至少开展一次 机房停电等突发事件处理的培训,提高机房管理人员及其相关人员的应急能力。
4.2预案演习
各应急组织机构每年至少安排一次演练,通过演练发现应急工作体系和工作机制以及各备用设备,系统存在的问题,不断完善应急预案,提高应急处理能力。
5.附则 5.1预案更新
本预案结合演练和实施情况,及时进行修订和完善。
5.2责任与奖惩
各应急机构对在应急事件处置中作出突出贡献的集体和个人,提出表扬和奖励;对玩忽职守,造成不良影响或严重后果的,按有关规定提出处理意见,并追究其责任。
5.3制定和解释
本预案由IT 运维部门制定并解释。
5.4本预案实施或生效时间
本预案制定后提交部门讨论,审批通过后执行。
第四篇:机房突发停电应急预案
中心机房突发停电应急预案
为更好的应对机房停电此类突发事件,提高处理各类停电事件的能力,建立健全可靠的应急机制,最大限度地降低各类停电事件对院内各部门的影响,特制定大吴家卫生院机房停电事件应急预案(以下简称预案)。一:工作原则
(1)预防为主。立足安全防护,加强预警,重点保护公司重要系统信息,数据安全。(2)快速反应。发生突发事件时,及时获取充分而准确的信息,迅速处置,最大程度地减少突发事件影响。
(3)坚持“统一领导、协调配合、明确责任、坚守岗位”的原则。二:适用范围
所有机房临时停电,突发停电以及较长时间停电的事件。三:组织机构及职责
(1)组织机构(联系人名单及联系方式每半年更新一次)规划运营:主要联系人及联系方式(附联系人名单)(2)各组织机构职责
1).规划运营部门应尽可能及时通知所有部门停电信息,且准备好应急措施。
2).各部门应及时做好停电应急措施,通知各相关科室做好重要数据备份,并通知到机房管理人员,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,所有相关人员在此期间必须保持随时待命状态。
3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;突发临时停电应尽可能做好远程技术支持工作。四:具体操作
第一条:机房意外停电后,首先确定停电的范围以及受影响的设备范围。
第二条:确认停电的范围为本机房或本院,应立即打后勤管理处电话汇报。估算电力可能恢复的时间,并通知网络中心领导。
第三条:如果确认停电的时间在1个小时内,可以在UPS正常供电的时间内,等到电力恢复。如果不能确认在2个小时内恢复供电,立即汇报给机房电源维护负责人和中心机房各设备的负责任到达现场。做好各设备的电源停电准备,在UPS供电达1.5个小时后,严格按操作手册停掉存储和各应用服务器的电源,最后停核心交换机和路由器。等待电力恢复,电力恢复供电后转第七条执行。如果确认停电的范围仅在于本机房电源故障,立即汇报给机房电源维护负责人。
第四条:机房维护负责人将掉电的电源柜总空开和分空开的状态处于下电状态。并向主管领导汇报。
第五条:将掉电的所有的设备电源状态处于下电状态,以防止电源柜加电对设备的冲击。第六条:电力室恢复供电后,先不要急于给电源柜加电,等待10—20 分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。
第七条:供电正常后,确定设备处于下电状态后,打开电力柜的总控开。第八条:根据设备加电顺序,启动分项空开。
第九条:设备加电顺序,IP 交换机和SAN 交换机正常后再给存储加电,存储状态检查正常后,启动主机(以上各设备务必按操作手册的启动顺序上电)。
第十条:设备启动正常后,开始启动数据库。
第十二条:数据库启动正常后,开始启动中间件服务器。
第十一条:中间件服务器正常后,启动应用程序。
第五篇:网络中心机房停电应急预案
网络中心机房突发停电事故应急处理预案
第一条:机房意外停电后,首先确定停电的范围以及受影响的设备范围。
第二条:确认停电的范围为本楼或本校区,应立即打后勤管理处电话汇报。估算电力可能恢复的时间,并通知网络中心领导。
第三条:如果确认停电的时间在1个小时内,可以在UPS正常供电的时间内,等到电力恢复。如果不能确认在2个小时内恢复供电,立即汇报给机房电源维护负责人和中心机房各设备的负责任到达现场。做好各设备的电源停电准备,在UPS供电达1.5个小时后,严格按操作手册停掉存储和各应用服务器的电源,最后停核心交换机和路由期。等待电力恢复,电力恢复供电后转第七条执行。如果确认停电的范围仅在于本机房电源故障,立即汇报给机房电源维护负责人。
第四条:机房维护负责人将掉电的电源柜总空开和分空开的状态处于下电状态。并向主管领导汇报,马上联系相关厂家,如有可能请厂家立即到现场支持。
第五条:将掉电的所有的设备电源状态处于下电状态,以防止电源柜加电对设备的冲击。
第六条:等各厂家和相关的人员到齐后,商议设备恢复时因注意的事项,并形成相关文档。
第七条:电力室恢复供电后,先不要急于给电源柜加电,等待10—20 分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。
第八条:供电正常后,确定设备处于下电状态后,打开电力柜的总控开。第九条:根据设备加电顺序,启动分项空开。
第十条:设备加电顺序,IP 交换机和SAN 交换机正常后再给存储加电,存储状态检查正常后,启动主机(以上各设备务必按操作手册的启动顺序上电)。第十一条:设备启动正常后,开始启动数据库。第十二条:数据库启动正常后,开始启动中间件服务器。
第十三条:中间件服务器正常后,启动应用程序。