第一篇:2005年运行维护管理工作总结
05年运行维护管理工作总结
一年来,在厂、分场领导的关心支持下,结合二分场设备多,设备陈旧,缺陷多且运行维护人员技术业务素质参差不齐的特点,采取了有重点、有计划,落实到人,发动群众,严格奖惩等一系列方式方法,督促运行、维护人员认真巡视检查,严格“两票三制”,定期或适时地做好设备的清洁、维护、检查工作,对设备缺陷力争早发现,早处理,竭力提高发电设备的健康水平,使主设备消缺率达100%,辅助设备消缺率达90%以上,确保了2005年设备的安全、经济、可靠运行,由此,特将一年来的主要工作总结如下:
一、全年共完成了3F、101DL大修工作各1次,大坝、复兴寺起闭机闸门大修一次,1F、2F、3F、4F小修工作各1次,2F临修工作1次,机组消缺工作多次,发现一般主、辅助设备缺陷175次,处理175次,消缺率100%;
二、充分利用停电机会对各设备进行清洁、除锈、上漆,保证了设备的绝缘和散热,尤其是加强了瓷瓶的清洁,全年没有出现污闪事故。
三、坚持每月的机组安检。由于职工入住基地及社会的飞速发展,人员的流动性日益加大,这给安检工作带来了困难。针对此情况,车间制定了严格的制度,加强了监督考核,要求每个工作班人员每次必须签字,并同一轮班上班不能相互代班做安检,保证值班员有充分的休息时间,每次安检技干都亲临现场进行把关,顺利地保证了安检工作的完成。在安检中发现并处理了大量的隐患和缺陷,诸如灭磁开关跳不脱、油开关合不上或跳不脱、PT缺油、副机不联跳等,有效地避免了事故的发生。
四、加强了干部值班工作。坚持节假日及雷雨时有管理人员在厂房,以保证有异常情况能及时处理。同时加强了防雷设备设施的维护。配合完成了分场所有避雷针、避雷器的预试工作。
五、加强了充油设备的油位的检查,为时对充油设备进行补充油,保证安全生产。其次,吸取2004年10.3事故教训,加大了对充油设备的定期或适时的检查工作,同时,吸取5.24事故教训,先后在各高压开关室、母线道、厂用变室、副机开关室10KV开关室、励磁室以及升压站进行了孔洞堵塞,为进一步防止小动物短路打下了基础。
六、本年度设备改造项目较多,3DL、4DL、12DL、IIYH及3F转子线圈、制动闸块、刹车系统等一系列设备安装、调试、验收、投运。工作面多,临时性工作复杂,设备试验项目多,经过运行维护管理人员的努力,及时处理工作中出现的设备问题,保证了设备的安全投运。
七、加强电机绝缘监测工作。对测量工器具及时进行了送检,以保证数据的可靠性。
八、加强重点设备的维护。全年多次处理好励磁系统故障,机组不能自动开出,机组刹不死车,运行中自动关DF、油开关合不上或跳不脱等等一系列问题。
九、加强技术台帐的管理。对技术台帐进行了分工,修正了一些错误之处,并及时补充了新的数据,保证了生产运行中能及时快速准确地获得所需数据。
十、加强了运行维护管理工作。在督促运行维护人员遵章守纪的基础上重点加强设备的缺陷管理,加强了对设备巡视检查执行情况的监督和考核,杜绝巡视检查走过场的现象,提高巡视检查的质量和数量,要求每个运行值班人员必须认真监盘和抄表,发现问题及时分析、处理和汇报。技干每天必须认真查阅各种记录并进行现场巡检,发现异常及时组织人员分析、解决,及时处理设备存在的隐患,确保设备的健康运行。这样,从技术上保障了设备的正常运行,把故障消除在萌芽状态中。增强技术所起的作用,在生产实践中体现科学技术是第一生产力。总之,一年来,运行维护管理工作取得了较大的成绩和进步,为分场、厂的安全生产作出了较大贡献,但仍存在许多不足,如督促运行维护人员巡检的力度不够,对现场数据的审阅不够全面等,来年内我将取长补短,认真修正不妥之处,争取将分场的设备运行维护工作做得更好,尽心竭力提高发电设备的健康水平,为分场、厂的安全生产提供前提和保证。附:一年来的主要生产运行维护工作如下:
1.1月5日,2F运行中负荷降为零,DF自行关闭,检查是电柜测频板坏和DF油路转换器漏油引起;6日更换2F测频板拆除DF现地全关、全开按扭接线,更换2F DF接力器高压油管;10日、11日、13日分别对大水线554DL、552DL、35KV母线、122DL、3B、10KV各线路进行年检预试;15日拆除了2F DF接力器上的接流垫。
2.2月4日,2F在运行中出现自动关DF、PF,5日检查发现是22SCJ误动引起,后更换正常;13日发电机层动力盘着火,引起1#厂用变过流限时保护动作,2XJ掉牌,11DL跳,后检查是漏油泵空开及胶木板绝缘击穿短路引起,分场更换空开及胶木板正常;24日开2F时,主机并列正常,副机起励正常,但投入副机同期开关后,副机不能与主机并列,将副机逆变,加2F负荷加不起,换机停2F时2DL跳不脱,经手动打跳,后经分场调整2DL机构处理正常;25日,3F开始大修。
3.3月10日,厂派人对高、中、低压储气罐及对1#、2#公用压油槽进行了探伤;19日厂用事故照明交流接触器起火,分场更换正常;19日至31日6.3KV二段母线停电,对12DL、3DL、4DL、5DL、二YH及柜体进行了更换,同时对21F、22F、23F、24F、2F、5F、4F表计进行年检,对4F进行了保护年检;25日大统线553DL年检预试及进行了大水线和大统线门型架防腐加固处理;26日对1B、110KV一段母线、121DL进行年检预试及门型架防腐加固处理;
29、30日分别对12B、4B进行预试和保护年检;31日对6.3KV二段母线做了递升加压及定相实验。
4.4月1日,12B、5B保护年检;2日6.3KV二段开关柜改造完并转运行,4F恢复备用;3日11DL、11B年检预试;9日17:15 3F交系统;20日发现2DL假合,立杆传动销脱落,更换正常;21日,555DL、FZ、31YH年检预试、35KV门型架防护;23日,大朱东线、西线跨接架空线停电,110KV门型构架防护处理、1B、41YH、FZ、2B、大朱东线年检预试;24日处理1B110KV B相端面漏油。
5.5月3日,3F运行中线圈2、3点温度升高,取下了24XJ;13日11、12DL跳,过流限时2XJ掉牌,发电机层动力柜五路开关短路,更换为刀闸;24日0:43老鼠短路引起11DL上穿墙套管处三根母线熔断,101DL跳闸、L1动作,11DL、1F、2F开关柜穿墙套管表面炭化,三个支持瓷瓶炸裂,厂用瓷瓶四个坏,11G支持瓷瓶表面炭化,个别炸裂,26日1B恢复备用,24日对101DL进行检查性大修。
6.6月4日,检修队对大坝、复兴寺起闭机闸门大修;
13、14日对高压储气罐、1#、2#低压储气罐从水耐压实验。
7.7月9日,2DL合不上,合闸线圈烧坏,更换正常;21日复兴寺、23日大坝闸门检修完成。
8.8月12日水工分场对尾水位井进行了除锈刷漆;29日大坝闸门开启泄洪。
9.9月24日检修公司更换了4F出口油开关4DL的绝缘支持瓷瓶三个;同时3F开始小修。
10.10月10日处理了3B分接头漏油,并对3B、5B进行了加油;14日3F调速器配压阀锥形销子脱落、接力器斜块脱落、1F调速器斜块脱落;27日、30日4次事故跳闸并过速管蝶阀,轴承温度过高投信号位置,检查发现4F1LJ117-118绝缘坏;31日发现4FMK发热严重,一触头发热,铜辫变色,更换正常。
11.11月9日,3F调速器滚轮偏离正常位置,检修公司处理好。12.12月2日,2F退出备用,2FYH夹层、2DL开关柜旁电缆沟灌浆;10日4F退出备用,4F加装单点温度测温盘,4F母线道灌浆。
第二篇:通信工作总结(运行维护)
20xx年运行维护工作总结20xx年新疆电信运行维护部门贯彻维护就是服务、维护就是经营的理念;将维护工作面向市场,贴近用户,用网络的实力增强企业的核心竞争力;深化改革创新,维护管理和设备运行质量有了进一步提高。
一、20xx年全区主要维护指标完成情况和通信能力
1、光缆维护指标完成情况:全区光缆一级干线发生全阻障碍3次,障碍历时446分钟,光纤可用率99.97%,同比提高0.09%;二级干线光缆发生全阻障碍4次、障碍历时898分钟,系统障碍1次、障碍历时400分钟,光缆畅通率99.994%,同比提高0.0015%。本地网光缆全年共发生全阻障碍7次、障碍历时1574分钟、畅通率99.999,与去年同比(8次,2857分钟、畅通率99.997%)畅通率提高0.002%。一级干线卫星电路畅通率达到99.94%;干线微波未发生阻断;本地网微波阻断时间0.84分钟/每月每百业务波道公里,在指标要求之内。
2、本地网线路指标完成情况:本地网市话线路合格率:86%用户障碍申告率:1.26,同比降低0.10%。百门障碍历时:391.17分钟,同比降低25.83分钟。修复及时率:99.06。
3、服务指标:端到端电路开通及时率为100,端到端电路故障修复及时率为100,端到端电路故障申告率为4.45;互联网网络时延及丢包达标率98.06%、0.194%;传输电路可用率99.967%。
4、主要通信能力:......二、20xx年完成的主要运行维护工作任务
(一)确保网络安全畅通20xx年全区光缆干线在西部开发造成的光缆线路沿线公路施工、基础建设力度逐年加大的情况下,坚持落实“三盯”制度,通过建立《干线光缆维护动态周报制度》、加强G光缆巡检系统的管理和监控中心各项制度和流程的建立实施等,对通信故障的预见、故障抢修时间的压缩和响应速度都有所提高,一、二级干线障碍次数均比去年有大幅度下降:次数减少50%,历时减少68%。全力做好带电割接,今年一级干线光缆线路带电割接13次、二级干线光缆线路带电割接26次、无人站带电割接8次,共占全部割接的93.75,带电割接中断电路总时长571分钟。全疆共计整治一、二级光缆线路12次,22个中继段,通过一系列施工确保了线路的基础质量和传输质量,在线路安全预防方面达到了显著的效果。20xx年5-6月在全疆各本地网开展了一次防瘫痪、防阻断交换设备维护工作专项检查,落实维护规程执行情况;检查设备运行状态。各级运维部门自查工作层层落实,对存在的安全隐患及时整改,检查工作取得了良好的效果。根据上半年设备故障统计,20xx年8月召开全区机房环境治理电视电话会议,9月下旬组织进行了全区机房环境检查。各本地网对机房多年积累的环境问题进行了比较彻底地清理,改善了设备运行环境,取得了预期效果。进行了全区三线交越和搭挂的摸查整治工作,全区三线交越共计87446处、搭挂共计3133处、搭挂长度1019.3公里,区公司统一组织购买“三线”交越保护套管38万米,费用228万元。
(二)做好市场支撑、落实业务响应工作:今年重点落实大客户资料调查和电路保障工作。建立了全区集团大客户故障一站受理体系;整理出大客户电路资料1479家,并着手细化、完善;制定了大客户资料动态管理流程,在全区运维信息发布系统中开辟业务响应专栏,每月定期将中元公司、建行等大客户故障明细表发布在网上;建立了各地州市分公司针对本地故障现象进行详细的故障原因分析制度。针对部分金融大客户电路开放在同一个155M的情况,完成了这些电路在省内干线层面上优化调整。重视端到端业务响应时效。年初我区端到端电路故障修复及时率仅达75,运维部对此进行了跟踪调查,协调相关部门,核实中元公司电路资料,将相关地州市分公司的7*24小时工位电话报至大客户网管中心,使故障直接派发到基层维护人员,制定调度流程,制定出相应的应急方案,对障碍进行全程跟踪,形成障碍处理闭环管理。使我区的“电路故障修复及时率”指标在后续几个月内达到了100%。积极压缩大客户障碍次数。我区6—7月份出现大客户电路障碍次数偏高现象,其中乌鲁木齐本地网障碍次数占总数的50,运维部重点对乌市电信分公司每月故障原因进行分析,分清可控因素和不可控因素,指导分公司针对可控因素采取有效措施,使后续几个月本地网障碍有所减少。做好对市场前端的支撑,协助区公司市场部与新疆额尔齐斯河流域开发工程建设管理局500水库管理处签定乌市水管处至500水库管理处的光纤(一对)租用协议,并紧急协调建设了准东电信局-500水库管理处的11.3公里光缆线路。配合大客户部门进行军区、兵团通信情况调查和合作协议谈判。
第三篇:通信工作总结(运行维护)
2003年运行维护工作总结
2003年新疆电信运行维护部门贯彻维护就是服务、维护就是经营的理念;将维护工作面向市场,贴近用户,用网络的实力增强企业的核心竞争力;深化改革创新,维护管理和设备运行质量有了进一步提高。
一、2003年全区主要维护指标完成情况和通信能力
1、光缆维护指标完成情况:
全区光缆一级干线发生全阻障碍3次,障碍历时446分钟,光纤可用率99.97%,同比提高0.09%;二级干线光缆发生全阻障碍4次、障碍历时898分钟,系统障碍1次、障碍历时400分钟,光缆畅通率99.994%,同比提高0.0015%。
本地网光缆全年共发生全阻障碍7次、障碍历时1574分钟、畅通率99.999%,与去年同比(8次,2857分钟、畅通率99.997%)畅通率提高0.002%。
一级干线卫星电路畅通率达到99.94%;
干线微波未发生阻断;
本地网微波阻断时间0.84分钟/每月每百业务波道公里,在指标要求之内。
2、本地网线路指标完成情况:
本地网市话线路合格率:86%
用户障碍申告率:1.26%,同比降低0.10%。
百门障碍历时:391.17分钟,同比降低25.83分钟。
修复及时率:99.06%。
3、服务指标:
端到端电路开通及时率为100%,端到端电路故障修复及时率为100%,端到端电路故障申告率为4.45%;互联网网络时延及丢包达标率98.06%、0.194%;传输电路可用率99.967%。
4、主要通信能力:
......二、2003年完成的主要运行维护工作任务
(一)确保网络安全畅通
2003年全区光缆干线在西部开发造成的光缆线路沿线公路施工、基础建设力度逐年加大的情况下,坚持落实“三盯”制度,通过建立《干线光缆维护动态周报制度》、加强GpS光缆巡检系统的管理和监控中心各项制度和流程的建立实施等,对通信故障的预见、故障抢修时间的压缩和响应速度都有所提高,一、二级干线障碍次数均比去年有大幅度下降:次数减少50%,历时减少68%。全力做好带电割接,今年一级干线光缆线路带电割接13次、二级干线光缆线路带电割接26次、无人站带电割接8次,共占全部割接的93.75%,带电割接中断电路总时长571分钟。全疆共计整治一、二级光缆线路12次,22个中继段,通过一系列施工确保了线路的基础质量和传输质量,在线路安全预防方面达到了显著的效果。
2003年5-6月在全疆各本地网开展了一次防瘫痪、防阻断交换设备维护工作专项检查,落实维护规程执行情况;检查设备运行状态。各级运维部门自查工作层层落实,对存在的安全隐患及时整改,检查工作取得了良好的效果。
根据上半年设备故障统计,2003年8月召开全区机房环境治理电视电话会议,9月下旬组织进行了全区机房环境检查。各本地网对机房多年积累的环境问题进行了比较彻底地清理,改善了设备运行环境,取得了预期效果。
进行了全区三线交越和搭挂的摸查整治工作,全区三线交越共计87446处、搭挂共计3133处、搭挂长度1019.3公里,区公司统一组织购买“三线”交越保护套管38万米,费用228万元。
(二)做好市场支撑、落实业务响应工作:
今年重点落实大客户资料调查和电路保障工作。建立了全区集团大客户故障一站受理体系;整理出大客户电路资料1479家,并着手细化、完善;制定了大客户资料动态管理流程,在全区运维信息发布系统中开辟业务响应专栏,每月定期将中元公司、建行等大客户故障明细表发布在网上;建立了各地州市分公司针对本地故障现象进行详细的故障原因分析制度。针对部分金融大客户电路开放在同一个155M的情况,完成了这些电路在省内干线层面上优化调整。
重视端到端业务响应时效。年初我区端到端电路故障修复及时率仅达75%,运维部对此进行了跟踪调查,协调相关部门,核实中元公司电路资
障申告率仍偏高,接近集团的5%指标,有几个月已超出指标范围。主要问题在于本地网的管理,特别是用户接入部分的维护影响了对客户的服务质量。
(三)本地网综合化集中维护工作,数据专业没有全部纳入运维部门,不能实现各专业集中;受机房搬迁影响,物理平台集中也无法全部在年内完成。动力设备的集中监控率较低,没有达到集团要求。
(四)年来运维部门的维护人员调动频繁,由于人员缺乏,已呈现影响日常维护工作正常开展的迹象。有的分公司参加过培训的人员全部调离,维护队伍人员素质降低,甚至不具备基本的上岗条件,局数据不会制作,简单的日常技术操作无法进行,维护工作停留在表面,很难深入细致。
(五)机房环境虽然进行了一次突击整治,但仅仅依靠几次集中整治是不能能彻底解决问题的。由于机房环境导致设备故障频繁的问题还不容忽视。要落实维护规程,把机房环境维护等基础管理工作进一步规范化、标准化。
[1]
第四篇:通信工作总结(运行维护)
2003年运行维护工作总结
2003年新疆电信运行维护部门贯彻维护就是服务、维护就是经营的理念;将维护工作面向市场,贴近用户,用网络的实力增强企业的核心竞争力;深化改革创新,维护管理和设备运行质量有了进一步提高。
一、2003年全区主要维护指标完成情况和通信能力
1、光缆维护指标完成情况:
全区光缆一级干线发生全阻障碍3次,障碍历时446分钟,光纤可用率99.97%,同比提高0.09%;二级干线光缆发生全阻障碍4次、障碍历时898分钟,系统障碍1次、障碍历时400分钟,光缆畅通率99.994%,同比提高0.0015%。
本地网光缆全年共发生全阻障碍7次、障碍历时1574分钟、畅通率99.999%,与去年同比(8次,2857分钟、畅通率99.997%)畅通率提高0.002%。
一级干线卫星电路畅通率达到99.94%;
干线微波未发生阻断;
本地网微波阻断时间0.84分钟/每月每百业务波道公里,在指标要求之内。
2、本地网线路指标完成情况:
本地网市话线路合格率:86%
用户障碍申告率:1.26%,同比降低0.10%。
百门障碍历时:391.17分钟,同比降低25.83分钟。
修复及时率:99.06%。
3、服务指标:
端到端电路开通及时率为100%,端到端电路故障修复及时率为100%,端到端电路故障申告率为4.45%;互联网网络时延及丢包达标率98.06%、0.194%;传输电路可用率99.967%。
4、主要通信能力:
......二、2003年完成的主要运行维护工作任务
(一)确保网络安全畅通
2003年全区光缆干线在西部开发造成的光缆线路沿线公路施工、基础建设力度逐年加大的情况下,坚持落实“三盯”制度,通过建立《干线光缆维护动态周报制度》、加强GpS光缆巡检系统的管理和监控中心各项制度和流程的建立实施等,对通信故障的预见、故障抢修时间的压缩和响应速度都有所提高,一、二级干线障碍次数均比去年有大幅度下降:次数减少50%,历时减少68%。全力做好带电割接,今年一级干线光缆线路带电割接13次、二级干线光缆线路带电割接26次、无人站带电割接8次,共占全部割接的93.75%,带电割接中断电路总时长571分钟。全疆共计整治一、二级光缆线路12次,22个中继段,通过一系列施工确保了线路的基础质量和传输质量,在线路安全预防方面达到了显著的效果。
2003年5-6月在全疆各本地网开展了一次防瘫痪、防阻断交换设备维护工作专项检查,落实维护规程执行情况;检查设备运行状态。各级运维部门自查工作层层落实,对存在的安全隐患及时整改,检查工作取得了良好的效果。
根据上半年设备故障统计,2003年8月召开全区机房环境治理电视电话会议,9月下旬组织进行了全区机房环境检查。各本地网对机房多年积累的环境问题进行了比较彻底地清理,改善了设备运行环境,取得了预期效果。
进行了全区三线交越和搭挂的摸查整治工作,全区三线交越共计87446处、搭挂共计3133处、搭挂长度1019.3公里,区公司统一组织购买“三线”交越保护套管38万米,费用228万元。
(二)做好市场支撑、落实业务响应工作:
今年重点落实大客户资料调查和电路保障工作。建立了全区集团大客户故障一站受理体系;整理出大客户电路资料1479家,并着手细化、完善;制定了大客户资料动态管理流程,在全区运维信息发布系统中开辟业务响应专栏,每月定期将中元公司、建行等大客户故障明细表发布在网上;建立了各地州市分公司针对本地故障现象进行详细的故障原因分析制度。针对部分金融大客户电路开放在同一个155M的情况,完成了这些电路在省内干线层面上优化调整。
重视端到端业务响应时效。年初我区端到端电路故障修复及时率仅达75%,运维部对此进行了跟踪调查,协调相关部门,核实中元公司电路资料,将相关地州市分公司的7*24小时工位电话报至大客户网管中心,使故障直接派发到基层维护人员,制定调度流程,制定出相应的应急方案,对障碍进行全程跟踪,形成障碍处理闭环管理。
使我区的“电路故障修复及时率”指标在后续几个月内达到了100%。
积极压缩大客户障碍次数。我区6—7月份出现大客户电路障碍次数偏高现象,其中乌鲁木齐本地网障碍次数占总数的50%,运维部重点对乌市电信分公司每月故障原因进行分析,分清可控因素和不可控因素,指导分公司针对可控因素采取有效措施,使后续几个月本地网障碍有所减少。
做好对市场前端的支撑,协助区公司市场部与新疆额尔齐斯河流域开发工程建设管理局500水库管理处签定乌市水管处至500水库管理处的光纤(一对)租用协议,并紧急协调建设了准东电信局-500水库管理处的11.3公里光缆线路。配合大客户部门进行军区、兵团通信情况调查和合作协议谈判。
(三)做好专业化维护工作
一、新组建了数据技术支援中心,完成了宽带数据支撑系统整合、工商局联网、全疆VpDN等项目;组织实施省Ip骨干网路由双备份、中继提速、整合等网优工作;进行全疆专业组巡,对大客户部门进行技术支撑。通过实时流量监控系统,发现并解决和田、阿勒泰等地州因为蠕虫病毒导致的Ip网络速度不稳定的问题。成立了互联网安全中心,实现区内从省公司到本地网上下连动的网络安全保障流程;自行二次研发完成互联网全疆流量监控系统、Ip网络质量监控系统,实现了实时监控,减少了本地网手工测试工作量;建立了模拟机房,可通过INTERNET为地州维护
人员提供设备操作训练环境。机房现有各种设备四十多台,基本可满足现场和远程培训需要。
整合区网管中心,将原来由区公司负责的乌鲁木齐二枢纽网管中心移交到了乌鲁木齐市分公司,建立多专业集中化综合网管。
pHS支援中心进入了全面参与网络组巡、优化和工程建设的时期,全员深入南北疆累计达到853人(次)。对全疆15个地州市的pHS网络进行了组巡,每周定期对网管数据进行分析、上报。对喀什、和田、巴州、阿克苏4地州的县局进行前期的网络规划,并先后赴五家渠等15个县局进行开局工作。
建立了的pHS模拟机房,通过在模拟机房给设备加电、修改参数、开局等工作提高了维护水平和工作效率。
交换技术支援中心今年共计受理故障申告150件,其中赴现场解决69件。通过本地网集中监控终端对各地州市的S12设备进行软件数据检查并解决发现的问题。负责处理了全疆《pCDM管线录入系统》、《本地网集中监控系统》、《本地网网管系统》和《全疆资源管理系统(非管线部分)》的安装、维护、升级、调优工作。承担了新疆本地电话网集中监控管理系统等八项工程的建设单位。同时在工作中穿插或专门组织了部分现场培训,使地州分公司维护力量不断加强。
传输设备技术支援中心完成全区技术现场支援99次,调拨备用机盘200余块、返修249块;参与了奎屯枢纽楼、克拉玛依机房整治、库尔勒机房搬迁等割接工作;参加全疆二级干线45个无人站传输设备辅助通道测试,配合厂家完成了华为、NEC、时钟同步网设备的组巡。
此外,完成了全疆20跳本地网微波设备的更新、VSAT数据扩容和全疆23座本地网微波铁塔的更换工作。
成立各专业虚拟维护专家组,开展了专业有奖论文活动。
(四)运维专项重点工作
1、网络优化
在省内传输干线层面上,为提高重要大客户电路安全可靠性,进行了240×2M出租电路的调整。截止目前,重要出租用户电路均已调整到具有自愈环保护功能的DWDM系统上。
配合省内pDH设备退网工作实施,将开放在pDH系统上的电路进行了调整。配合省内数据网优化方案实施,进行了数据155M、2.5G电路的开放及调整工作。在中秋、十一等节日期间,临时增开省级、省内交换电路100×2M疏缓了节日期间通话量骤增现象。
数据专业实施了省Ip骨干网路由双备份。在吐鲁番、克州、和田、塔城、博乐、阿勒泰新增第二条中继,至此,全疆每个出口路由器均具备两条路由。组织协调Ip骨干网中继的提速,在三月份新增两条155M出疆中继,使得中继总和达到900M,在11月份,将出疆中继提升到2.5G,另900M作备份中继。组织实施Ip骨干网整合,将Ip网络由三层网络转变为两层网络。
交换专业从2003年9月开始,针对准直联信令网相连接的网元上实施了七号信令准直联网负荷分担工作,改变了原七号信令准直联网负荷分担不均的现象。
全疆七号信令监测系统建成运行,监测了所用互联互通信令链路,为互联互通相关工作的开展提供了依据。完成了DC1长途交换机、HSTp交换机版本升至CHB12、17908业务由原专用平台割接至省内智能平台。配合建设部完成了交换网三期网改、全疆六个地州市分公司新疆关口局及省内第二套智能平台等建设项目的立项、技术方案确定及招标等工作。
2、通信机房安全整治
通信机房安全整治的主要工作是机房内三线分离、门窗封堵、机房布局调整等内容,从今年3月份开始分批实施。为保证在运行设备机房大规模施工安全,项目小组积极组织做好前期准备工作,先易后难;严格防尘措施、严审设计方案、严把电源割接,对机房整体环境进行了彻底整治。目前第一批整治的通信枢纽楼机房中,奎屯分公司已完成全部机房整治工作验收,昌吉、克拉玛依、伊犁工程量已完成大半。第二批喀什已通过设计会审,吐鲁番、阿克苏正在设计查勘阶段,年底可基本完成全部工作量。区公司于11月在奎屯分公司召开了通信机房整治现场会,在全区全面推广。整治后,实现了三线分离,消除了安全隐患,对机房的布局进行了调整,为机房无人职守、实施综合化集中维护打下了基矗
3、本地网线路整治
在对2003年整治工作进行安排时,坚持早计划、早部署,并注意加强过程管理。下发了《关于2003年全区本地网线路整治工作有关问题的通知》等有关文件。组织召开了有实业公司主要负责人参加的整治工作培训班。认真作好2003年本地网线路整治设计预算审核工作,共审核十六个地州市232项预算、下达整治费用8300万,7月到10月与区实业公司共同组织对全区16个本地网线路进行了检查,并对2002年下半年批复的整治工程进行了验收,针对每个本地网检查情况下发了检查通报。
为配合ADSL等数据业务开放,针对全疆主干电缆保气率长期不能达标的现状,全区统一增换充气机229套。在整个安装过程中进行全程跟踪,保证了设备安装和运行良好。
为了保持整治效果、避免前整后乱。要求各分公司按季度上报维护作业计划,按月分别上报维护量统计与维护质量统计,我部对作业计划落实情况进行不定期检查。
通过两年的整治,线路质量得到了提升,各项维护指标均有不同程度的提高,百门障碍率较去年同期减少0.24%;障碍修复及时率较去年同期提高0.20%,电缆保气率86.1%,较去年同期提高15.83%;资料准确率97.01%,较去年同期提高11.45%。
4、DWDM机盘清洁除锈
针对全区DWDM系统设备机盘生锈、故障率偏高的问题,经过与设备供货方NEC公司多次艰苦谈判,决定从今年4月开始进行设备机盘清洁除锈工作。此项工作由传输设备维护中心担任,施工现场大部分在塔克拉玛干沙漠边缘的无人站房。施工人员在艰苦的环境里克服各种困难,加班加点,历时
5个多月,完成了25个局站、250块在用机盘、108块备用机盘和28个在用子框的清洁、除锈、防腐处理工作。同时对全疆78个光缆无人站房进行了标准化整治,在南疆片区安装站房防沙门29个,对40个站房通风口做了防尘过滤处理,对17个站房地面进行了硬化。机房环境达到优良,无人站设备故障率由70%下降到55%。
5、本地网综合化集中维护工作
根据集团公司统一部署,区公司成立了本地网综合化集中维护工作领导小组和工作办公室。结合我区实际,制定了《新疆电信公司本地网综合化集中维护工作指导意见》和《本地网综合化集中维护工作实施方案指导意见》。结合BpR流程重组,对各本地网的组织架构及实施方案进行了审核批复,统一制定了五大类十个专业的业务和障碍受理流程和网络监控中心障碍受理流程,采取轮岗等多种形式开展了多专业交叉培训,各分公司已完成工作项目验收自查。目前,11个本地网已完成各专业物理平台集中、9个单位完成数据专业纳入、6个本地网完成组织机构调整、8个本地网实施了一点受理与闭环管理、2个本地网完成流程修订并开始执行、14个本地网开展了人员培训。今年全区将努力争取达到集团A级验收标准。
6、本地网网络资源集中管理
今年的清查工作由省会城市向全区各本地网逐渐扩大。区公司年初统一下发了2003年本地网网络资源工作指导意见、动态管理和考核实施细则,组织了两次全区工作检查。各本地网对城区和县城的主配线管线、光缆资源进行了全面清查。管线资源清查投入约2500万元、非管线资源系统投入近1000万元。目前,十六个本地网全部完成主城区管线清查,数据入库率达到100%,从清查进度上基本达到了、集团公司要求。各地配线清查已达到60%、25%的录入工作量。各本地网完成了本地网资源管理系统软硬件安装调测任务,全部完成物理数据清查,部分本地网进行了逻辑关联数据录入。城区管线资源的清查入库意味着资源管理工作起步阶段最为艰巨的攻坚战已接近尾声,前期准备工作即将完成。资源数据将从相对静态的清查整理进入动态管理的新阶段。同时本地网网络资源管理核心队伍初步形成,各级管理人员对资源集中管理的认识不断深化。
初步启动了清查数据的动态管理工作。各分公司针对实际情况进行了有益的探索。其中乌鲁木齐、伊犁、哈密、昌吉等分公司通过相关部门的共同努力,从施工源头抓起,建立和落实了有效的动态管理体系,使清查数据的准确率得到了保证。
7、ISUp改造及规范网间主叫号码传送
在2002年完成了所有DC1平面及省内DC1至DC2,省内DC2之间长途电路的ISUp改造工作的基础上,2003年在全网组织实施了第二阶段的ISUp改造工作,使全网最终达到统一采用ISUp信令方式,提升网络对ISDN及其补充业务的支撑能力。
今年,规范网间主叫号码传送工作正式在全网实施。共涉及16个本地网78个县业局的近200个端局,实施难度相对较大。目前工作已进入收尾阶段,年底将全面完成。
(五)深化运维管理工作
1、网络分析
为了进一步提高网络运行分析工作的时效性、纵向深入性及横向联合性,我部定期召开网络分析会,下发了《关于进一步做好全疆网络分析工作指导意见》,对全疆各分公司的网络运行分析工作统一做出基本要求,逐步在各本地网推行从日到周到月的网络运行分析制度,并下发了部分分析模板。各地州市分公司在此基础上,结合各本地网的实际情况进行了细化和落实。使全疆的网络运行分析工作逐步向支撑市场经营决策,提高网络服务质量,降低企业运营成本的发展目标迈进。
2、网络运行生产调度
网络运行维护生产调度制度自2003年3月开始实施,各单位每周定期上报网络运行周报,区公司运维部各专业主管通过周报对各单位提出的问题及时反馈和协调解决。运维部每月召开由各技术支援中心、网管中心和区大客户部门共同参加的网络质量分析生产调度会议。出版网络运行简报十期,共收集31周、393份周报。网络生产调度工作在节假日重要通信保障、应急预案修订落实、网络安全、通信障碍传报等方面进行了协调布置,绝大多数网络运行质量问题得到及时解决或反馈,为保证全网运行质量,建立应变机制,形成上下沟通的闭环管理起到了积极的作用。
此外,在运维考核的管理上,变结果考核为过程控制。加强了维护管理工作的时效性,保证各项指标完成良好。
3、维护成本管控:
根据集团公司的要求,对维修费管理做了积极地探索,首先明确了各部门的职责,制定了修理费管理办法,落实管理制度。区公司指导各分公司运维部在全面预算管理的基础上,按照专业定额制定维修费预算。每月度、季度汇总上报包括维护和财务两个部门的维修费支出情况。分专业统计后,对各专业所需的修理费有了一个初步分析数据,为今后进一步做好维修费定额测算打下了基矗由于此项工作今年刚开始实施,各分公司管理水平参差不齐。其中伊犁分公司运维部能够认真按照区公司的要求,对发生的每一笔维修费进行登记,月底与财务部进行核对,对不符之处进行了解,较好地做到了对维修费的管理。
在日常维护中注重合理使用维护费,节约维护成本。今年根据新业务开放和军区光缆建设情况,租用了喀什-塔什库尔干南疆军区光缆上开通的5个2M电路,并将其中一个2M倍增为8个2M.停用了喀什-塔什库尔干的卫星电路及NECVSAT卫星电路,一年节约转发器租费159.38万元。
加强闲置设备管理。成立了闲置设备调配中心,并初步展开工作,将各地州分公司的闲置设备集中调拨管理。今年对奎屯、阿克苏分公司进行了调查清理,为各分公司和技术支援中心调拨传输、交换、数据、电源闲置设备25套,价值近千万元。
(六)应急通信工作
支撑大网、保障通信。2003年
2月为喀什地区伽师—巴楚地震灾区提供应急通信保障,新疆电信公司得到了自治区领导和各新闻媒体的一致好评,被评为自治区抗震救灾先进单位,受到集团公司通报表彰。
在完成好应急通信保障、大网支撑的同时,坚持“平战结合”的原则,积极进行市场开拓。新疆机动通信局先后为克拉玛依石油钻井公司等单位进行了大量的数据、语音、图像的演示工作,用户反响强烈,签订了出租60套VSAT小站地协议或合同。现已出租48套VSAT小站设备、光缆1条,全年可收入70万元。通过努力,VSAT市场的开拓必将为新疆电信创造出了一个新的利润增长点。
完成了对新疆党政专用电信局的剥离工作。
三、2003年运维工作存在的问题
(一)网络安全还存在薄弱环节。由于我区出疆网络不够完善,目前基本无备用信道,一旦光缆干线或设备发生障碍,则由于不能及时完成自动倒换和人工调度工作而造成指标无法完成。面对出疆干线故障造成的申告次数骤增情况,对故障的应变可控性较弱。
全疆网上发生多起通信障碍,暴露出机房维护及安全方面还存在不少问题。其中机房漏水造成交换机板件烧毁、瘫痪故障2次;由于施工操作不慎致使全局瘫痪或系统阻断2次;强电入侵造成设备烧毁2次;由于设备故障和维护人员操作失误、维护水平原因造成事故多次。很多故障是维护部门管理上的问题,是可以通过加强维护力度得以提前发现和避免发生的。
全网发生多起通信障碍,暴露出机房维护及安全方面还存在不少问题。其中机房漏水造成交换机板件烧毁、瘫痪故障2次;由于施工操作不慎致使全局瘫痪或系统阻断2次;强电入侵造成设备烧毁2次;由于设备故障和维护人员操作失误、维护水平原因造成事故多次。很多故障是维护部门管理上的问题,是可以通过加强维护力度得以提前发现和避免发生的。
(二)端到端电路故障申告率仍偏高,接近集团的5%指标,有几个月已超出指标范围。主要问题在于本地网的管理,特别是用户接入部分的维护影响了对客户的服务质量。
(三)本地网综合化集中维护工作,数据专业没有全部纳入运维部门,不能实现各专业集中;受机房搬迁影响,物理平台集中也无法全部在年内完成。动力设备的集中监控率较低,没有达到集团要求。
(四)年来运维部门的维护人员调动频繁,由于人员缺乏,已呈现影响日常维护工作正常开展的迹象。有的分公司参加过培训的人员全部调离,维护队伍人员素质降低,甚至不具备基本的上岗条件,局数据不会制作,简单的日常技术操作无法进行,维护工作停留在表面,很难深入细致。
(五)机房环境虽然进行了一次突击整治,但仅仅依靠几次集中整治是不能能彻底解决问题的。由于机房环境导致设备故障频繁的问题还不容忽视。要落实维护规程,把机房环境维护等基础管理工作进一步规范化、标准化。
[1]
第五篇:运行维护相关
网络运行维护管理工作制度
网络的运行维护管理是网络管理的一项经常性的工作,网络的运行维护管理包括通信维护管理(交换机、路由器、光纤、双绞线),应用维护管理(服务器、网络安全设施,操作系统及应用系统)及用户维护管理(用户的权限,用户的咨询及用户的培训)等部份,为了做好网络运行维护管理工作,特制定本制度。
一、网络通信设备、网络操作系统及应用软件的维护管理
1.根据网络的使用情况及时检测、调整网络通信设施的状态参数,力求使网络通信设施处于最佳运行状况。
2.对于网络通信设施的一般性调整(局部性),由网络通信设施管理人员自行实施,在调试完毕后,务必保存现行的运行配置,并在值班日志上做纪录。
3.对于网络通信设施的重大调整,必须报分管技术的主任,并经分管主任协调审定后方可实施,实施务必保存调整前运行配置及现行的运行配置,并在值班日志上做纪录。
4.对于改动的运行调整情况,在每周召开的中心会议上通报全体人员及时掌握情况。5.以周为单位,建立主值班制度,主值班人员在值班期内负责运行状况的监测、记录,负责完成一般性调整工作,及时向各管理负责人报告值班期内重大事件,请示处理意见,并参与实施。
6.运行维护必须检测记录下列情况。DNS、WEB 的运行状况、核心路由器、交换机的带宽占用情况、数据包的协议分类情况、丢包情况,并根据检测情况及时调整网络状况。
7.详细记录设备的故障情况及故障处理的情况。
8.及时安排处理用户报修的网络通断问题,保证网络设备及线路的畅通。
9.维护管理如果影响到用户的工作,必须事先报告网管中心主任批准并通知用户,再进行调整。在调整过程中尽量将影响范围及时间控制在最少。
二、用户管理
1.热情为用户服务,在服务过程中热情礼貌。做好规章制度的宣传解释工作。
2.及时作好用户的开户,销户工作,保留好用户的有关资料。
3.加强对用户的宣传培训工作,提高用户上网时的遵章守法意识,提高用户在上网时的操作水平、自我保护意识及用户单机的维护水平。
4.做好用户上门及电话咨询工作,耐心细致,热情服务。
5.用户服务应作好服务记录。
强化运维体系建设,提升系统服务水平
─ 加强运维流程管理。进一步完善运维管理流程,健全运维管理制度和标准,重点加强事件管理、问题管理、变更管理、配置管理等关键管理流程和数据管理、机房管理等制度标准建设与执行力。加强管理流程整合,完善信息交互机制,形成闭环管理。强化事件分级制度,建立有效的事件升级及响应机制;加强事件后续分析与处理,不断优化管理流程;建立变更分类标准和变更分级审批流程,完善变更窗口管理制度,有效降低变更对生产运行的负面影响;制定配置参数移植、修改、备份、存储、更新、销毁等方面的管理制度,控制配置操作引发的风险。完善数据存储、使用、传输以及备份管理,进一步制定标准、规范,重点强化客户信息和经营分析数据等敏感数据访问控制、清理、销毁以及数据变形使用管理;进一步加强机房人员、供电、空调、防火管理。
─ 加大集中监控及一体化管理力度。健全生产系统软硬件、网络及应用系统性能监测指标体系,优化监控策略;在实现对系统、设备、网络、基础环境等监控基础上,重点加强对核心应用系统和电子银行渠道监控;构建统一监控平台,统一管理和展现各种监控资源,实现集中告警方式,全面、及时掌握系统整体运行状态,快速定位故障、缩短处理时间;加大对总分行监控系统整合力度,提高总行对分行生产系统监管能力,进一步完善监控、响应、处理、报告、反馈和跟踪机制,实现全行范围基础设施和主要应用系统生产运行情况的全面监控,提高运行管理的全面控制能力。提高运维管理自动化水平,整合操作、维护、监控、响应、处理等管理流程,推进企业级总控中心(ECC)建设,促进运维管理一体化。
─ 加强应急处置,提高协作能力。建立健全应对突发事件的预警、报告、决策、指挥、响应及退出等环节的应急处置机制。制定监测指标,实时监测业务运行状态,及时发现异常情况,及时预警;建立清晰的报告流程,明确报告路线;建立应急指挥、决策体系,统筹协调,高效决策,保证指挥流程畅通;制定应急处置响应流程,加强关键岗位人员配置。
建立应急预案一体化管理体系,建立涵盖总体预案、专项预案等预案框架;统筹预案管理,加强预案之间的衔接与配套;建立有效的预案维护机制,涵盖预案制定、评审、发布、变更和回收过程;制定预案编制规范,保证预案编制质量;强化预案后评价与持续改进机制,保证预案有效性。
─ 完善灾备体系,提高灾难恢复能力。根据风险战略与业务连续性目标,制定灾难备份体系建设策略与实施路线;以业务有效恢复为目标,逐步加强灾备体系建设;逐步加大数据、系统、基础设施等各类资源的保护范围以及恢复能力。
─ 加强应急演练力度,保证应急灾备体系的有效性。加强应急演练,加大演练频度、扩大演练覆盖范围,采取计划性、非计划性等多种演练形式,有效验证应急响应及灾难恢复流程、决策机制、指挥体系、报告渠道、资源保障效果与能力,通过演练提高认知、完善技能。逐步推进以真实业务接管为目标的实战演练,逐步加大实战演练频度,全面提高应对重大突发事件能力。推进跨地域、跨机构、跨行业应急演练,加强合作、相互支持、共享经验,促进行业以致社会整体应急管理水平的提高。
运维标准化的工作理念:以客户为中心提供IT服务;
提供高质提供的服务是准确计价的
量、低
成本的服
务;
。机房日常事件发生请求:
2、数据中心监
1、客户请求
控报警
3、巡检中发现的异常
1、客户请求:当收到客户请求
要求运维人员对设备、数据和无法远程完成的操作提供服务时,运维应与客户核对三项或三项以上客户信息,保障数据操作
安全。
2、数据中心监控报警:运维人员收到监控软件的报警信息时,应立即对报警信息进行分类和识别,详细地做好记录 并诊断、提供初步的技术支持,视情况而是否向上级领导报备。
3、巡检中发现的异常:运维人员应每天定时定点对机房进
行巡检,发现设备或数据异常时,应立即对异常信息进行分类和识别,详细地做好事件记录并诊断、提供初步的技术支持,视情况而是否向上级领导报备。客户请求 自动监测事件 巡检事件 事件的识别和记录 分类、初步技术支持 调查和诊断
请示直接上司或与相关技术人员沟通 解决和恢复
应急安全事情的处理方案
安全应急事件等级分类和相应的处理流程 根据应急事件的特点及实发事件所产生的损失程度,将应急事件分为三级:
1、一般应急事件 单一地点的网络故障或服务器受损,如:局部网络瘫痪、个别设备死机,对该地点的系统运行及业务运作造成严重损害,持续时间小于24小时的事件(超过24小时的事件为较大应急事件)。
处理流程:判断事件原因——事件分类(确定为一般应急事件)——初步技术支持(保障系统和公司业务正常运做)——调查和诊断——解决和恢复——事件的记录——事件的关闭——问题管理
2、较大应急事件 两个及以上地点的网络故障或服务器系统受损,如:较大规模的网络瘫痪、个别硬件设备损坏或遗失。对该地点的系统运行及业务运作造成严重损害,持续时间小于24小时的事件(超过24小时的事件为重大应急事件)。
处理流程:判断事件原因——事件分类(确定为较大应急事件)——初步技术支持(保障系统和公司业务正常运作)——向上级领导报备并提供解决方案——调查和诊断——解决和恢复——事件的记录——事件的关闭——问题管理
3、重大应急事件 多个(两个及以上)地点系统瘫痪,对业务运作造成巨大损失的安全事件以及火灾或遭可抗拒力破坏机房造成损毁和人员伤害等。
处理流程:判断事件原因——事件分类(确定为重大应急事件)——初步技术支持(保障公司业务数据和设备安全)——向上级领导报备并提供解决方案——调查和诊断——解决和恢复——事件的记录——事件的关闭——问题管理
二、应急文档的备存
1、各类网络设备和服务器、PC及其附属设备的型号、序列号等;
2、硬件设备供应商、生产厂商的电话、联系人、网址;
3、操作系统、关键业务应用软件开发商或供应商的电话、联系人;
4、网络拓扑图;
5、路由器、防火墙、入侵检测设备的配置文档,服务器登录用户及原始密码文档;
6、各类软件的技术文档及其他需要保存的文档。
三、应急设备及软件备存
1、正版的操作系统启动盘、安装盘;
2、正版的防病毒软件(注明安装及升级序列号);
3、数据库管理系统软件,数据库备份软件及最近完整的数据备份存储介质;
4、相关的设备驱动程序(含主板、显卡、网卡等)及更新到最新的服务器注册表文件;
5、备用网线、万用表、测网仪、螺丝刀等必要工具;
6、其他必备的应急工具。
四、日常预防管理
1、定期检查服务器和网络设备;
2、及时更新服务器的防病毒软件病毒库;
3、定期对所有服务器进行漏洞扫描、补丁修复;
4、定时备份重要数据;
5、实行值班制度。
五、预警机制 预警信息分为外部预警信息和内部预警信息两类。外部预警信息指本公司外突发的可能破坏网络或者最新病毒等可能产生重大影响的事件警报;内部预警信息指单位内通信网络的中断或部分计算机系统奔溃对业务操作有影响的事件警报和运维人员在机房定时巡检中发现的服务器和设备的异常。运维人员在获得外部预警信息后,对预警信息加以分析,通知公司各部门做好预防和网络保障应急准备工作,并报备上级领导;通过监控软件或机房巡检获得的内部预警信息,分析后按照早发现、早报告、早处置的原则,避免可能演变为严重应急事件的情况。
六、应急事件处理
1、确定事件类型 1)、运维人员及时判断事件的类型和紧急程度; 2)、确定事件范围(多少地点发生事件),检查敏感信息失密情况及其程度,分析攻击来源及侵入点。3)、判断事件危害性及损失程度、分析人为原因、事件潜在危害性;4)、确定事件发生时间及延续时间; 5)、判断需采用的方法及准备处理事件需要的必备资源; 6)、根据损失程度及延续事件等情况确定等级,较大、重大信息的报警信息需报备上级领导,采取相应的措施之后启动应急预案。
七、事件报告
1、报告方式
1)、根据事件的类型及紧急程度及时向上级领导报告(口头或书面报告),并制定具体措施;
2)、运维人员在收到监控软件报警或发现机房巡检时发生异常,识别分析之后需要对设备进行下架检查或需查看系统、数据等信息时,应本着尽快解决故障的原则对上级领导报备,如需其他部门同事的协调解决也应及时反馈。
2、报告内容 事件的基本信息(故障发生的时间、故障点、故障情况)、事件的类型、表现出来的现象、涉及的网络,事件当前的状态及可能造成的后果,以及事件解决的建议和措施。
八、现场处理
计算机病毒
1、断网、升级系统补丁及防病毒软件,查找病毒源,进行杀毒;
2、查找不出时,应向有关部门进行报告,提供病毒样本;
3、查找计算机病毒感染的存储介质;
4、对病毒利用的系统漏洞要通过补丁和升级的方式进行填补。
5、记录全部处理过程。
黑客入侵
1、记录系统状况
2、立即复制系统登录文件、历史文件、日志文件等重要文件;
3、修改防火墙、路由器等网络安全设备的过滤规则。
4、断开被攻主机、关闭不需要的服务。
5、处理可疑的文件和程序;
6、修改不安全的帐号和口令;
7、恢复被修改的的软件和数据。
8、安装相应的补丁程序,填补安全漏洞。
9、编写报告,详述事件过程及处理步骤。
备注:采取必要措施抵御入侵行为,保护系统和数据安全,利用完整性检查工具进行检查,必要时向公安机关报告并申请技术协助。
局域网无法使用
1、磁盘陈列(存储介质)设备问题:用同规格的备用硬盘进行替换,其他故障要及时与供应商联系修复;
2、服务器问题:启用备用服务器,通过热备服务服进行双机热备恢复(包括数据服务配置)。提供故障服务器型号、序列号并与服务器供应商联系,取得技术支持,检查服务器软件,将原有数据信息存盘并实施用户数据备分后移支正常服务器上使用,并与软件供应商联系,尽早解决问题。
3、路由器、交换机、防火墙等硬件故障:使用备份端口或备份硬件,并检查或配置相关内容,与供应商联系,尽早解决问题;
4、通信线路故障:用测网仪进行测试,用好的网线进行替代,关键业务使用应急通信线路,向受影响的单位发出通报,立即与线路供应商联系,在线路供应商承诺的时间内解决问题。
5、网络带宽阻塞:通过网管软件,判断阻塞原因及阻塞包发包点,再按情况逐个断网排查,直至网络恢复正常。对已断网计算机进行系统补丁升级、查毒等方式,找到原因并恢复正常后方能接入网络。
广域网无法使用
1、路由器、交换机、防火墙等硬件故障:使用备份端口或备份硬件,并检查或配置相关内容,与供应商联系,尽早解决问题;
2、通信线路故障:关键业务使用应急通信线路,向受影响的单位发出通报,立即与线路供应商联系,在线路供应商承诺的时间内解决问题。
3、网络带宽阻塞:通过网管软件,判断阻塞原因及阻塞包发包点,再按情况逐个断网排查,直至网络恢复正常。对已断网计算机进行系统补丁升级、查毒等方式,找到原因并恢复正常后方能接入网络。
数据库无法正常使用
1、记录故障情况;
2、检查数据库服务是否启动,若未起,则重启数据库服务;
3、检查文件系统,若有问题则在备份重要数据文件后用文件修复软件修复;
4、与数据库供应商联系,取得技术支持;
5、重装数据库;
6、分析原因,编写报告,详述事件过程及处理步骤。
核心设备无法正常使用
1、检查核心设备无法正常工作的原因
2、系统软件故障:和相关负责人联系,尽快恢复工作
3、硬件故障:及时报告上级领导并查找、确定故障设备及故障原因,进行初步处置,同时联系设备供应商共同检测并排除故障。
4、若短时间之内无法修复,应启动备份设备,保持系统网络正常运行,将故障设备脱离网络,进行故障排除。
5、故障排除后,在网络空闲时期,替换备用设备,如故障仍然存在,立即联系厂商进行返厂维修或调换设备。
断电
1、启动应急电源;
2、使用备用UPS进行供电;
3、与相关部门联系,尽快恢复供电;
4、若在UPS供电时间范围内不能恢复供电,要在UPS能正常供电的时间段内进行对主要系统及数据进行备份工作,备份工作完毕后,对主要设备进行系统关闭,请示上级领导后,关闭非关键设备,确保关键设备供电。
火灾
1、立即发出火灾警报并报告;
2、根据情况立即断电;
3、有秩序、有步骤地抢救数据资料和硬件设备
4、火险情况解除后,尽快检查并恢复应用系统的工作。
事件后期恢复及评估
1、清理系统、恢复数据、程序、服务。把所有被攻破的系统和网络设备彻底还原到它们正常的任务状态。恢复工作应该十分小心,避免出现误操作导致数据的丢失。另外,恢复工作中如果涉及到机密数据,需要额外遵照机密系统的恢复要求。
2、备份硬件设备或配件代替使用后,应及时将损坏设备进行维修或者更新。
3、检查威胁造成的结果,评估事件带来的影响和损害:如检查系统、服务、数据的完整性、保密性或可用性,检查攻击者是否侵入了系统,以后是否能再次随意进入,损失的程度,确定暴露出的主要危险等。
九、事件总结记录
每次应急事件处理完后应对此次应急事件进行分析,形成总结报告。报告应包括事件类别、事件发生时间、有无预警信息、事件所造成的影响、参与人员、采取的措施和效果、事件的损失评估、经验教训等内容。并及时向上级领导报备。运维工作的注意事项:
1、值班人员交接班时应注意帐号的登出登入,做好工作交接记录,检查上位在岗运维是否编写值班事件记录、事件记录是否全面详细、有无事件的最终解决方案。
2、收到监控软件报警和巡检时发现的异常,应做好事件识别分析和记录,需要对设备进行上下架检查时,应报备上级领导;需要查看系统、数据以解决问题时,应请示上级领导后方可;需要其他部门的协调解决时应及时与相关同事进行沟通。
查看系统、数据以解决问题时,应请示上级领导后方可;需要其他部门的协调解决时应及时与相关同事进行沟通。