第一篇:Notes邮件系统管理维护及典型故障分析
Notes邮件系统管理维护及典型故障分析
从Lotus Domino服务器系统的监控、维护、服务器系统重要文件的备份操作及系统优化等方面介绍了Domino服务器的管理维护方法;分析了Domino服务器和notes客户端的典型故障,给出了具体的故障解决思路及方法。Lotus Domino服务器的管理维护
1.1 Lotus Domino服务器系统的监控
(1)管理员需要特别留意服务器的日志(文件名Log.nsf)。Log.nsf中的信息是了解服务器及用户活动的关键。特别是日志中的“其它事件”视图,包含了大部分需要查看的信息。管理员每天都应当浏览log.nsf,从中找出错误信息和异常信息,判断服务器是否正常运行。
(2)在Domino服务器上.有一个用于监测服务器状态的数据库:Statistics&Events数据库(Events4.nsf)。当服务器的状态达到或超过管理员设定的警戒值时,它还可以自动提醒管理员。管理员应该建立监视器来监测服务器的一些基本状态。
(3)为使Notes系统充分享用系统资源.建议不要在Domino服务器上安装安全软件以外的其它软件。
1.2 Domino系统服务器的维护
在日常的管理维护中,应注意做好Domino系统服务器杀毒软件、防火墙的及时升级,操作系统补丁、Domino补丁的及时修补;同时因为用户经常删除邮件,一定时间后会产生很多磁盘碎片,建议定期对磁盘进行碎片整理,以加速程序的运行,提高系统运行效率。
1.3 必要的备份操作
进行备份时,所用的备份软件必须支持对打开的文件进行备份。这是因为通讯录(names.nsf)和服务器日志(1og.nsf)等数据库在服务器运行时总是打开的,如果备份软件没有这个功能,那么这些关键数据库就得不到备份。
既要定期(一般是每天)备份.也要定期检查备份所用的介质(如移动介质、磁带等)健康状况。这样可以避免因介质损坏而引起的不必要的损失。Domino/notes邮件系统典型故障
2.1 Domino服务器典型故障分析
(1)处理滞留在服务器邮箱(mail.box)中的“死信”或“保留”邮件
当Domino暂时无法邮递消息时,该邮件会保留在MAIL.BOX中。MAIL.BOX还包含“死信”消息.Router无法邮递死信,也无法向发件人传送一条表明无法邮递的失败消息。例如:当www.xiexiebang.com收件人地址错误键入而发件人邮件服务器又无效时。
管理员应定期查看MAIL.BOX中的内容.在Domino Administrator中。选择“消息处理”标签。
①在“路由邮箱”中选择要查看的MAIL.BOX:
②在屏幕的右侧会显示MAIL.BOX的内容,检查是否有“保留”消息和“死信”消息;
③查找到无法邮递的消息(标记为“保留”和“死信”)时,可以执行以下三种操作之一:改正此消息的收件人地址、释放此消息、删除此消息。(2)服务器端提示“Mail.box被破坏” 处理过程:运行Fixup服务器程序,如果不能解决问题。可以压缩Mail.box,如果仍然有问题,执行下面的步骤:
①关闭Lotus Domino服务;
②重新将notes\data\目录下的Mail.box文件更名,如可以把它改为oldmail.box。
③重新启动Lotus Domino服务,服务器会自动生成一个新的Mail.box文件。
④ 从oldmail.box中将未被破坏的文档拷贝到新生成的Mail.box中。(3)误删除管理员用户,如何恢复? 假定Domino服务器安装在“D:Aotus/domino/”,在开始菜单“运行”输入:d:/lotus/domino/nlnotes.exe 然后输入服务器id的El令,打开要操作的数据库。直接修改acl即可。
(4)服务器端提示类似‘xa.nsf’is CORRUPT—Now Read—Only!的信息,即“数据库已损坏,请重新分配空间”。
2.2 Notes客户端典型故障分析
(1)当Notes客户端软件异常退出后,再次启动notes程序,系统提示要重新启动计算机。
分析及处理:Notes异常退出后,会在内存中生成一个I临时进程nhldaemn.exe,只要使用任务管理器.强制关闭进程nhldaemn.exe,就可以不重启计算机.而马上再次运行Notes。
(2)打开Notes时,提示“The remote server is not a known TCP/IP host”提示信息如图1所示:
分析及处理:提示远程服务器是未知的主机。Notes一般基于hosts文件中的Domino服务器名及对应的IP信息连接服务器,若系统hosts文件未加入正确的Domino服务器名及对应IP。就会出现这样的提示。用记事本打开C:\windowsksystem32\drivers\etc目录下的hosts文件,添加上Domino服务器的IP及host name。添加上述内容后,Notes恢复正常。
(3)发送邮件时提示“cannot allocate databaseobject-database would exceed its disk quota”。提示信息如图2所示:
分析:这种情况是因为用户邮件数据库文件超出了Domino服务器端设置的数据库限额大小,大多出现在用户发送带附件的邮件时。此时邮件往往发送不出去;如果是发送无附件的邮件,有时可以发送出去。
处理:删除过期邮件,再压缩数据库释放已删除邮件占用的空间,即可恢复正常。结语
掌握Lotus Domino/notes服务器系统的管理维护和常见故障的分析与处理,能使管理员工作时如虎添翼;用户学习了解常见故障的分析与处理,可以更安全高效的使用notes,提高工作效率。通过对典型故障的分析与研究,能总结经验,发现规律,进一步提高技术人员及用户分析问题、解决问题的能力,保证了在以后使用Notes邮件系统时少走弯路,提高工作效率。
第二篇:继电保护典型故障分析
继电保护典型故障分析
摘 要 继电保护对电力系统的安全正常运行具有重要的作用,它能保证电力系统的安全性,还能针对电力系统中不正常的运行状况进行报警,监控整个电力系统。目前我国电力系统继电保护工作还是会存在一些问题,容易出现各种故障,造成电力系统无法正常运行。本文即分析了继电保护的典型故障,并详细阐述了继电保护典型故障的防治策略。
【关键词】继电保护 典型故障 元器件 接线错误 短接法 电力系统继电保护概述
1.1 电力系统继电保护装置的构成要素
电力系统机电保护装置的构成一般包括输入部分、测量部分、逻辑判断部分和输出执行部分。
1.1.1 输入部分
该部分通过隔离、低通滤波等前置处理方式对电力系统出现的问题和故障进行前置处理。
1.1.2 测量部分
该部分主要负责将测量信号转换为逻辑信号,进而通过逻辑判断按照一定的逻辑关系组合运算,最后确定出执行动作,并由输出执行部分最终完成。
1.2 继电保护装置的特征分析
1.2.1 选择性特征
选择性特征是继电保护装置智能化的表现,在电力系统出现故障时,继电保护装置能够做到有选择性的对出现故障的部分进行处理,另一方面保证无故障部分的正常运行,这样便可以保证整个电力系统的稳定及电力供应的连续。
1.2.2 快速性特征
快速性特征是继电保护装置高效率的体现,在电力系统出现故障时,继电保护装置能够在第一时间切断故障系统,从而减轻故障设备和线路的损坏程度。
1.2.3 可靠性
可靠性是指电力系统继电保护装置在处理问题和故障时要科学可靠,减少不必要的损失。继电保护的常见故障
2.1 设备故障
继电保护装置是电力系统中不可或缺的一部分,是保护电力系统的基础和前提。一般设备有装置元器件的损坏、回路绝缘的损坏以及电路本身抗干扰性能的损坏,具体的表现为整定计算错误,这主要是由于元器件的参数值和电力系统运行的参数值与实际电流传输的参数值相差甚远,从而造成整定计无法正常工作。还有,设备很容易受到外界因素的影响,如温度和湿度。由于设备具有不稳定性,很容易由于温度和湿度的变化而造成定值的自动漂移,有时候也可能是因为设备零部件的老化和损坏造成的。
2.2 人为操作
人为原因一般就是工作不够细心,对系统内各项设备数值的读数观察不够仔细,导致读错设备整定器上的计算数值,导致继电保护故障,且对故障的检查技术水平不够,无法及时准确地发现故障段,从而造成大面积的电路故障问题,导致系统无法正常供电。
当工作电源出现问题时,电力系统保护出口处的动作过大,造成电路内波纹系数过高,输出的功率就不够,电压便会不稳定,当电压降低或者电流过大时,如果保护行为不恰当极容易出现一系列的继电保护故障。继电保护典型故障的防治策略
3.1 元件替换法
元件替换法,顾名思义,就是用正常的元件将出现故障的元件替换下来,这样能够将故障范围迅速缩小,提高维修人员的维修效率,因此是机电保护装置故障处理中经常用到的方法。
3.2 参照法
参照法是指通过对不同设备的技术参数的对照,找出不正常设备的故障点。此法主要用于检查认为接线错误,定值校验过程中发现测试值与预想值有较大出入又无法断定原因之类的故障。另外需要注意的是,在继电器订制校验时,若发现某一直继电器的测试值与整定值相差很多,那么此时要用同只表计去测量其他相同回路的同类继电器进行进一步的比较,错误的做法是在发现数值不同时,轻易调整继电器的刻度表。
3.3 短接法
短接法是缩小故障范围常用的一种方法,是将回路某一段或一部分用短接线接入为短接,进而判断出故障是存在短接线的范围还是范围外。短接法对判断电磁锁失灵、电流回路开路等故障具有明显的优势。
3.4 继电保护典型故障的预防措施
3.4.1 构建完善的电力管理体系是基础
构建完善的电力管理体系是预防电力系统继电保护故障的基础,构建该体系需要做好以下工作:
首先要逐步形成科学有序的管理体系,这其中,一支高素质的管理队伍是不可或缺的,这需要电力企业加强对管理人员和工作人员的培训,使其掌握电力系统管理的知识技能。另外管理体系内的各个部分要职权分明、责任落实,这样才能保证管理体系的井然有序和正常运作。
其次,完善的监测评价体系也是十分必要的。监测评价体系具有监督指导的作用,通过建立该体系,在全电力系统中形成严谨的工作氛围,有利于很大程度上提高电力工作的质量,进而能够及时正确的发现继电故障,将故障消灭在萌芽状态,从而保障电力系统的有序运行。
3.4.2 加强电力系统的技术管理是核心
技术管理作为降低继电保护故障率的核心,具有十分重要的意义。可以通过采用先进的技术来提高电力系统的智能化水平,从而有效减少继电保护故障的发生。
第一,提高电力系统的自动化水平。在设计和开发电力系统时,要加强新技术的开发和应用,包括自动控制技术和智能技术。这样电力系统出现故障时,智能化技术便能有效避免继电保护障碍的发生。
第二,运用新技术来增加电力系统设备的承受能力。比如,继电保护中使用CPU容错技术。由于CPU容错技术具有一定的恢复能力,所以它能够在更大程度和范围内降低电力系统硬件问题带来的影响,从而起到保护继电保护装置的作用。
3.4.3 提高电力工作人员的素质
电力工作人员素质是影响电力系统管理水平的重要因素。因此,电力企业要加强对电力工作人员业务素质的培训教育,提高其责任意识和安全意识,并通过一些业务培训,提高其实际操作能力,促使电力企业员工能够更好的处理电力系统中出现的各种问题。
参考文献
[1]蒋陆萍,胡峰.冷建群.继电保护故障快速查找的几种典型方法及应用[J].电力系统保护与控制,2009(18).[2]刘亚玉.分析备自投装置的启用与运行接线方式的关系[J].继电器,2007(19).[3]应斌.浅谈继电保护工作中故障处理的若干方法[J].广西电力,2006(04).作者单位
国网甘肃省电力公司检修公司 甘肃省酒泉市 735000
第三篇:开关柜典型故障分析
高压开关柜典型故障分析
电力系统广泛使用10kV(含6kV)—35kV开关柜,担负着发电厂用电、变电站和用户供电的任务,且用量大,分布广。由于1OkV-35kV开关柜的设计、制造、安装和运行维护等方面均存在不同程度的问题,因而开关柜事故率比较高,危及人身、电网和设备安全,影响供电可靠性。
一、下面列举几种类型的开关柜事故(故障)案例:
(一)开关柜防爆性能不足或防误性能不完善,危及人身安全; 由于开关柜防爆性能不足或防误性能不完善,近几年省内外发生多起人身伤害事件,以下列举四起事故:
1.2006年2月 24日,某 220kV变电站 10kV高压开关柜(GGX2型)由于馈线故障,开关发生拒动,运行人员在处理开关拒动过程中,当拉开开关,确认开关位置指示处于分闸位置后,操作拉开隔离刀闸时,发生弧光短路,造成 2人重伤 1人轻伤。事故后现场检查发现:该开关操作机构 A、B相拐臂与绝缘拉杆连接处松脱,造成 A、B相主触头未分开,在操作拉开隔离刀闸时发生弧光短路。由于906柜压力释放通道设计不合理,下柜前门强度不足,弧光短路时被电弧气浪冲开,造成现场人员被电弧灼伤。开关柜的上述问题是人员被电弧灼伤的直接原因。
2.7月 1日,某单位发生一起因变电运行人员擅自打开10千伏开关柜柜门,误碰带电部位造成的人身触电死亡事故。设备缺陷是事故发生的又一间接原因。由于 6522A相刀闸动触头绝缘护套老化,松动后偏移,刀闸断开时护套卡入动触头与刀闸接地侧的静触头之间,造成刀闸合闸时卡涩合不上。且该 GG-1A型高压开关柜系 60年代设计的老旧产品,96年生产,97年投运;原安装有机械程序防误锁,于 2002年改造为微机防误装置,由于此型号的高压开关柜原设计不完善,不能实现线路有电强制闭锁。
3.2009年9月30日,某220kV变电站发生一起10kV开关柜内部三相短路,电弧产生高温高压气浪冲开柜门,造成2名在开关柜外进行现场检查的运行值班员被电弧灼伤,其中1人于10月1日死亡。
4.2010年8月19日,8月19日,某单位在更换某220kV变电站10kV I段母线PT过程中,工作班成员触碰到带电的母线避雷器上部接线桩头,造成2人死亡、1人严重烧伤。
初步分析,事故主要原因为厂家设备一次接线错误。根据国家电网公司典设和设备订货技术协议书,10千伏母线电压互感器和避雷器均装设在10千伏母线设备间隔中,上述设备的一次接线应接在母线设备间隔小车之后(见附图1)。而开关柜厂家在实际接线中,仅将10千伏母线电压互感器接在母线设备间隔小车之后,将10千伏避雷器直接连接在10千伏母线上,导致拉开10千伏母线电压互感器9511小车后,10千伏避雷器仍然带电(见附图2)。
变电站运行人员按照工作票要求,拉出10千伏Ⅰ段母线设备间隔9511小车至检修位臵,断开电压互感器二次空开,在Ⅰ段母线电压互感器柜悬挂“在此工作”标示牌,在左右相邻柜门前后各挂红布幔和“止步,高压危险”警示牌后,向调度汇报。变电站运行人员与工作负责人一同到现场对10千伏Ⅰ段电压互感器进行验电,由于电压互感器位臵在9511柜后,必须由施工人员卸下柜后档板才能进行验电,在验明电压互感器确无电压之后,运行人员许可施工人员工作。由于电压互感器与避雷器共同安装在10千伏Ⅰ段母线设备柜内(见附图3),施工人员在工作过程中,触碰到带电的避雷器上部接线桩头,造成人员触电伤亡。
图1:
附图2
附图3:
(二)开关内设备接(触)头过热性故障
封闭式开关柜在运行中不能打开,因此难以测量运行中柜内接(触)头的实际温度,如不及时发现并处理接(触)头过热性缺陷,严重威胁电力安全生产。固定式开关柜每个进出线间隔共有负荷电流流过的33或39个接(触头),小车移动式开关柜每个进出线间隔共有负荷电流流过的24个(或更多)接(触头)。这些接(触)头直接流过负荷电流,当负荷较大时存在隐患的接(触)头就会严重发热。由于发热点在密封柜内,运行中的柜门禁止打开,值班人员无法通过正常的监视手段发现发热缺陷。一旦触头发热严重必然造成事故发生,影响系统安全运行。下边四起故障分析。
1.2007年2月3日23时59分,某变电站10kV电容器组III644开关跳闸,保护装置显示“过流I段动作”。现场检查发现,10kV配电室有浓烟,10kV电容器组III开关柜下部有着火现象。第二天检查情况:10kV电容器组III 644开关柜内B相CT和铝排连接处松动引起发热导致该处烧断和热缩材料燃烧,A、C相也有放电痕迹。
2.2009年8月16日晚,某变电站发生10kV开关柜故障,烧损多面开关柜。
10kV农专Ⅰ线柜(开关、CT、静触头及套管、母排及相接铜排、母排套管、保护测控装置、屏顶小母线、电度表、二次控缆烧损;出线电缆头轻微灼伤);
A相 B相 C相
开关 电缆头及CT 母线
10kV下白货柜(母排、母排套管、静触头及套管、保护测控装置、屏顶小母线、电度表、二次控缆烧损;相接铜排、开关、CT、出线电缆头轻微灼伤);
母排 保护及二次控缆
10kV医院Ⅰ柜(母排、母排套管、静触头及套管、保护测控装置、屏顶小母线、电度表、二次控缆烧损;相接铜排、开关、CT、出线电缆头轻微灼伤);
保护及二次控缆 母排
故障原因分析:10kV农专Ⅰ线开关柜由于隔离插头接触不良,开关长期在满负荷运行,触头发热引起梅花触头的弹簧退火变形,失去弹性,造成该隔离插头接触电阻变大,运行中发热烧熔,烧损触头周围的绝缘件,最终绝缘击穿,造成触头相间短路故障。
2.2010年8月12日某变电站#1主变低压侧631开关因发热造成开关柜内部三相短路烧毁。
初步分析是:1#主变 10kV侧 631手车开关柜内断路器 A相母线侧梅花插头(上侧)与静触头间接触不良发热,最终发展成梅花插头对静触头电弧放电,导致真空断路器铜触指严重烧损,散热件熔化,穿墙套管烧毁并产生大量的含有金属离子、碳合物的烟气,造成母线三相对地短路(见附图)。
1#变母排开关开关柜接线图
断路器A相触指被电弧烧损。
3.2006年3月8日,某单位在处理某变电站#1主变10kV侧61A3刀闸缺陷时发现:⑴、61A3刀闸断不开,外观检查静触指存在局部过热痕迹。⑵、#1主变10kV侧61A1刀闸下断口A相丢掉两只静触指,静触头夹紧弹簧有过热的痕迹,C相静触头夹紧弹簧有过热的痕迹(有三只弹簧熔在一起),C相支柱绝缘子上有被热气薰的痕迹。⑶、10kV分段回路6001刀闸下断口C相丢掉一只静触指,静触头夹紧弹簧有过热的痕迹(有一只弹簧熔在一起),上断口也存在类似的问题。
该变电站该段母线的开关柜型号为GGX2,61A1、61A3刀闸和10kV分段回路6001刀闸均为户内高压旋转式隔离开关,型号均为GN30-10,4S热稳定电流均为40kA,额定电流:3150A(61A1、61A3刀闸)、2000A(6001刀闸)。
动静触头过热的原因分析:这种刀闸合闸时,静触指与静触座间有间隙,接触的点、面少,在通过大电流时,固定静触指与夹紧弹簧的螺栓和夹紧弹簧参与分流、导电,造成有些螺栓烧断(静触指丢落的原因)和夹紧弹簧过热退火,也造成动、静触头接触不是很好,造成动静触头局部过热、熔焊。
图
161A1刀闸C相触头的过热情况
图2 61A1刀闸A相触头的过热情况
图3 10kV分段回路6001刀闸的过热情况
图4 丢落的静触指和烧断的固定静触指、夹紧弹簧的螺栓
(三)小动物进入开关柜引起短路故障
2006年9月14日,某单位某变电站#1主变后备保护动作,跳三侧开关。检查发现,10kV开关室烟雾弥漫,10kVI、II段母线联络柜内6001刀闸与10kV母联600开关之间连接线发生相间短路,10kVI、II段母线联络柜下柜门被冲开,下柜门上的观察窗与、断路器前柜门上电磁锁被高温熔化,后柜门下方被电弧烧个洞。10kVI、II段母线联络柜底部有只毛烧光的死老鼠,隔壁柜(备用柜)底部电缆孔洞未封堵(该开关柜原为运行间隔,配网调整间隔,该柜内电缆调到其它开关柜,电缆抽走后孔洞未封堵),10kVI、II段母线联络柜与隔壁柜间的接地铜排穿孔未封堵。
故障原因分析:老鼠从隔壁柜电缆孔进入,再经10kVI、II段母线联络柜与隔壁柜间的接地铜排穿孔爬到10kVI、II段母线联络柜,老鼠活动时引起短路。
(四)开关柜内组件绝缘爬距或绝缘距离不足引起开关柜故障 早期投运的开关柜支持瓷瓶及电流互感器等的外绝缘爬距较小,当运行中绝缘表面出现凝露或有污秽时,系统中出现不高的过电压或运行电压下发生绝缘件沿面闪络。还存在对地和相间距离不够,在系统单相接地谐振或雷电等过电压情况下,直接造成对地或相间击穿。
《福建省电力有限公司户内交流金属封闭高压开关柜订货技术规范》(闽电生产〔2008〕480号)高压开关柜中各组件及其支持绝缘件的外绝缘爬电比距(即高压电器组件外绝缘的爬电距离与额定电压之比)相应值的应用范围应不小于 18mm/kV。单纯以空气作为绝缘介质的开关柜,柜内各相导体的相间与对地距离、手车开关隔离触头与静触头绝缘护罩的净空气距离、相间隔板与绝缘隔板的净空气距离:12kV为125mm,40.5kV为300mm。
《户内交流高压开关柜订货技术条件》(DL 404-1997)规定:在金属封闭式高压开关柜中,凡采用非金属制成的隔板来加强相间或相对地间绝缘时,7.2~12kV高压带电裸导体与该绝缘板间还应保持不小于30mm的空气间隙;40.5kV,保持不小于60mm的空气间隙,且为阻燃材料制成。
2008年9月6日,某变电站#1主变差动速断动作跳闸。从现场检查分析认为:#1主变中压侧33A开关柜过压保护器的A、B相跳线(从固定铝排引至过压保护器的连接铜线)过长,跳线弯曲弧度较大,A、B相跳线同时侧向绝缘隔板,其跳线与绝缘隔板的电气距离(最小处)仅5cm左右。A、B相跳线之间的绝缘仅通过绝缘隔板隔离,长时间运行中造成A、B相跳线对绝缘隔板放电,绝缘档板被碳化后,绝缘破坏并击穿,引起A、B相短路。
A相
B相
(五)开关柜组件质量(如过电压保护器、传感器等)劣引起开关柜故障
1.9月30日8时31分,某变电站10kV中亭I线633开关因过流Ⅰ段保护动作跳闸。现场检查10kV中亭I线633开关柜内过电压保护器A、B相爆炸,该开关柜前柜门下柜门被冲开,前柜门中柜门(断路器前门)轻微变形,柜内其他设备未损伤。
2.2004年11月10日,某110kV变电站因10kV开关短路引发10kV母线故障,造成该变电站全停及10kV部分设备严重损坏。
现场检查情况:最严重的母联刀闸柜的带电显示器传感器(福州高新高压电器有限公司产品)烧损情况:发现A、B相已烧成灰,C相略好;结合刀闸触头烧损情况:C相触头基本完好、A相略有烧损、B相最为严重。推测故障是从B相带电显示器引发,导致电弧相间短路。
为了进一步验证造成本次事故的原因,对开关柜内未损坏的带电显示器传感器,抽两只传感器进行解剖,发现内部芯棒填充剂软化,存在绝缘薄弱点。由于10kV系统出现失地引起过电压,使传感器内部局部放电,逐步发展为贯穿性击穿,造成相间短路。
此外,开关柜故障的原因还有检修预试时在开关柜遗留工具或短接线接地线、误操作等。开关柜故障往往会出现“火烧连营”事故,多面开关柜被电弧烧毁,“惨”不忍睹。造成事故扩大的原因主要有三点:首先,由于开关柜母线室是连通的,当一个间隔故障时,电弧侵犯邻柜造成“火烧连营”;其次,继电保护整定配合不尽合理,保护动作时间过长或保护有缺陷不动作靠上一级保护动作隔离故障,故障时间长造成电弧损害加重;最后一个原因则是高压电弧故障时引起保护损坏或直流电源故障,造成保护失灵,短路长时间不消失,整个高压室几乎所有的开关柜均烧毁,最后连主变lOkV低压架空母线都被弧光烧断,直至越级跳闸,往往连主变也被长时间短路所损坏。
二、防范措施:
(一)加快老旧开关柜(如GG1A、GGX2、XGN型等)改造或完善化大修。各单位要按《关于印发2008-2010年县供电企业电气设备技改、大修指导性意见的通知》(生变〔2007〕145号)加大老旧开关柜技改力度,运行时间短、达不到技改的条件的开关柜要按省公司完善化方案开展完善化大修。
开关柜内绝缘可靠性低的酚醛环氧类绝缘子和爬距不足的绝缘子安排更换为符合要求的瓷绝缘子。母线加阻燃热缩绝缘套,绝缘套本身应耐受20 U,的交流耐压,目的是防止小动物爬人柜内造成短路,也可防止因烟气、游离气体进人时空气间隙绝缘降低造成的弧光短路。
(二)做好开关柜订货、出厂前验收、安装与验收管理工作 根据国际、电力行业标准和《预防交流高压开关事故措施》(国家电网公司生〔2004〕641号)、《预防12kV-40.5kV交流高压开关柜事故补充措施》(国家电网生〔2010〕811号)、《福建省电力有限公司户内交流金属封闭高压开关柜订货技术规范》(闽电生产〔2008〕480号)等文件,做好开关柜招标文件、订货技术协议的审查工作,开关柜出厂前赴厂验收,开关柜安装调试过程安排专业人员开展技术监督工作,组织做好开关柜投产前的验收工作。
把好10kV开关柜的选型及采购关。选型要注意开关设备有关参数是否满足现场运行条件。对开关柜所配的元件应严格把关,尽量选用运行情况良好的产品;并要求验收时,开关设备配置要有各元件试验报告,特别是带电显示器的传感器的局放试验报告,杜绝不良设备入网。
(三)加强巡视运行管理
1.加强巡视中的安全管理,巡视或操作时应严格按照安规和标准作业文本(含标准巡视卡)或 PDA以及操作票的要求进行,巡视或操作时着装应规范,并注意站位。
2.开关柜操作前应确认柜内断路器和隔离开关的实际状态,进行倒闸操作时,应严格监视设备的动作情况,如发现机构卡涩、动触头不能插入静触头、合闸不到位等,应停止操作,待缺陷按规定程序消除后再行操作。3.对防误、防爆等功能不符合规范要求的开关柜,应逐一列出清单,做好危险点分析和预控措施,纳入红线设备管理,并根据红线设备要求在开关柜面板上张贴标识,有计划地安排改造。
4.巡视中应注意开关柜的门和面板是否锁紧,对螺栓丢失、损坏的,应及时上报缺陷处理。
5.严格按照《福建省电力有限公司高压带电显示装置管理规定》的要求,做好开关柜带电显示装置的巡视和维护工作,确保带电显示装置工作正常。
6.对重负荷的开关柜,应重点巡查。无法开展柜内测温的开关柜,可检查柜体温度是否异常。
7.加强保护定值及压板投退管理,避免由于定值或压板投退错误造成事故扩大。
8.在开关柜配电室配置通风、防潮设备和湿度计,并在梅雨、多雨季节或运行需要时启动。
(四)加强检修维护管理
1.开关柜检修重点对触头接触情况(有无过热变色的痕迹)、柜内电气主回路连接螺栓紧固、传动部件轴销的固定情况、机构辅助开关接触、操作机构手车轨道及闭锁装置部件是否有机械变形或损坏等情况等进行检查。对于变电站电容器组等操作频繁的高压开关柜要适当缩短巡视检查和维护周期。
2.已运行的开关柜结合停电检查,开关柜底部以及柜与柜间孔洞是否封堵,有无小动物进入的可能。3.检修试验结束后,应重点检查开关柜有无遗留工具、物件以及试验用的短接线、接地线。
4.由于GGX2、XGN等型号开关柜选用运行中易造成发热的旋转隔离开关(如GN30-12型隔离开关),应结合停电检查隔离开关触头(含弹簧)有无过热或烧损,重点为大电流开关柜(如主变进线柜、分段开关柜等)。
5.对重负荷且无法开展测温的开关柜尽快安排停电检查,可选一、二座变电站尝试安装开关柜在线测温装置。
6.结合停电检查开关柜各相带电体之间、相对地之间空气距离是否符合规范要求(如35kV开关柜的为300mm,10kV开关柜的为125mm)。
7.结合停电检查开关柜的机械联锁,是否满足“五防”要求。检查开关柜内手车活门打开、关闭是否灵活正常。
(五)10、35kV出线多的变电站安排10、35kV系统电容电流测量,10kV电缆线路电容电流达30A和35kV系统电容电流达10A需安排安装消弧线圈。10—35kV母线PT安装消谐装置。
第四篇:电力系统继电保护典型故障分析
电力系统继电保护典型故障分析
案例11 施土留下隐患,值班员误碰电缆断面线路跳闸
事故简况:1989年2月16日,绥化电业局220kV绥化一次变电所值班员清扫卫生中,见习值班员齐××在清擦1号主变压器保护屏屏后地面时,拖布碰到该屏后地面上电缆断面,警报铃响,220kV分段兼旁路绿灯闪光,“掉牌未复归”光字牌亮,经检查直流接地信号继电器掉牌,无其他信号,一次设备无异常,汇报调度,按调度令拉开220kV绥海线断路器,合上220kV分段兼旁路断路器正常,随后,合上220kV绥海线断路器正常。
事故原因及暴露问题:按扩建工程二次图纸设计要求,主变压器直接接地零序保护接地后,先跳220kV分段兼旁路断路器,220kV分段兼旁路综合重合闸屏至1号主变压器保护屏控制电缆分段屏侧的正电“1”与手动跳闸起动回路“R33”两芯均已接线带电。1号主变压器保护屏侧电缆芯中的正电“1”与跳闸回路“R33”之间需串入直接接地零序保护2段时间继电器的滑动触点。因当时1号主变压器在运行中,所以未施工安装,该电缆盘卷在屏后地面上,1号主变压器保护屏电缆断面的“1”与“R33”线芯裸露在外。违反《继电保护和安全自动装置检验保安规程》检验工作中对下列各点应特别注意安全谨慎从事之5“拆下的带电线头,必须包扎稳固,做好记录,恢复时逐项核对”的规定,没有对裸露在外的带电电缆芯“1”与“R33”进行包扎,是发生事故的主要原因。
值班员对回路和施工情况不清楚,致使拖布碰擦电缆断面,造成“1”与“R33”两芯短路,是发生事故的直接原因。
事故暴露出继电人员工作责任心不强,裸露的电未包扎,也未向运行人员交待。
运行单位验收不细,把关不好。
防范措施:
(1)运行单位一定要加强验收把关工作,验收时一定要严、细。
(2)对运行设备的二次电缆,投运要制定详细的施工方案和安全措施。
(3)继电人员在工程完工后,要与运行单位进行认真、详细的交待,特别是遗留下来的未完工程,更应仔细交待,应告诫运行人员要注意的地方。
案例12 触碰跳闸回路,造成母差保护误动
事故简况:1986年7月3日16时16分吉林电业局铁东变电所倒闸操作,恢复220kV母线固定连接。运行人员在拉开220kV母差保护三极隔离开关时,因带有正电源的固定三极隔离开关的螺丝窜出,误碰到220kV母差保护跳闸回路,造成220kV母联断路器跳闸。
事故原因及暴露问题:
(1)该220kV母差保护是1986年5月10~20日检定的,试验人员对盘内线头及螺丝都进行了检查和加紧,但由于对三极隔离开关固定螺丝的管辖分工概念不清,故对三级隔离开关检查不细,三极隔离开关固定螺丝早已窜出的隐患没有及早查出,是发生事故的主要原因。
(2)运行人员在拉三极隔离开关前,没有对三极隔离开关进行检查,早已窜出的带正电的螺丝误碰起动220kV母联断路器跳闸继电器MLJ回路,造成220kV母线差动保护动作,跳开220kV母联断路器,是发生事故的直接原因。
防范措施:
(1)继电人员与运行人员对设备的维护分工要有明确的划分,消灭管辖分工概念不清的死角,防止因设备分工不明造成事故。
(2)应对端子排20cm以内进行全部细致的检查,对经常操作的连接片、隔离开关、重合闸试验按钮应加强检查维护,加强复查,将隔离开关固定螺丝焊死,运行人员操作时,应先检查后操作。案例13 保护装置元件绝缘老化、脏污,造成线路跳闸
事故简况:1990年2月10日,营口电业局盘山一次变电所1号所用变屏弧光短路,引起直流正极接地,致
使220kV阜盘线C相继电器动作,断路器跳闸重合成功。
事故原因及暴露问题:
盘山一次变电所控制室内与1号所用变压器交流屏并排按放的直流屏,在弧光作用下,发生直流系统正极弧光接地,是发生事故的直接原因。
继电人员对所维护的保护装置未能按《继自装置运管规程》4.2.4条“设备专责岗位责任:掌握装置缺陷情况,及时消除并贯彻和执行本专责设备反事故措施计划,搞好设备升级、定级工作”的规定执行,其中接地综合重合闸屏选相元件C相插件绝缘老化、脏污,未能及时发现和消除,在当时特定的潮湿空气中,使插件座上18端子与地之间绝缘电阻急剧变小,这样使继电器动作跳闸经试验K点绝绝缘电阻在较干燥的天气下,可达2MΩ,而当时只有0.6MΩ;是发生220kV阜盘线C相跳闸的主要原因。事故暴露出:
(1)直流屏与交流屏之间未加隔板,所以造成相互影响。
(2)盘山地区盐碱大,空气较潮湿,门窗密封不好,造成设备脏污。
防范措施:
(1)交、直流屏间应立即加上绝缘隔板,以减少其相互间影响。
(2)要把控制室门窗密封完好,防止尘土过多积存在屏内各端子上,特别要注意和防止室内 装置受潮。
(3)继电专责岗位责任制要加强,一定要严格执行《继自装置运管规程》的各项规定,维护好设备,加强设备的巡视、检查,及时消除设备的隐患,防止保护装置误动作。
案例14 气体继电器误动作,主变压器两侧断路器跳闸
事故简况:1990年5月18日,吉林通化电业局水洞一次变电所直流接地,2号主变压器轻、重瓦斯保护动作,两侧断路器跳闸,2号主变压器停电,次日,经检查后2号主变压器恢复运行。
事故原因及暴露问题:气体继电器接线柱槽盖,在制造结构上存在易脱落的缺点,当大风雨时,槽盖脱落后,槽内进入雨水,是气体继电器误动作的直接原因。
继电人员未按《继自装置运管规程》4.2.4条“设备专责岗位责任:掌握装置缺陷情况,及时消除并贯彻执行本专责设备反事故措施计划,搞好设备升级、定级工作”的规定执行,对气体继电器接线柱槽盖易脱落的缺陷掌握不够,不能及时消除、处理,是发生事故的主要原因。
变电运行人员在巡视检查工作中,没有发现气体继电器无防雨措施和及时处理,是发生事故的重要原因。
事故暴露出继电人员、变电运行人员等责任心不强,没能严格按“规程”规定做好本职工作。防范措施
(1)针对此次事故的教训,应认真对全局各主变压器的气体保护接线柱槽盖进行一次全面检查,防止同类性质事故再次发生。
(2)气体继电器安装、调试后,应在记录簿中记录防雨措施是否完善、好用。
(3)对气体继电器接地柱槽盖易脱落缺点,应列入技改项目,发动科技人员、广大变电、继电人员,提出改进意见。
(4)继电专责人和变电运行人员,要提高责任感,认真检查、巡视设备,发现问题要及时处理。
案例15 送电线路故障,保护误动导致一次变电所全停
事故简况:1990年12月22日,吉林延边电业局图门一次变电所,因下雨雪,造成送电线路覆冰,超过设计标准,220kV图延甲线导线覆冰40mm,覆冰和粘雪使导线不均匀下落,上下跳动,造成线路混线、短路。当天2时10分,图门一次变电所全停,检查时,发现220kV珲图乙线相差高频动作,断路器跳闸不重合;220kV图延甲线两侧高频方向和距离保护一段动作,断路器三相跳闸不重合(均在单相重合闸位置);66kV图纸线低频动作,断路器跳闸。经省调指挥于3时13分图门一次变电所恢复正常。
事故原因及暴露问题:这次事故的起因是220kV图延甲线覆冰灾害所致。
220kV珲图乙线珲春电厂侧保护误动造成图门一次变电所全停的事故,主要是因为珲春电厂侧保护装置中有一寄生回路存在,这是珲春电厂继电人员违反《继自现场保安规定》3.14条“保护装置二次线变动或改进时,严防寄生回路存在,没用的线应拆除”的规定,在保护装置二次回路线变动和改动时,没有把没有用的线拆掉所致,是珲图乙线保护误动的主要原因。
电力载波中断,原因是载波机电源中断,这主要是所用电源不可靠,通信联系不通,延误了变电所恢复送电时间,是事故延长的主要原因。
事故暴露出:
1事故发生后,电厂、变电所等沟通信息时,情况不准确,给判断事故、恢复送电造成一定的困难。2图一次变电所所用电源不可靠,地调处理时不果断,应通过韦子沟变电所送电到图一次变电所。3图纸线是供造纸厂,而该厂有自备发电机在运行中,没有低频减载装置,故这次低频动作,说明该局对用户自备电源管理不善。
防范措施:
1要对一次变电所和重要的变电所所用电必须做到有外电源并有自动切换装置,确保所用电不间断。2要加强对继电、通信和变电运行人员的技术业务培训,运行人员的重点是事故处理和各种保护连接片的使用,保护动作信号的分析和故障录波器的使用;继电人员的重点是严格执行各种检验规程、保护和自动装置的检验,最终以整体试验和模拟运行状态下检验为准;通信人员的重点是熟悉设备和系统,会紧急排除故障。
3通过这次事故,要尽快完善事故时暴露的问题,如用户自备电源的管理等。
案例16 振动过大,造成保护误动线路单相跳闸
事故简况:1992年10月13日,齐齐哈尔电业局继电人员,在北郊变电所处理220kV二郊甲线重合闸灯不亮的缺陷,因继电人员不小心,使保护盘受力振动,将B相防跳继电器触点闭合,造成B相断路器跳闸的事故。
事故原因及暴露问题:继电保护工作人员在处理220kV二郊甲线重合闸灯不亮的缺陷时,违反《安规》(变电)第217条“在保护盘上或附近打眼等振动较大的工作时,应采取防止运行中设备掉闸的措施,必要时经值班调度员或值班负责人同意,将保护暂时停用”,也违反《继自现场保安规定》第3.6条“尽量避免在运行的保护屏附近进行钻孔或进行任何有振动的工作,如要进行,则必须采取妥善措施,以防止运行的保护误动作”等规定,继电人员在拔重合闸继电器时,由于用力过猛,致使保护屏(盘)受力振动过大,将B相防跳继电器的触点闭合,造成B相断路器跳闸,是发生事故的直接原因。
运行人员在线路跳闸事故处理时,违反《齐齐哈尔电力系统调度规程》以下简称《调度规程》第169条之四“装有同期装置的线路断路器跳闸,在确认线路有电压且符合并列条件时,可不待调度命令,自行同期并列或环并”的规定,当220kV二郊甲线B相保护误动造成断路器跳闸后,运行人员没有合同期把手,就进行强送,造成强送不成功,经调度同意切开其他两相后,再次三相合闸成功。运行人员技术素质低,没按《调度规程》执行,是事故延长时间的主要原因。事故暴露出继电人员对运行的保护盘上的工作,安全重视不够、麻痹大意,工作负责人监护指导不利。
防范措施:
(1)在运行的保护盘上工作,对有可能发生较大的振动时,应派有经验的人员去进行工作,并在工作前详细研究,制定减轻振动的方法和注意事项。
(2)在运行的控制和保护盘上工作前,要做好危险点的分析,对在盘上工作的继电人员要详细交待,使每位继电工作人员都能提高警惕,并指派有经验的继电人员做监护人,监护人要认真负责,不间断地监护,随时指导和纠正不安全的动作。
(3)运行人员要加强对技术、业务学习,熟悉有关规程,遇事有章可循,确保设备安全运行,尽力减少事故处理时间。
第五篇:DCS故障分析处理及维护防范措施
关键词: DCS 故障
摘要:本文结合火电厂DCS在生产运行中出现的故障实例,对DCS故障进行了分类和分析,并就如何维护DCS以及减少DCS故障提出了具体办法和措施。
一、分散控制系统(DCS)概述
DCS具有通用性强、系统组态灵活、控制功能完善、数据处理方便、显示操作集中、人机界面友好、安装简单规范化、调试方便、运行安全可靠的特点,在国内外电力、石油、化工、冶金、轻工等生产领域特别是大型发电机组有着较为广泛的应用。目前国内应用较多的的品牌主要有:
(1)国外品牌:美国ABB、西屋、德国西门子、日本横河、日立等;
(2)国内:国电智深、和利时、新华等。
DCS的安全、可靠与否对于保证机组的安全、稳定运行至关重要,若发生问题将有可能造成机组设备的严重损坏甚至人身安全事故。所以非常有必要分析DCS运行中出现的各类问题,采取措施提高火电厂DCS的安全可靠性。
二、DCS在生产过程中的故障情况
每个厂家的DCS都有其各自的特点,因此其故障的现象分析和处理不尽相同,但归纳起来由DCS引起机组二类及以上障碍可划分为三大类:
(1)系统本身问题,包括设计安装缺陷、软硬件故障等。
(2)人为因素造成的故障,包括人员造成的误操作,管理制度不完善及执行环节落实。
(3)系统外部环境问题造成DCS故障。如环境温度过高、湿度过高或过低、粉尘、振动以及小动物等因素造成异常。
2.1 DCS本身问题故障实例
此类故障在生产过程中较为常见,主要包括系统设计安装缺陷,控制器(DPU或CPU)的死机、脱网等故障,操作员站黑屏,网络通讯堵塞,软件存在缺陷,系统配置较低,与其他系统及设备接口存在问题等。
2.1.1 电源及接地问题:
(1)某电厂DCS电源系统采用的是ABB公司Symphony III型电源,但基建时仍按照II型电源的接地方式进行机柜安装,与III型电源接地技术要求差异很大。机组投产以来发生多次DCS模件故障、信号跳变、硬件烧坏的情况,疑与接地系统有关。同样,某电厂在基建期间DCS接地网设计制作安装存在问题,DCS系统运行后所有热电阻热电偶温度测点出现周期波动。
(2)某厂因电源连线松动而导致汽机侧控制系统失效。
经验教训:DCS没有良好的接地系统和合理的电缆屏蔽,不仅系统干扰大,控制系统易误发信号,还易使模件损坏。可见,UPS电源、控制系统接地等存在问题将给电厂投产后DCS的安全稳定运行留下极大隐患。因此,DCS系统电源设计一定要有可靠的后备手段,负荷配置要合理并有一定余量;DCS的系统接地必须严格遵守制造厂技术要求(如制造厂无特殊说明应按照DLT774规定执行),所有进入DSC系统控制信号的电缆必须采用质量合格的屏蔽电缆,并要同动力电缆分开敷设且有良好的单端接地。
2.1.2 系统配置问题:
(1)浙江某电厂DCS(T-ME/XP系统)频繁故障和死机造成机组停运事故。
7、8机组(2*330MW),从1997年2月试生产至5月,两台机组共发生22次DCS系统故障和死机,造成机组不正常跳闸8次。之后又多次 发生操作画面故障(8号机组有两次发生全部6台操作站“黑屏”),严重威胁机组安全。经分析认为其DCS系统存在以下几个方面的问题:(1)DCS工程设计在性能计算软件、开关量冗余配置上存在问题。(2)硬件配置不匹配(其中包括T-ME和T-XP两种系统的匹配和通信问题)。(3)个别硬件设计不完善。(4)进一步分析,关键的CS275(下层T-ME)通讯总线负荷率过高出现“瓶颈”问题现象。而欧洲T-ME/XP系统用户在配置合理的前提下,T-ME/XP系统使用情况基本良好。
(2)某电厂在200MW机组的热控系统自动化改造上使用的DCS,由于系统配置的负荷率计算不准且为了减少投资,技术指标均接近允许极限,加之该系统有运行时中间虚拟I/O点量大的特点,所以在改造后期调试时发现个别控制器的负荷率竟超过了90%,个别软手操操作响应竟接近1min,根本无法使用,后经过大幅度调整(系统重新增加配置),才解决了这个问题。
(3)东北某600MW机组,由于招标技术规范对I/O通道隔离性质表述不到位,因此DCS厂家做的配置很低,结果在调试时烧损了大量的I/O板,后来改变了隔离方式和更改换了硬件,电厂又花费了许多资金,也抵消了当初的招标价格优势。此外,电缆的质量与屏蔽问题也必须高度重视,重要信号及控制应使用计算机专用屏蔽电缆,许多改造工程正是由于电缆的问题导致电缆不得不重新敷设,影响了工期。
(4)某电厂300MW机组新华XDPS-400系统工程师站频繁死机,经检查发现其运行程序较多:多个虚拟DPU、历史数据记录、性能计算、报表等。把历史数据分配至别的人机接口站问题解决。
2.1.3 控制器(DPU或CPU)故障
(1)某电厂300MW #2机组HIACS-5000CM控制系统FSSS1的CPU故障,且未将控制权交出,从CPU未能切换为主控,导致该部分系统控制设备无法操作(设备保持原状态工作)。在对主CPU执行在线更换步序至停电时,从CUP切换主控CPU,系统设备受控,更换原主控CPU后系统一切正常。
(2)ABB早期某时间生产的SYMPHONY 同一PCU机柜内不同控制器之间通讯出现数据不一致的情况,通过升级固件这一问题得到解决;
(3)新华控制XDPS系统早期某批次DPU曾多次出现离线、死机现象,经检查为DPU卡件个别电容问题,经升级更换卡件问题解决。
由于目前DCS的控制器均为冗余配置,大大减少了主控制器“异常”引发机组跳闸的次数。但是,一旦一对冗余的控制器同时死机,将直接威胁到安全生产,对于此类情况一定要采取措施切实避免。
2.1.4 DCS网络故障
(1)某电厂西屋WDPF控制系统,由于多次改造系统增加了大量测点和自动控制回路,系统负荷率高达70%以上,造成网络通讯堵塞,多次出现操作员进行操作、切换画面时间过长、画面黑屏等问题。后经升级改造为OVATION系统,系统正常。
(2)某电厂600MW机组负荷508MW,工况稳定,汽轮机所有调门突然大幅摆动,经检查故障原因是机组运行时M5 控制器的转速信号短时间内由3000r/min 变成了0r/min,又马上恢复,调门摆动的原因也是M3和M5通讯时出现掉数据现象,导致Trip Bias(跳闸偏置)信号在机组运行时由0变为1,引起所有调门大幅摆动。对该问题采取措施:对PCU 控制总线的通讯信号进行多重化处理,对通讯信号增加一定延时,躲过通讯信号瞬间跳变;对重要的通讯信号采用了通讯冗余。
2.1.5 DCS软件问题
(1)某电厂300MW供热机组DCS调试过程中未对测点品质参数进行修改,致使其模拟量测点只有在断线的情况下才认为是坏品质测点,未充分起到品质校验功能。后对所有测点品质参数进行了设置,提高了设备运行的可靠性。
(2)HIACS-5000CM控制系统画面组态时,双击grab组态工具后,弹出 c++错误窗口无法正常使用。经检查发现grab.ini 文件被改动过,从其他机器拷贝文件覆盖后,工具恢复正常。因为grab 非正常退出后保留了错误的信息在grab.ini 文件中。
(3)某电厂除氧器水位控制回路逻辑是由高加水位控制逻辑拷贝修改而成,修改过程不彻底,PID参数未根据除氧器情况设置整定,造成运行中除氧器上水门发散调节,调节品质恶化。采取措施:检查逻辑,重新整定PID参数。
2.1.6 系统接口问题
某电厂200MW供热机组电气并网信号至DEH只有一路,在机组正常运行的过程中该电气并网辅助接点故障出现抖动,造成汽轮机跳闸。采取措施:使用屏蔽通讯电缆,增加冗余接点信号,并进行3取2逻辑判断。
2.2 人为因素造成DCS故障实例
人为因素造成DCS的故障,在生产过程中也较为常见。包括人员造成的误操作,管理制度不完善及未按规程规定执行工作步骤等。
2.2.1 未按规程规定执行工作步骤
(1)某电厂新华XDPS系统DEH的#12DPU故障,对其在线更换,使用的是小机MEH系统的DPU备品。在更换DPU后,只将#32主控DPU拷贝至#12副控未写电子磁盘,其实质只是将副控DPU的内存内容与主控保持一致,#12DPU电子磁盘内容仍为MEH小机控制逻辑。在系统停电吹灰后,按顺序启动#12DPU成为主控,由于其逻辑为MEH逻辑而非DEH逻辑,造成系统通讯异常、数据频闪、画面显示不正常,人机接口站无法操作。在重新对#12DPU送电,拷贝#32DPU逻辑并写盘后正常。
(2)某电厂HIACS-5000CM控制系统,循环水泵房远程I/O卡件更换,未执行在线更换操作步骤,其卡件未能激活进入工作状态,导致现场设备状态与DCS画面不符,设备无法控制。执行在线更换步序后,系统正常。
2.2.2 人员误操作
(1)某电厂机组运行中,在进行处理缺陷时工作人员误动DCS继电器柜继电器造成引风机跳闸,锅炉MFT。
(2)某电厂DCS卡件故障,在进行更换卡件过程中,由于工作人员未认真核对设备、卡件跳线错误,导致新更换的卡件烧损。
2.2.3 管理制度不完善
(1)某电厂DCS系统管理制度不完善,未对软件升级、备份等工作进行规定。其辅网水处理POK1操作员站在升级打补丁后,未进行备份。该操作员站硬盘出现故障在进行系统恢复后,由于其软件版本较低,导致与网络通讯不正常,数据不刷新。
(2)某电厂操作员站管理不严,其放置于集控室的主机USB端口及光驱未进行有效封闭,个别运行人员夜班期间利用操作员站玩游戏、看电影,导致操作员站死机。
2.3 外部环境因素造成DCS故障实例
外部环境因素造成DCS故障的数量相比于前两类问题而言相对较少,但在实际生产过程中也时有发生。
(1)某电厂电子设备间风道口正处于DPU机柜上方,由于设计和其他原因,机组运行中消防水通过风道流入DCS机柜,导致DPU、服务器等设备进水烧损,机组停运。
(2)某电厂循环水泵房远程IO柜,由于底部封堵不严,造成冬季老鼠窜入,在机柜上部温度较高处构筑巢穴,最终造成远程IO脱双网。
(3)某电厂电子设备间的封闭性较差,卡件、DPU积灰较为严重,曾多次出现故障。在采取完善电子间封闭、加装空调等措施后卡件、DPU等故障基本杜绝。
三、DCS系统故障防范及维护措施
通过以上诸多故障实例,我们不难看出,降低DCS系统的故障几率,必须做好分散控制系统从选型设计到运行、维护的全方位工作。
3.1 DCS的选型设计调试
3.1.1无论新建机组还是升级改造的DCS,系统和控制器的配置要重点考虑可靠性和负荷率(包括冗余度)指标。通讯总线负荷率设计必须控制在合理的范围内,控制器的负荷率要尽可能均衡,要避免因涉及规模大而资金不足所带来的、影响系统安全运行的“高负荷”问题的发生。
3.1.2系统控制逻辑的分配,不宜过分集中在某个控制器上,主要控制器应采用冗余配置。
3.1.3电源设计必须合理可靠。一是要强调电源设计的负荷率;二是要强调电源的冗余配置方式,同时一定要保证两路电源的独立性。
3.1.4要注重DCS系统接口的可靠性措施。强调重要接口的冗余度和接口方式的选择,主要是注意可靠性和实时性。
3.1.5对于DCS系统接地一定按厂家要求执行,避免接地问题造成系统大面积故障。应注重考虑系统的抗干扰措施、自诊断和自恢复能力,I/O通道应强调隔离措施。电缆的质量与屏蔽问题也必须高度重视,重要信号及控制应使用计算机专用屏蔽电缆。
3.1.6要充分考虑主辅设备的可控性,要根据设备的运行特点和各种工况下机组处理紧急故障的要求,配置操作员站和后备手操装置。紧急停机停炉按钮配置,应采用与DCS分开的单独操作回路。同时,不能盲目地追求人机界面的“简洁化”,系统配置还应以满足安全生产为第一位。特殊有关安全的紧急干预性操作不能完全建立在DCS完好的基础上。
3.1.7对涉及机组安全的执行机构、阀门等外围设备,在设计与配置时,要保证这些关键设备在失电、失气、失信号或DCS系统失灵的情况下,能够向安全方向动作或保持原位。
3.1.8对于保护系统,应采用多重化信号摄取法,并合理使用闭锁条件,使信号回路具有逻辑判断能力。
3.1.9在调试期间按照调试大纲和具体办法,对所有逻辑、回路、工况进行测试。
3.2 DCS运行、启停维护
3.2.1做好维护准备工作
做好DCS系统的维护工作,主要包括:
(1)维护人员应了解系统总体设计思路。熟悉DCS系统结构和功能构成,了解系统设备硬件知识,熟知各部件如控制器、IO卡件、电源等正常状态和异常状态,熟练掌握DCS组态软件。
(2)系统的备份:包括操作系统、驱动程序、引导启动盘、控制系统软件、授权盘、控制组态数据库,并控制组态数据是最新的和完整的。针对实际使用中的光盘容易磨损的缺点,注意多做备份,并采用移动硬盘、U盘、硬盘等备份形式确保各软件的保存。
(3)硬件储备: 对易损、使用周期短的部件和关键部件如键盘鼠标、I/ O 模块、电源、通讯卡等都应根据实际情况作适量的备份,保证各类型卡件、模块备品不少于1个,并按照制造厂要求存放,如有条件应对备品进行校验,切实掌握备品卡件模块状态。
(4)整理各类产品的售后服务范围、时间表,形成一份硬件生产厂家、系统设计单位技术支持人员通信录,充分利用DCS供货商和系统设计单位技术支持。
3.2.2 日常维护
系统的日常维护是DCS系统稳定高效运行的基础,主要的维护工作有以下几点:
(1)根据25项反措要求、DL/T774检修维护规程等制度文件规定,完善DCS系统管理制度。
(2)保证电子设备间的良好封闭,防止小动物窜入,减小粉尘对元件运行及散热产生的不良影响,保证温度、湿度符合制造厂规定,避免由于温度、湿度急剧变化导致在系统设备上的凝露。可考虑将DCS电子间的环境温度信号引入CRT中,并有报警。
(3)每天检查系统各机柜风扇是否工作正常,风道有无阻塞,以确保系统各设备能长期可靠地运行。
(4)保证系统供电电源质量且为两路电源可靠供电,当任一电源失去即报警。
(5)电子设备间禁止使用无线通讯工具,避免电磁场对系统的干扰,避免移动运行中的操作站、显示器等,避免拉动或碰伤设备连接电缆和通讯电缆等。
(6)规范DCS系统软件和应用软件管理,软件的修改、更新、升级必须履行审批授权及负责人制度。严禁使用非正版软件和安装与系统无关软件,做好主机USB端口、光驱等的封闭管理工作。
(7)做好各控制回路的PID参数、调节器正反作用等系统数据记录工作。
(8)检查控制主机、显示器、鼠标、键盘等硬件是否完好,实时监控工作是否正常。查看故障诊断画面,是否有故障提示。
(9)DCS设备包括DPU、人机接口站等上电应按照一定次序逐一进行,每台设备上电观察正常后再进行下一设备上电,避免出现异常难于分析。上电后,通信接头不能与机柜等导电体相碰,互为冗余的通信线、通信接头不能碰在一起,以免烧坏通信网卡。
(10)定期对DCS主系统及与主系统连接的所有相关系统的通信负荷率进行在线测试。检查冗余主从设备状态,条件许可或定期进行主从设备切换,对设备自行切换的原因进行检查分析。
(11)增加组态易读性:对重要组态页增加了中文描述;对重要保护系统编写与组态一致的详细逻辑说明书;编制试验操作卡并保证随时更新。规范DCS组态作业,机组运行中尽量不做重大组态修改。必须进行组态时应慎重,充分做好相应的技术措施和安全措施,确保DCS和机组的安全稳定运行。
(12)定期逐台重新启动所有人机接口站一次(建议2、3个月左右),以消除计算机长期运行的累计误差。
3.2.3 停运维护
机组检修期间应对DCS 系统应进行彻底的维护,主要包括:
(1)利用机组检修时间逐个复位DCS系统的DPU、CPU和操作员站及数据站;删除组态中的无效I/O点,对组态进行优化。
(2)系统冗余测试: 对冗余电源、服务器、控制器、通讯网络进行冗余测试。注意观察系统停运过程中各设备停电时,主从设备切换、网络、人机接口站是否正常;系统检修重新上电后对各设备进行切换测试。
(3)系统灰尘清除:系统停运的情况下,整个系统进行吹灰,包括计算机内部、控制站机笼、电源箱、风扇、机柜滤网等部件的灰尘清理。
(4)系统供电线路检修,对UPS进行供电能力测试和实施放电操作。同时注意检查DPU主机卡CMOS电池电量,进行定期更换,防止因电池而引起的CMOS数据丢失。
(5)接地系统检修。包括端子检查、对地电阻测试。
(6)现场设备检修,根据检修维护规程,参照有关设备说明书进行。
(7)检查DCS系统和其他系统的接口,重要信号冗余处理,与其他系统的通信视其具体情况,采取单向传输和加装防火墙措施。
(8)系统上电:系统大修后维护负责人确认条件具备,方可上电。并应严格遵照上电步骤进行。
3.2.4 故障检修维护
系统在发生故障后应进行被动性维护,主要包括以下工作:
(1)在日常工作中应认真按照25项反措要求,充分做好包括DPU(CPU)死机、网络通讯崩溃在内的各种事故预想,将运行紧急处理措施、安全措施、技术措施、检修步骤编写成册,确保机组的安全运行。
(2)处理DCS故障按照制造厂应用手册中的要求开展工作,更换前确认卡件模块型号、地址(应确保与其他设备地址不冲突)、跳线等与被更换卡件一致并严格执行在线更换程序。
(3)故障被动维护同样应严格执行工作票制度,避免抢修冒进,应结合具体故障表现进行详细分析。根据DCS系统自诊断报警、故障现象判断,找到故障点,通过报警的消除来验证维修结果。如:通信接头接触不良会引起通信故障,确认通信接头接触不良后,利用工具重做接头;通信线破损应及时更换。某个卡件故障灯闪烁或者卡件上全部数据都为零,可能的原因是组态信息有错、卡件处于备用状态而冗余端子连接线未接、卡件本身故障、该槽位没有组态信息等。当某一生产状态异常或报警时,可以先找到反映此状态的仪表,然后顺着信号向上传递的方向,用仪器逐一检查信号的正误,直到查出故障所在。
(4)现场设备故障检修必须开具工作票,做好DCS强制和隔离措施。阀门维修时,应起用旁路阀。检修结束后及时通知集控运行人员进行检验,操作人员应将自控回路切为手动。
(5)当出现较大规模的硬件故障、原因不明故障或超出本厂维护人员技术水平的故障时,除当时采取紧急备件更换工作外,要及时和厂家取得联系,由厂家专业技术支持工程师进一步确认和排除故障。
四、结束语
DCS应进行从设计、施工、调试、运行进行全过程全方位管理,作为系统维护人员应根据系统配置和生产设备控制情况,制定科学、合理、可行的维护策略和方式方法,做到预防性维护、日常维护紧密配合,进行系统的、有计划的、定期的维护,对运行中出现的各种故障,应具体问题具体分析。减少DCS的故障关键是要做到预防第一,保证系统在要求的环境下长期良好地运行。