配置,当时无法处理,后在机组调停时,通过对基本级上的REG卡复位,系统恢复了正常。
(5)软件组态错误引起:有台机组进行#1中压调门试验时,强制关闭中间变量IV1RCO信号,引起#1-#4中压调门关闭,负荷从198MW降到34MW,再热器压力从2.04MP升到4.0Mpa,再热器安全门动作。故障原因是厂家的DEH组态,未按运行方式进行,流量变量本应分别赋给IV1RCO-IV4RCO,实际组态是先赋给IV1RCO,再通过IV1RCO分别赋给IV2RCO-IV4RCO。因此当强制IV1RCO=0时,所有调门都关闭,修改组态文件后故障消除。
2.5 电源系统故障案例分析
DCS的电源系统,通常采用1:1冗余方式(一路由机组的大UPS供电,另一路由电厂的保安电源供电),任何一路电源的故障不会影响相应过程控制单元内模件及现场I/O模件的正常工作。但在实际运行中,子系统及过程控制单元柜内电源系统出现的故障仍为数不少,其典型主要有:
(1)电源模件故障:电源模件有电源监视模件、系统电源模件和现场电源模件3种。现场电源模件通常在端子板上配有熔丝作为保护,因此故障率较低。而前二种模件的故障情况相对较多:1)系统电源模件主要提供各不同等级的直流系统电压和I/O模件电压。该模件因现场信号瞬间接地导致电源过流而引起损坏的因素较大。因此故障主要检查和处理相应现场I/O信号的接地问题,更换损坏模件。如有台机组负荷520MW正常运行时MFT,首出原因“汽机跳闸\。CRT画面显示二台循泵跳闸,备用盘上循泵出口阀<86°信号报警。5分钟后运行巡检人员就地告知循泵A、B实际在运行,开关室循泵电流指示大幅晃动且A大于B。进一步检查机组PLC诊断画面,发现控制循泵A、B的二路冗余通讯均显示“出错”。43分钟后巡检人员发现出口阀开度小就地紧急停运循泵A、B。事后查明A、B两路冗余通讯中断失去的原因,是为通讯卡提供电源支持的电源模件故障而使该系统失电,中断了与PLC主机的通讯,导致运行循泵A、B状态失去,凝汽器保护动作,机组MFT。更换电源模件后通讯恢复正常。事故后热工制定的主要反事故措施,是将两台循泵的电流信号由PLC改至DCS的CRT显示,消除通信失去时循泵运行状态无法判断的缺陷;增加运行泵跳闸关其出口阀硬逻辑(一台泵运行,一台泵跳闸且其出口阀开度>30度,延时15秒跳运行泵硬逻辑;一台泵运行,一台泵跳闸且其出口阀开度>0度,逆转速动作延时30秒跳运行泵硬逻辑);修改凝汽器保护实现方式。2)电源监视模件故障引起:电源监视模件插在冗余电源的中间,用于监视整个控制站电源系统的各种状态,当系统供电电压低于规定值时,它具有切断电源的功能,以免损坏模件。另外它还提供报警输出触点,用于接入硬报警系统。在实际使用中,电源监视模件因监视机箱温度的2个热敏电阻可靠性差和模件与机架之间接触不良等原因而故障率较高。此外其低电压切断电源的功能也会导致机组误跳闸,
如有台机组满负荷运行,BTG盘出现“CCS控制模件故障”报警,运行人员发现部分CCS操作框显示白色,部分参数失去,且对应过程控制站的所有模件显示白色,6s后机组MFT,首出原因为“引风机跳闸”。约2分钟后CRT画面显示恢复正常。当时检查系统未发现任何异常(模件无任何故障痕迹,过程控制站的通讯卡切换试验正常)。机组重新启动并网运行也未发现任何问题。事后与厂家技术人员一起专题分析讨论,并利用其它机组小修机会对控制系统模拟试验验证后,认为事件原因是由于该过程控制站的系统供电电压瞬间低于规定值时,其电源监视模件设置的低电压保护功能作用切断了电源,引起控制站的系统电源和24VDC、5VDC或15VDC的瞬间失去,导致该控制站的所有模件停止工作(现象与曾发生过的24VDC接地造成机组停机事件相似),使送、引风机调节机构的控制信号为0,送风机动叶关闭(气动执行机构),引风机的电动执行机构开度保持不变(保位功能),导致炉膛压力低,机组MFT。
(2)电源系统连接处接触不良:此类故障比较典型的有:1)电源系统底板上5VDC电压通常测量值在5.10~5.20VDC之间,但运行中测量各柜内进模件的电压很多在5V以下,少数跌至4.76VDC左右,引起部分I/O卡不能正常工作。经查原因是电源底板至电源母线间连接电缆的多芯铜线与线鼻子之间,表面上接触比较紧,实际上因铜线表面氧化接触电阻增加,引起电缆温度升高,压降增加。在机组检修中通过对所有5VDC电缆铜线与线鼻子之间的焊锡处理,问题得到解决。2)MACS-ⅠDCS运行中曾在两个月的运行中发生2M801工作状态显示故障而更换了13台主控单元,但其中的多数离线上电测试时却能正常启动到工作状态,经查原因是原主控5V电源,因线损和插头耗损而导致电压偏低;通过更换主控间的冗余电缆为预制电缆;现场主控单元更换为2M801E-D01,提升主控工作电源单元电压至5.25V后基本恢复正常。3)有台机组负荷135MW时,给水调门和给水旁路门关小,汽包水位急速下降引发MFT。事后查明原因是给水调门、给水旁路门的端子板件电源插件因接触不良,指令回路的24V电源时断时续,导致给水调门及给水旁路门在短时内关下,汽包水位急速下降导致MFT。4)有台机组停炉前,运行将汽机控制从滑压切至定压后,发现DCS上汽机调门仍全开,主汽压力4260kpa,SIP上显示汽机压力下降为1800kpa,汽机主保护未动作,手动拍机。故障原因系汽机系统与DCS、汽机显示屏通讯卡件BOX1电源接触点虚焊、接触不好,引起通讯故障,使DCS与汽机显示屏重要数据显示不正常,运行因汽机重要参数失准手动拍机。经对BOX1电源接触点重新焊接后通讯恢复。5)循泵正常运行中曾发出#2UPS失电报警,20分钟后对应的#3、#4循泵跳闸。由于运行人员处理及时,未造成严重后果。热工人员对就地进行检查发现#2UPS输入电源插头松动,导致#2UPS失电报警。进行专门试验结果表明,循泵跳闸原因是UPS输入电源失去后又恢复的过程中,引起PLC输入信号抖动误发跳闸信号。
(3)UPS功能失效:有台机组呼叫系统的喇叭有杂音,通信班人员关掉该系统的主机电源查原因并处理。重新开
启该主机电源时,呼叫系统杂音消失,但集控室右侧CRT画面显示全部失去,同时MFT信号发出。经查原因是由于呼叫系统主机电源接至该机组主UPS,通讯人员在带载合开关后,给该机组主UPS电源造成一定扰动,使其电压瞬间低于195V,导致DCS各子系统后备UPS启动,但由于BCS系统、历史数据库等子系统的后备UPS失去带负荷能力(事故后试验确定),造成这些系统失电,所有制粉系统跳闸,机组由于“失燃料”而MFT 。
(4)电源开关质量引起:电源开关故障也曾引起机组多次MFT,如有台机组的发电机定冷水和给水系统离线,汽泵自行从“自动”跳到“手动”状态;在MEH上重新投入锅炉自动后,汽泵无法增加流量。1分钟后锅炉因汽包水位低MFT动作。故障原因经查是DCS 给水过程控制站二只电源开关均烧毁,造成该站失电,导致给水系统离线,无法正常向汽泵发控制信号,最终锅炉因汽包水位低MFT动作。
2.6 SOE信号准确性问题处理
一旦机组发生MFT或跳机时,运行人员首先凭着SOE信号发生的先后顺序来进行设备故障的判断。因此SOE记录信号的准确性,对快速分析查找出机组设备故障原因有着很重要的作用。这方面曾碰到过的问题有:
(1)SOE信号失准:由于设计等原因,基建接受过来的机组,SOE信号往往存在着一些问题(如SOE系统的信号分辨力达不到指标要求却因无测试仪器测试而无法证实,信号源不是直接取自现场,描述与实际不符,有些信号未组态等等),导致SOE信号不能精确反映设备的实际动作情况。有台机组MFT时,光字牌报警“全炉膛灭火”,检查DCS中每层的3/4火检无火条件瞬间成立,但SOE却未捉捕到“全炉膛灭火”信号。另一台机组MFT故障,根据运行反映,首次故障信号显示“全炉膛灭火”,同时有“DCS电源故障”报警,但SOE中却未记录到DCS电源故障信号。这使得SOE系统在事故分析中的作用下降,增加了查明事故原因的难度。为此我省各电厂组织对SOE系统进行全面核对、整理和完善,尽量做到SOE信号都取自现场,消除SOE系统存在的问题。同时我们专门开发了SOE信号分辨力测试仪,经浙江省计量测试院测试合格后,对全省所属机组SOE系统分辨力进行全部测试,掌握了我省DCS的SOE系统分辨力指标不大于1ms的有四家,接近1ms的有二家,4ms的有一家。
(2)SOE报告内容凌乱:某电厂两台30万机组的INFI-90分散控制系统,每次机组跳闸时生成的多份SOE报告内容凌乱,启动前总是生成不必要的SOE报告。经过1)调整SEM执行块参数, 把触发事件后最大事件数及触发事件后时间周期均适当增大。2)调整DSOE Point 清单,把每个通道的Simple Trigger由原来的BOTH改为0TO1,Recordable Event。3)重新下装SEM组态后,问题得到了解决。
(3)SOE报表上出现多个点具有相同的时间标志:对于INFI-90分散控制系统,可能的原因与处理方法是:1)某个SET或SED模件被拔出后在插入或更换,导致该子模件上的所有点被重新扫描并且把所有状态为1的点(此时这些点均有相同的跳闸时间)上报给SEM。2)某个MFP主模件的SOE缓冲区设置太小产生溢出,这种情况下,MFP将会执行内部处理而复位SOE,导致其下属的所有SET或SED子模件中,所有状态为1的点(这些点均有相同跳闸时间)上报给了SEM模件。处理方法是调整缓冲区的大小(其值由FC241的S2决定,一般情况下调整为100)。3)SEM收到某个MFP的事件的时间与事件发生的时间之差大于设定的最大等待时间(由FC243的S5决定),则SEM将会发一个指令让对应的MFP执行SOE复位,MFP重新扫描其下属的所有SOE点,且将所有状态为1 的点(这些点均有相同的跳闸时间)上报给SEM,。在环路负荷比较重的情况下(比如两套机组通过中央环公用一套SEM模件),可适当加大S5值,但最好不要超过60秒。 2.7 控制系统接线原因
控制系统接线松动、错误而引起机组故障的案例较多,有时此类故障原因很难查明。此类故障虽与控制系统本身质量无关,但直接影响机组的安全运行,如:
(1)接线松动引起:有台机组负荷125MW,汽包水位自动调节正常,突然给水泵转速下降,执行机构开度从64%关至5%左右,同时由于给水泵模拟量手站输出与给水泵液偶执行机构偏差大(大于10%自动跳出)给水自动调节跳至手动,最低转速至1780rpm,汽包水位低低MFT动作。原因经查是因为给水泵液偶执行机构与DCS的输出通道信号不匹配,在其之间加装的信号隔离器,因24VDC供电电源接线松动失电引起。紧固接线后系统恢复正常。事故后对信号隔离器进行了冗余供电。
(2)接线错误引起:某#2 机组出力300MW时,#2B汽泵跳闸(无跳闸原因首出、无大屏音响报警),机组RB动作,#2E磨联锁跳闸,电泵自启,机组被迫降负荷。由于仅有ETS出口继电器动作记录, 无#2B小机跳闸首出和事故报警,且故障后的检查试验系统都正常,当时原因未查明。后机组检修复役前再次发生误动时,全面检查小机现场紧急跳闸按钮前接的是电源地线,跳闸按钮后至PLC,而PLC后的电缆接的是220V电源火线,拆除跳闸按钮后至PLC的电缆,误动现象消除,由此查明故障原因是是跳闸按钮后至PLC的电缆发生接地,引起紧急跳闸系统误动跳小机。
(3)接头松动引起:一台机组备用盘硬报警窗处多次出现“主机EHC油泵2B跳闸”和“开式泵2A跳闸”等信号误报警,通过CRT画面检查发现PLC的 A路部分I/O柜通讯时好时坏,进一步检查发现机侧PLC的3A、4、5A和6的4个就地I/O柜二路通讯同时时好时坏,与此同时机组MFT动作,首出原因为汽机跳闸。原因是通讯母线B路在PLC4柜内接头和PLC5、PLC4柜本身的通讯分支接头有轻微松动,通过一系列的紧固后通讯恢复正常。 针对接线和接头松动原因引起的故障,我省在基建安装调试和机组检修过程中,通过将手松拉接线以以确认接线
是否可靠的方法,列入质量验收内容,提高了接线质量,减少了因接线质量引起的机组误动。同时有关电厂 制定了热工控设备通讯电缆随机组检修紧固制度,完善控制逻辑,提高了系统的可靠性。 2.8 控制系统可靠性与其它专业的关系
需要指出的是MFT和ETS保护误动作的次数,与有关部门的配合、运行人员对事故的处理能力密切相关,类似的故障有的转危为安,有的导致机组停机。一些异常工况出现或辅机保护动作,若运行操作得当,本可以避免MFT动作(如有台机组因为给煤机煤量反馈信号瞬时至零,30秒后逻辑联锁磨煤机热风隔离挡板关闭,引起一次风流量急降和出口风温持续下跌,热风调节挡板自动持续开至100%,冷风调节挡板由于前馈回路的作用而持续关小,使得一次风流量持续下降。但由于热风隔离挡板有卡涩,关到位信号未及时发出,使得一次风流量小至造成磨煤机中的煤粉积蓄,第5分钟时运行减少了约10%的煤量,约6分钟后热风隔离挡板突然关到位,引起一次风流量的再度急剧下降,之后按设计连锁逻辑,冷风隔离挡板至全开,使得一次风流量迅速增大,并将磨煤机C中的蓄煤喷向炉膛,造成锅炉燃烧产生局部小爆燃,引风机自动失控于这种异常情况,在三个波的扰动后(约1分钟),炉膛压力低低MFT。当时MFT前7分钟的异常工况运行过程中,只要停运该台磨煤机就可避免MFT故障的发生)。此外有关部门与热工良好的配合,可减少或加速一些误动隐患的消除;因此要减少机组停组次数,除热工需在提高设备可靠性和自身因素方面努力外,还需要热工和机务的协调配合和有效工作,达到对热工自动化设备的全方位管理。需要运行人员做好事故预想,完善相关事故操作指导,提高监盘和事故处理能力。 3 提高热工自动化系统可靠性的建议
随着热工系统覆盖机、电、炉运行的所有参数,监控功能和范围的不断扩大以及机组运行特点的改变和DCS技术的广泛应用,热控自动化设备已由原先的配角地位转变为决定机组安全经济运行的主导因素,其任一环节出现问题,都有导致热控装置部分功能失效或引发系统故障,机组跳闸、甚至损坏主设备的可能。因此如何通过科学的基础管理,确保所监控的参数准确、系统运行可靠是热工安全生产工作中的首要任务。在收集、总结、吸收同仁们自动化设备运行检修、管理经验和保护误动误动原因分析的基础上,结合热工监督工作实践,对提高热工保护系统可靠性提出以下建议,供参考: 3.1 完善热工自动化系统
(1)解决操作员站电源冗余问题:过程控制单元柜的电源系统均冗余配置,但所有操作员站的电源通常都接自本机组的大UPS,不提供冗余配置。如果大UPS电压波动,将可能引起所有操作员站死机而不得不紧急停运机组,但由于死机后所有信号都失去监视,停机也并非易事。为避免此类问题发生,建议将每台机组的部份操作员站与另一台机组的大UPS交叉供电,以保证当本机大UPS电压波动时,仍有2台OIS在正常运行。
(2)对硬件的冗余配置情况进行全面核查,重要保护信号尽可能采取三取二方式,消除同参数的多信号处理和互为备用设备的控制回路未分模件、分电缆或分电源(对互为备用的设备)现象,减少一模件故障引起保护系统误