技术中心
 
 

DCS故障,从这十一个方面着手!

   日期:2017-06-01    
核心提示:DCS 系统具有较高的灵活性与扩展性。具有先进的过程操作画面(动态流程画面、分组回路画面、总貌画面、报警画面、趋势记录画面等), 具有各种控制功能, 运算功能, 并能实现工艺参数趋势预测, 历史数据显示和各种报警功能。从而实现对工艺生产全过程的集中监视、控制和管理。同时DCS 系统的各种模块能够热插拔, 这些都是常规仪表所不具备的或需要经过复杂的组合才能实现。

DCS 系统具有较高的灵活性与扩展性。具有先进的过程操作画面(动态流程画面、分组回路画面、总貌画面、报警画面、趋势记录画面等), 具有各种控制功能, 运算功能, 并能实现工艺参数趋势预测, 历史数据显示和各种报警功能。从而实现对工艺生产全过程的集中监视、控制和管理。同时DCS 系统的各种模块能够热插拔, 这些都是常规仪表所不具备的或需要经过复杂的组合才能实现。

 

01.DCS日常维护

DCS维护无论就化工厂、钢厂、冶金厂、电厂等等生产企业来说都有那么几分神秘无论DCS出多么微小或多么紧急的事情都只能等那么几个人到了才能动、才能处理。

在仪表维护人心里DCS维护是个高大上的神圣职业,那么DCS日常维护包括哪些内容呢?

DCS 的维护可分为:日常维护;预防性维护和故障维护,日常维护和预防维护是在系统未发生故障所进行的维护。故障维护发生在故障产生之后,往往 已造成系统部分功能失灵并对生产造成不良影响;相反,预防性维护是在系统正常运行时,对系统进行有计划的定期维护,及时掌握系统运行状态、消除系统故障隐 患、保证系统长期稳定可靠地运行,形成定期维护的概念。实践证明,定期维护能够有效地防止DCS 突发故障的产生,形成可观的间接经济效益。

DCS 系统的日常维护

系统的日常维护是DCS系统稳定高效运行的基础,主要的维护工作有以下几点:

1) 完善DCS系统管理制度。

2) 保证空调设备稳定运行,保证室温变化小于±5℃/h ,避免由于温度、湿度急剧变化导致在系统设备上的凝露。

3) 尽量避免电磁场对系统的干扰,避免移动运行中的操作站、显示器等,避免拉动或碰伤设备连接电缆和通讯电缆等。

4) 注意防尘,现场与控制室合理隔离,并定时清扫,保持清洁,防止粉尘对元件运行及散热产生不良影响;

5) 严禁使用非正版软件和安装与系统无关软件。

6) 做好控制子目录文件的备份,各自控回路的PID 参数、调节器正反作用等系统数据记录工作。

7) 检查控制主机、显示器、鼠标、键盘等硬件是否完好,实时监控工作是否正常。

8) 查看故障诊断画面,是否有故障提示。

预防维护

有计划地进行主动性、预防性维护,保证系统运行稳定可靠。根据大修周期,利用大修进行一次预防性的维护,以掌握系统运行状态,消除故障隐患。大修期间对DCS 系统应进行彻底、全面的维护,内容包括:

1) 系统冗余测试: 对冗余电源、服务器、控制器、通讯网络进行冗余测试。操作站、控制站停电检修。包括计算机内部、控制站机笼、电源箱等部件的灰尘清理。

2) 系统供电线路检修。并对UPS进行供电能力测试和实施放电操作。

3) 接地系统检修。包括端子检查、对接地电阻测试。

大修后系统维护负责人应确认条件具备方可上电,并应严格遵照上电步骤进行。

故障维护

系统使用者自身进行的日常维护,维护人员应对系统维护技术难度和可操作性有一定的认识,了解应具备的维护工具,明确哪些工作能自己完成,做到心中 有数,出现问题要及时制定可行的维护方案。对DCS系统故障维护的关键是快速、准确地判断出故障点的位置,故障维护中的一些经验总结如下下几点:

1) DCS系统往往具有丰富的自诊断功能。根据报警,可以直接找到故障点,并且还可通过报警的消除来验证维修结果。

02.DCS故障查找方向

DCS维护内容多且复杂,所以在出现故障的时候,容易没有头绪,一般常见故障,可以从以下十一个方向入手:

1、通信网络故障

通信网络类故障一般易发生在接点总线、就地总线处或因地址标识错误所造成。

2、节点总线故障

节点总线的传送介质一般为同轴电缆,有的采用令牌信号传送方式,有的采用带冲突检测的确良多路送取争用总线信号传送方式。不论采用哪种方式,当总线的干线任一处中断时,都会导致该总线上所有站及其子设备通讯故障。

目前,一般防止此类故障的方法是采用双路冗余配置的方式,避免因 一路总线发生故障而影响全局,但这并不能从根本上避免故障的发生,并且一旦一根总线发生故障,处理时极易造成另一个总线故障,其后果是非常严重的。有效的方法应是从防止总线接触不良或开路入手。比较成功的是系统的节点总线布置方式。其同轴电缆的连接不是在通信模件的前面,而是在模件的后面,这样当系统运行中处理通信模件故障时,可避免误碰同轴电缆,造成网线断路。同时,其同轴电缆除专门进行检查,任何时候都不会去触动,可防止因多次插拔同轴电缆的插头造成松动,增加其故障的可能。另外,应制定同轴电缆检查与更换管理制度,在其接触电阻增大至影响通信之前,进行更换或处理。

3、就地总线故障

就地总线或现场总线-般由双绞线组成的数据通信网络,由于其连接的设备是与生产过程直接发生联系的一次元件或控制设备,所以工作环境恶劣,故障率高,容易受到检修人员的误动而影响生产过程。另外,总线本身也会因种种原因造成通信故障。防止此类故障的有效措施是:首先要将就地总线与就地设备的联接点进行妥善处理。拆装设备时,不得影响总线的正常运行,总线分支应安装在不易碰触的地方,同时,就在总线最好是采用双路冗余酝置,以提高通信的可靠性。

4、地址标志的错误

不论是就地组件还是总线接口,一旦其地址标识错误,必然造成通信网络紊乱,所以,要防止各组件的地址标识错误,防止人为的误动、误改。系统扩展时,一般应在系统停止运行时进行。尤其是采用令牌式通信方式的系统,任何增加或减少组建的工作都必须在系统停运时,将组态情况向网络发布,以避免引起不可预料的后果。

5、硬件故障

DCS系统根据各硬件的功能不同,其故障可分为人机接口故障和过程通道故障,人机接口主要指用于实现人机联系功能的工程师站、操作员站、打印机、键盘、鼠标等;过程通道主要指就地总线、通道、过程处理机、一次元件或控制设备等。人机接口由多个功能相同的工作站组成,当其中一台发生故障时,只要处理及时,一般不会影响系统的监控操作。过程通道故障发生再就地总线或一次设备时,会直接影响控制或检测功能,因而后果比较严重。

6、人机接口故障

人机接口故障常见的有鼠标操作失效、控制操作失效、操作员站死机、薄膜键盘功能不正常、打印机不工作等。鼠标操作不正常一般是由于内部机械装置长期工作老化或污染,使触点不能可靠通断,或因电缆插接不牢固造成与主机不通信,这时只需将其更换检查即可。

控制操作失效是由于鼠标的操作信号不能改变过程通道的状态,一方面可能是过程通道硬件本身故障,另一方面可能是操作员站本身软件缺陷,在设备负荷过重或打开的过程窗口过多时,导致不响应。在检查过程通道功能正常后,应对操作员站进行检查,必要时进行重启,初始化操作员站。操作员站死机原因比较多,可能由于硬盘或卡件故障、软件本身有缺陷。

冷却风扇故障导致主机过热,或负荷过重造成。可首先检查主机本身的温升情况,其次用替代法检查硬盘、主机卡件等,以确定故障部分。

薄膜键盘在大多数操作员站上得到应用。其主要功能是快速调取过程图形,便于操作员迅速监控过程参数 。当因薄膜键盘组态错误、键盘接触不良、信号电缆松动或主机启动时误动键盘造成启动不完整,均可导致其功能不正常,应针对不同的情况进行处理。

打印机不工作一般是由于配置的原因,同时,以打印机进行屏蔽后,也会使打印功能不能进行。另外,打印机本身的硬件故障会造成其部分功能或全部功能不正常,应重新检查打印机的设置及硬件是否正常并进行处理。

7、过程通道故障

过程通道出现最多是卡件故障或就地总线故障。一种原因是卡件本身厂时间工作,元器件老化或损坏;另外,因外部信号接地或强点信号串入卡件也会导致通道故障。现在一般卡件本身都采取了良好的隔离措施,一般情况下不会导致故障的扩大,但此类故障一旦出现,则直接造成过程控制或监控功能的不正常。所以要及时查明故障原因,及时进行更换卡件。

一次原件或控制设备出现故障有时不能直接被操作员发现,只有当参数异常或报警时,方引起注意。控制处理机(过程处理机)故障一般会立即产生报警,引起操作员注意。现在控制处理机基本上全是采用1:1冗余配置,其中一台发生故障不会引起严重后果,但应立即处理故障的机器。在处理过程中,绝对不可误动正常的处理机,否则会发生严重的后果。

8、人为故障

对系统进行维护或故障处理,有时会发生认为误操作现象,这对于经常进行系统维护或新参加系统检修维护的人员来说都是会发生的。一般在修改控制逻辑、下装软件、重启设备或强制设备,保护信号是最易发生误操作事件。轻则导致部分测点、设备异常,重则造成机组或主要辅机设备停运,后果是非常严重的。在使用的化工厂,人为误操作发生的故障在不安全事件中占有很大比例。

9、电源故障

电源方面的问题也较多,如备用电源不能自投,保险配置不合理及电源内部故障等造成电源中断,温压电源波动引起保护误动及接插头接触不良导致温压电源无输出;有的系统整个机柜通过一路保险供所有输入信号或一路电源外接负载很大,还的控制电源既未接又未有冗余备用。

10、SOE工作不正常

SOE的结论对事故的分析判断起了很重要的作用,但在现实中,许多电厂发生保护动作等情况时SOE未记录下拉或记录时间与实际情况不符。如电厂#1机组出现过SOE事件顺序追忆时间与实际跳闸时间不相对应,SOE时间打印浏览后不能返回,首次跳闸原因在时间顺序未能第一个反应,SOE时间顺序数据不能设置等问题。而又的电厂在几次事故分析时发现SOE结论中的时序与历史曲线中的时序有偏差,有时甚至时序颠倒,具体表现于同一个点在历史曲线和SOE中民生时间不一致,且有时偏差很大,这会延误事故分析的进程,有时甚至误导事故分析方向。SOE问题既与系统设计不合理,SOE点没完全集中在一个上有关,也与系统硬件及软件考虑不周有关。

11、干扰造成的故障

干扰造成的故障的实例也不少。系统的干扰信号可能来自于系统本身,也可能来自于外部环境。由于不同的系统对接地都有严格要求的规定,一旦接地电阻或接地方式达不到要求,就会使网路通信的效率降低或增加误码的可能,轻则造成部分功能不正常,重则导致网络瘫痪。 电源质量同样影响系统的稳定运行。用于系统的电源既要保证电压的稳定,也要保证在一路电源故障时,无扰切换至另一路电源,否则会对系统工作产生干扰。过程控制处理机主/备处理机之间的切换有时也会导致干扰。另外,大功率的无线电通信设备如手机、对讲机等在工作时,极易造成干扰,危及系统运行。

根据以往的DCS使用检修维护管理经验,总结了DCS常见故障,希望可以帮助更多在DCS维护方面欠缺的仪表人。

2) 通信接头接触不良会引起通信故障,确认通信接头接触不良后,可以利用工具重做接头;通信线破损应及时更换。

3) 某个卡件故障灯闪烁或者卡件上全部数据都为零,可能的原因是组态信息有错、卡件处于备用状态而冗余端子连接线未接、卡件本身故障、该槽位没有组态信息等。

4) 当某一生产状态异常或报警时,我们可以先找到反映此状态的仪表,然后顺着信号向上传递的方向,用仪器逐一检查信号的正误,直到查出故障所在。

5) 当出现较大规模的硬件故障时,最大的可能是由于DCS系统环境维护不力而造成的系统运故障,除当时采取紧急备件更换和系统清扫工作外,还要及时和厂家取得联系,由厂家专业技术支持工程师进一步确认和排除故障。

对于DCS系统的维护工作,关键是要做到预防第一,作为系统维护人员应根据系统配置和生产设备控制情况,制定科学、合理、可行的维护策略和方式方 法,做到预防性维护、日常维护紧密配合,进行系统的、有计划的、定期的维护,保证系统在要求的环境下长期良好地运行,使生产过程控制平稳、运行稳定,为实 现生产和效益的目标,提供可靠保证。

 
  
  
  
  
 
更多>同类技术
 
全年征稿 / 资讯合作
 
推荐图文
推荐技术
可能喜欢