技术中心
 
 

报警管理

   日期:2006-02-14     作者:管理员    
       在你正在管理或是设计的生产过程或者系统中设置了多少个报警?25个?100个?还是1000个?它们当中有多少会在过程故障或是系统停车的第一分钟内消失呢?工厂操作人员是否知道哪个报警应该第一个被处理?
       根据目前最新的发现,通常一个普通的操作员在过程故障混乱的情况下每一分钟只能处理一个报警。根据这个情况,我们可以很容易地认识到报警管理系统在提高操作效率和避免损失巨大的过程停车及事故方面的重要价值。我们通常把这类过程停车和事故状态称为“非正常状态”。事实上仅仅在美国的石化行业,由于没有办法诊断和控制这种非正常状态而带来的经济损失至少每年100亿美元。
  最近的一个电力行业的相关案例就是2003年8月发生在北美洲东部地区的大面积停电事故。政府部门直到现在仍然在研究当时发生在电网中的数以千计的报警和事件,以便能够准确地了解事故发生的真正原因。但是不管造成事故的真正原因是什么,至少有一点已经很清楚了:由于报警管理能力低下、报警泛滥以及由此导致的操作效率低
下、操作反应迟钝使得事故状况更加恶化。
  

如图1

  图1:6 SIGMA设计理论用来提高报警效率。

为什么会有这么多报警?
  随着生产过程和设备变得越来越复杂、要求越来越苛刻以及更加容易造成危险,报警点也相应地不断增加。最近几年,控制技术的不断发展推动着过程工业从单一的、独立的机械单元向相互依存的、指令和控制型的电子系统转变。例如,在现代化的分散控制系统(DCS)中,几乎每一个组态点都设置有多个报警。一个PID回路通常有15到20个报警,其中包括回路完整性报警、高量程报警、设定点偏差报警和许多其它报警。整个控制系统中还有可能设置了很多的系统报警,这些系统报警的数量非常之多,有时甚至比单独的过程报警更加引人注目。但是这些系统报警对于操作人员来说并没有多大的意义。
  随着时间的推移、技术的进步,为系统和过程变化设置报警变得越来越容易。因此关于报警设置的问题在工程和工厂管理工作中也越来越不被人重视。“报警越多越好”和“多设置报警点不需要多花钱”等原则主导了大家的决定。
  造成这种情况的另一个原因是“报警在悄悄的增加”。因为解决过程问题的最简单方法通常是增加另外的报警,结果造成随着时间的推移,报警系统的整体效率受到损害。专家们指出:在过去的20年中,大多数工厂中的报警系统都从“一二百个报警点增加到几百个甚至上千个报警点”。其结果是重复报警、连续不断的发生报警,有些报警点在某些时间段里甚至一直处在报警状态。这使得人们无法通过报警设定来跟踪工厂的状态。
  一个管理良好的报警系统可以及时地为操作人员提供适当的信息,这对于鉴别引起非正常状态的原因以及使系统恢复到正常状态是至关重要的。但是这样的报警系统只有通过坚持不懈的正确管理才有可能实现。对于一个现有的工厂,要作的第一步就是调整、改造现有的报警系统。本文的主要内容就是介绍怎样去进行这样的调整和改造。
  
运用6个标准差概念
  你可以在著名的6个标准差(6 SIGMA)设计理论(参见CONTROL ENGINEERING 2003年11月号62~67页,“在工作中应用6个标准差原则”)中找到提高报警效率的指导性原则:定义、测量、分析、改进和控制。这5个阶段在6个标准差循环中被称作“DMAIC过程”,它们也可以被用于改进报警系统。
  如果工程师和操作人员一起进行工作,这样的报警系统改进项目大多数会获得成功。在这里我们首先应该组建一个由职能不同、来自不同专业人员组成的团队,这个团队将指导项目的努力方向。具有成功实施报警系统改进项目经验的工厂都在项目组中包含了来自多个部门的代表:如操作部门的代表、过程工程师和安全部门人员以及控制工程师和仪表车间人员等。
  作为初步的工作,我们可以考虑安排新组建的项目组的成员参加一个由内部专家或第三方专家主持的关于报警系统改进过程的研讨会。这样可以确保项目组的所有成员都能够理解将要实施的报警管理和改进过程的重要性。
  由于报警系统改进项目部分取决于软件解决方案,因此比较谨慎的做法是在项目的准备阶段就要求你的解决方案供应商加入项目组。这样做除了可以了解工业行业中相关领域的先进经验外,他或她还可以给项目组介绍软件系统在报警分析、管理及报警系统合理化方面的可用功能,还可以指导项目组成员对这些软件工具进行最优化的应用。
  
第一阶段:定义-建立你的目标报警原则
  报警原则是一份书面的文件,它规定了怎样设计和实施一个报警系统,它还定义了在一个特定的现场或者机构内应该怎样管理报警,同时它还提供了报警组态时的架构,保证了报警组态的统一性。报警原则不仅能为你提供长期的指导,即使在当前也可以 作为你建立其它报警改进程序的基础架构。
  在编写报警原则时,行动路径必须清楚一致;这样不管是现在还是在将来,我们都可以通过适当的努力、运用合理的资源来应对正在发生报警的过程。不管是报警系统改进项目团队的成员或是其它任何人,只要他的工作内容同这个原则发生了冲突,他都必须服从原则的要求对自己进行调整。
  为了确定报警原则的内容,由不同部门人员组成的报警系统改进项目组必须集体回答下列问题:
  ■   我们的报警系统的任务是什么?
  ■   在怎样的环境下需要使用报警功能?
  ■   应该怎样设定报警的优先级别?
  ■   应该怎样处理危急报警?
  ■   应该怎样组态单独的报警?
  ■   谁应该负责我们的报警系统?
  ■   抑制报警的原则是什么?我们应该采用什么样的工具、通过怎样的程序来控制报警?
  ■   应该怎样控制“讨厌的”报警?
  ■   应该怎样监控和提高现有报警系统的性能?
  ■&nbs

p;  怎样才能使现有报警系统的变化一直处于控制之中?
  
第二阶段:测量-评估现有报警系统的性能
  一旦项目组就报警原则达成一致,我们就可以开始对现有报警系统的性能展开评估工作。在测量阶段,项目组将要鉴别所有发现的问题。这个阶段的工作还为第三阶段(分析阶段)和第四阶段(提高改进阶段)将要进行的工作提供了基础。
  在测量阶段的行动顺序应该是这样的:
  ■   收集工厂中DCS系统(分散控制系统)报警和事件日志中的报警活动数据。这个数据收集工作经常会成为对项目的一个挑战。因为很多工厂现场都没有基于DCS的诊断工具可以用来研究过程服务器中的数据文件、恢复需要的事件信息。不过有些控制系统供应商或软件供应商能够提供工具或相关的服务,这可以略微减轻此项工作的艰苦程度。电子数据表或是数据库程序也可以作为数据收集的初级代用品。
  ■   利用诊断工具处理所收集到的数据。在动态报警活动或事件的基础上计算报警性能统计数据。摘要汇总报警组态信息以便找出异常情况。这些统计数据可能包括报警活动的发生频率、这些报警活动的模式以及报警的优先级。
  ■   回顾工厂历史上发生过的事故情况,标注出重要的事件以便供将来参考。
  ■   收集设计和实施的文档、程序和实践文档以及任何可用的HAZOP信息。这些文件对报警改造过程的下一个阶段具有无可估量的价值。

如图1

                                  图2:一个报警性能标准报告可以提供一副完整的画
                                       面,告诉你怎样测量一个工厂的报警系统性能。
  

第三阶段:分析-报警性能基准
  第二阶段的任务和第三阶段的任务并不是相互排斥的。第二阶段产生和归纳出的数据只有经过分析才能变得有意义。在第三阶段里所作的分析工作还包括把经过计算得出的工厂的相关统计数据同工业标准或是性能基准进行比较。分析的目的在于从工厂现有的应用报警系统的方法中发现问题。在这个阶段,所有的问题都将被量化,问题的严重程度也会清楚的显现出来。
  这个阶段的分析工作为随后将要在第4阶段进行的重新工程组态工作提供了支持。因为它提供了一个性能和组态的基准,可以用来同现有的已经不合理的报警系统进行比较。另外,第三阶段还成为消除那些“讨厌”报警的基础,它可以为有关采用先进报警系统的决定提供帮助。虽然上面介绍了很多分析阶段的作用,但是清楚地了解你所在的工厂能够达到怎样的性能水平,这也许才是迫使你对报警性能数据进行彻底分析的根本原因。
  有许多方法可以用来分析在第二阶段中收集到的数据,限于篇幅我们不能在这里对此进行深入的讨论。但是不论你采用 哪一种方法,有3个方面的性能是至关重要的,必须对此进行深入的分析。
  第一个是以一天为单位的报警发生的频繁程度。计算每天发生报警的平均数量可以让工程师很好地了解系统在正常操作时的可用性。
  在分析报警事件发生频率的同时我们还需要考虑报警优先级的分布状况。例如,如果有几个容器在同一时间发生过热情况,是否其中某些容器发生过热情况会比其它容器发生过热情况带来更大的危险呢?在这里建立一个正确的报警优先级设置能够起到重要的作用,它可以帮助操作人员把重要报警同其它报警区别开来。
  第二个必须经过的步骤是对同一类的报警进行频率分析和报警优先级分布分析,这样可以确定当发生事故时报警系统是怎样动作的。
  最后,第三步分析是针对一些必须处理的问题:分析报警系统中存在的“麻烦制造者”。举一个例子来说明,是否在你的报警系统中发生的所有报警都是来自于两三个报警点的?或者这些报警来自于很多不同的报警点?进行一个“麻烦制造者” 分析将会帮助你确定报警系统中的“背景噪声级别”主要是由哪些报警点造成的。这个分析还可以帮助你确定:在现有的报警组态情况下,哪些过程区域的情况最为恶劣。
  报警系统经过了上述3个重要的分析以

后,还需要进行更进一步的研究以便确定以下几个问题:
  ■   如果操作人员遗漏了一个报警将会带来怎样的危险?
  ■   每一个出问题的区域对于整个报警系统造成的相对影响是什么?
  ■   造成报警集中出现的可能原因是什么?这种可能性包括:讨厌的系统报警、反复出现的报警、由于其它报警而引发的报警。这些情况都可以被归纳到下列几个原因里去:报警优先级管理不合理、报警限值或是报警死区设置不恰当。
  
第四阶段:改进-使现有报警系统合理化
  在这个改进阶段,每一个报警组态都将经过仔细审查。能够减少总体报警发生的先进技术也被引进和投入使用。例如当某个设备组停车时可以导致多个报警发生,现在应用的一种新技术就可以鉴别出这类设备组。无论这种状况发生在何处,当设备组并未处于运行状态时,基于模式的报警都可以设置成无效或受到控制。否则这些报警就会不断地干扰操作人员,在更糟糕的情况下甚至会使操作人员遗漏更加重要的报警信息。
  这个使现有报警系统合理化的行动就是很多报警管理项目的核心内容。它能显著地减少被组态的报警数量,还可以确保被保留的报警参数设置正确。它的直接效果就是报警的发生减少了。
  报警系统合理化项目成功的关键是时刻牢记四个基本目的:
  ■   经过报警系统合理化改造后,报警和警告提示应该从性能和经济性上满足生产管理的要求。
  ■   每一个报警和警告提示都要经过论证并且设计合理。
  ■   引起报警的原因必须经过鉴别。
  ■   报警失去作用造成的后果应该得到确定。
  报警系统的合理化过程包含有4个基本的步骤:
  1. 鉴别出现有报警中应该被归入警告类的内容。
  2. 鉴别出现有报警中应该被剔除的内容。
  3. 为报警确定合适的优先级和停机限值。
  4. 鉴别出尚未设置报警的危险状况。
  这些简单的步骤可以使报警现象戏剧性地减少。
  作为改进阶段的一部分,我们还需要考虑诸如报警系统合理化成果的最终批准、签发等问题;也需要考虑双向的切换计划和时间表(“双向”指得是如果在刚开始的时候报警系统合理化方案中有一个缺陷没有被觉察到,直到报警系统已经切换到了改进后的系统才发现这个缺陷;此时报警系统仍然可以被重新恢复到改进前的状态,直到这个缺陷被修复好再重新进行切换)。新组态的确认和测试是必要的。
  在报警系统合理化过程中也不能忘记重新评估操作员的操作画面。报警信息在操作台上的显示方式对操作人员是非常重要的,这将会影响操作人员辨认报警的能力,影响操作人员确定报警优先级别的能力,还会影响操作人员判断发生报警的原因和决定作出的反应。当您考虑怎样把报警信息显示给操作人员时,应该注意诸如色彩的运用、指示标记的形状和大小以及操作人员操作报警修正画面的能力等因素。为了提高操作效率,在人机界面方面我们还有很多可以考虑的地方。
  
第五阶段:控制-维护改进后的报警系统
  如果不进行相应的控制,通过报警系统合理化所作的改进将不会维持很久或者无法对报警系统进行进一步的改进。在报警系统改进过程的这个阶段,经过重新设计和组态的报警系统将会一直受到监控,以便在接下来的几个月或是几年的操作过程中继续进行改进。
  报警系统改进的成果经过测试后将会接受维护,我们还将一直努力发现其它需要改进的地方。继续进行的研究工作、事故调查工作和报警系统加强工作将会帮助我们确保报警系统不仅能够保持改进后的最新状态,还会不断地最大程度地继续提高操作人员的操作效率。
  为了获得成功,报警管理工作 必须超越一次的局限。对于一个工厂,报警系统的改进过程必须伴随着报警提示方式的改变不断进行。下面三个基本措施将有助于在全寿命期提升和维护报警管理系统的良好状态:
  不断进行继续研究工作:继续进行新的报警性能数据收集和统计工作,跟踪动态报警事件、装置发生的事故和维护费用。把这些数据和以前收集的报警系统性能评估数据进行比较,根据建立的设计规则和最佳实践基准衡量、评估报警系统目前的状况。如果有必要,可以在现有组态的基础上进行额外的改变。
  调查、研究事故时的状况:确定一个报警发生频率的高限值,当报警发生频率高于这个限值时,你就可以认为报警系统已经处于“泛滥”状态。当报警泛滥发生时,需要对操作人员的操作和工艺过程的状态进行评估-现在的状态怎样?已经发生了什么情况?有什么情况应该发生但是没有发生?你还需要建立一个日报表或是月报表制度来分析动态数据,为正常操作和事故状态操作所需要的改进提供额外的线索。

强制执行报警系统原则
  在一定的周期内用“主报警数据库”同“运行报警数据库”(主要指那些可以在运行过程中根据过程要求或是操作经验进行改动的报警设定)进行比较,同某一时刻DCS系统中实际组态的设置进行比
较。这种比较可以每周进行一次或者每个轮班进行一次,这样就可以保证不会对报警设定作出未经授权的更改。你可以采用这种方法监控和记录下任何的报警旁路或报警禁止,使操作人员可以维护、坚持报警原则的贯彻、执行。
  每个轮班开始的时候也是一个比较报警设定和主数据库信息的合适机会。这样可以使下班的操作人员有机会和接班的操作人员讨论问题,这样还可以保证接班的操作人员了解报警系统的当前状态。关于这一点,你必须记住:有些软件系统可以组态成自动复位某些基于特定过程变量或状态改变的报警。
  原文刊登于 CHEMICAL ENGINEERING杂志2005年2月刊,经Access Intelligence
  (New York, NY 10038)许可,在本刊刊登。

 
  
  
  
  
 
更多>同类技术
 
全年征稿 / 资讯合作
 
推荐图文
推荐技术
可能喜欢