发布日期:2022-04-17 点击率:81
引言: 在影响故障修复时间的各个阶段中,除了厂商的服务标准和工程师的技术水平对故障修复时间具有重要的影响外,故障报警通知、故障初步判断等环节,由于其容易受到众多非确定因素的影响,具有很大的不确定性,同时又不为大家所重视,所以往往成为延长故障修复时间MTTR的主要原因。 衡量UPS系统安全性能的指标中,有两个指标尤其重要:一个是系统的可靠性,另一个则是可用性。作为提高电源系统质量的主要设备,UPS系统本身的可靠性、可用性,是衡量UPS系统性能最重要、最根本的指标。这里对影响UPS可用性的因素进行详尽的剖析,从而得出通过采用先迸UPS智能管理技术来提高系统可用性的有效方法。新的UPS管理技术及产品,对提高UPS系统的可用性具有重要的意义。 从系统可用性的定义可以看出,提高UPS系统可用性有两个途径:一是提高系统可靠性,即延长平均无故障时间MTBF,另一途径则是降低平均故障修复时间 MTTR。从UPS系统平均故障修复时间MTTR与UPS系统可用性的关系可以看出,缩短平均故障修复时间MTTR对提高系统可用性具有更明显的作用。 这里通过一个具体的案例详细分析平均故障修复时间MTTR的构成。所分析的案例是一台80kVA的UPS系统。如果这样的UPS系统发生故障,通常是需要厂商专业技术人员才能进行维修的。对于这样一个系统,众多厂商纷纷提出了"4小时响应"、"24小时修复"等服务承诺。但值得注意的是,这些时间并非真正的故障恢复时间。首先,所谓的"4小时响应",通常仅仅是指厂商方面的工程师在得到用户的通知到做出上门维修计划的时间,离真正故障修复还有相当的距离,而"24小时修复"则会有很多的附加条件,如发生故障的设备所在地有无工程师、备件等条件。其实,真正的故障修复时间与整个故障修复过程的每个环节都有紧密的联系。 下面就上述UPS系统故障案例的修复时间进一步地按实际分段加以详细分析时发现,一次故障修复时间由以下时间段构成: 故障报警通知时间。从故障发生到用户发现故障的时间,用T1表示。 厂商反应时间。用户将故障信息反馈给厂商的售后服务部门,到厂商售后服务工程师与用户沟通,做出上门维修计划的时间,用T2表示。 故障初步判断时间。厂商售后服务工程师通过电话等方式与用户沟通,了解故障现象和故障过程,对故障做出基本判断的时间,用T3表示。 上门服务时间。从厂商售后服务工程师通过电话等方式与用户沟通对故障做出基本判断后到上门服务的时间,用T4表示。 故障排除时间。从厂商售后服务工程师上门服务,到故障排除的时间,用T5表示。 1.首先来分析第一段时间——故障报警通知时间T1 有这样一个具体的实际案例。天津某银行数据中心,使用了1台125kVA的UPS为数据中心供电,UPS系统安装在数据中心地下2层,平时无人值守。一天上午10点,UPS系统突然出现10s的短暂停电,导致整个数据中心瘫痪。经工程师现场检查发现,UPS其实并无任何硬件故障,只是在故障发生时运行在旁路状态,经查阅UPS运行历史记录发现,当时市电正好发生10s的短暂故障停电,由于UPS运行在旁路状态,相当于市电向负载直接供电,所以市电停电直接影响到负载。但进一步检查发现,UPS实际上在两天以前就已经处于旁路状态,其原因是大容量负载启动导致的过载并锁定在旁路状态(UPS设置运行模式),尽管当时UPS已经发出了声音报警信号,由于空间距离的原因,工作人员并末听到报警声讯,所以直到发生严重的后果以后才发觉。从这个案例可以看到,通常认为并不重要的故障通知时间T1竟然长达两天。由于乃存在较大的不确定性,实际上对MTTR具有很大的影响,它可能是导致UPS系统可用性降低的重要原因。
看起来这段时间应该是很短,但是实际上它存在极大的不确定性。首先,由于中、大容量的UPS一般安装放置在专用的电源机房,由于噪音、安全等原因,电源机房平时一般无人值守。因此,如果UPS发生故障往往要等到故障产生严重后果后才会被用户发现,同时,由于UPS系统作为强电设备,需要具有专业知识、经过专门培训的人员才能进行日常的维护操作,所以在出现故障后也需要专业人员到现场进行评估、判断,然后才能进行相应的操作,这一因素也制约了故障通知的速度。正是由于上述原因,加上空间距离及专业知识方面的不确定因素,UPS的故障通知时间T1也就变得具有很大的不确定性,使它可能成为降低系统可用性的一个重要因素。
下一篇: PLC、DCS、FCS三大控
上一篇: 索尔维全系列Solef?PV