自动柜员机、自动售票机、自动检票机、自动充值机、自动缴费机、自动售货机等可以统称为
自助终端设备。
自助终端设备具有以下特点:属于基于计算机的智能自动化设备;通常为批量部署,一个项目的设备数以百计或数以千计;通常客户是运营商;终端用户是公众,但也包括系统管理人员、系统维护人员、运营操作人员。
站在采购方的角度,最关注设备的可用性,而与可用性密切关联的,是平均故障维修时间(MTTR)和平均故障间隔时间(MTBF),通常在标书中会对此提出明确要求。
但在实践中,当系统交付使用后,客户实际上是运营方,站在运营方的角度,最关注的指标是响应及时性和故障纠正的有效性。抽象和概括为以下度量指标:
故障纠正指数、故障响应及时性、故障修复拖延率、故障修复质量。
当资源有限时(实际上通常都是有限的),为了有效地改善上述指标,需要对数以千计的故障模式确定一个优先处理的顺序,换句话说,确定一个故障综合风险指数,以量化度量的方式确定故障处理的优先级别。
本文简单介绍一下自助终端设备故障综合风险指数算法:
算法的设计借鉴美军标MIL-STD-1629A中关于武器系统风险控制的方法,基本思路是:确定影响综合风险的主要因素,确定主要因素量化的估值准则,确定一种故障风险优先指数(RPN,Risk Priority Numbers)的算法,对各种故障模式依据主要因素的量化值计算其RPN。
在美军标1629A中,确定RPN的主要因素是:故障对系统影响的严重程度(Severity)、故障发生的频度(Occurrence)和预定的测试或检查工作在消除缺陷或发现故障模式方面的能力(侦测度Detection)等3项,RPN=S*O*D。S、O、D的取值范围,一般为1-10。
我们在自助终端设备的故障分析实践中,为适应现实的需求,做了七方面的改进,以便在自助终端设备实践中使过程更为简单、方便和直观:
1、用客户关注度I(Customer Impact)替代严重程度S;
2、保留故障发生的频次O,但其评估准则的依据用频度帕累托分析(PA,Pareto Analysis)结果的相对顺序代替短期制程能力指数PPK。
3、用特定故障模式在2个观察周期中故障发生频次的变化率V替代侦测度D,其评估准则的依据是变化率V的帕累托分析结果;
4、确定自助终端设备I、O、V的判定依据和评估准则;
5、限制I、O、V的取值范围,以简化过程实现;
6、用综合风险指数CRI替代风险优先指数RPN;
7、提出在特定故障观察周期内计算“PA by CRI”作为风险应对的决策依据。