DCS二层平台不可用的原因分析论文_陈善安,邹雅文

陈善安 邹雅文

(海南核电有限公司 572700)

摘要:HN核电1号机组KIC系统自2012年调试至今,KIC系统的硬件性能和稳定性一直不满足KIC系统调试和运行的要求。目前KIC软件存在着诸多问题,开发与设计人员对于操纵员的使用习惯等没有概念,导致许多功能不符合目前我厂操作员习惯与条例,还有部分功能存在一定缺陷,维持和保证KIC系统稳定运行对于机组稳定具有重大的意义。

关键词: KIC系统;KIC缺陷

时间描述

2015年12月24日,21:08分,出现KIC(电站计算机信息和控制系统,简称:KIC)系统操作员站不可用情况,主控采取应急措施,执行KIC规程切换到BUP(主控后备盘,简称:BUP)控制,稳定机组运行状态,同时通知仪控人员进行抢修处理,经仪控人员迅速抢修,22:31分,KIC平台恢复可用,主控室执行SKIC规程,从BUP控制切回到KIC控制,机组恢复到KIC控制状态,事件结束。

事件发生前机组状态

1号机组处于功率运行模式,核功率73.5%FP,电功率501MWe,机组处于KIC控制模式。

事件过程中安全系统动作描述

整个事件过程,机组保持安全稳定的功率运行,反应堆和保护屏障安全没有受到影响。

事件后果

KIC系统操作员站不可用,主控室立即采取应急措施,执行1KIC规程切换到BUP控制,如果在4小时之类无法恢复KIC系统功能,机组将降到热停堆状态。

事件分析与评价

事件序列如下:

21:08分,出现KIC系统操作员站不可用情况;

21:17分,仪控人员赶到现场,首先核查了画面显示的系统状态,发现一二层通讯出现断开的情况。经过通过检查一二层设备物理连接和供电都是正常的,确定是一二层系统间通讯出现故障;

21:37分,根据上一步核查的情况,DCS一层和二层人员分别核查系统状态,一层人员对一层送二层的网管服务器API进行检查,同时二层通过内部指令检查二层系统进行诊断。

21:52分检查KIC平台状态,没有黑屏现象发生,数据停止刷新发现CFR1CFR2(一二层数据接口服务器,简称:CFR)处于运行状态但无法与一层建立通讯,二层CFR服务器与一层AW服务器通讯全部中断,其他服务器工作正常;

22:05使用ping命令检查CFR服务器与一层AW服务器的网络通路链接,检查发现二者链接正常;

22:10查看一二层时钟状态,检查正常;

22:15(一层侧操作)关闭API软件后删除RESTORE_INDEX.DAT文件后重启API软件;

22:20硬件重启CFR1,CFR2服务器后,在SAS工作站上重新启动CFR1,CFR2服务器,CFR服务器与API服务器重启建立链接,一二层通讯恢复正常,KIC平台恢复可用。

厂家反馈根本原因分析和处理措施。

此次二层失去监控是由于触发CFR时间管理机制而引起的,CFR检测到了一层错误的对象时间,如下:

At 2014-09-26 07:35:08,096: Invalid Time-stamp for Index = 2324 - Year/month/day = 2014/ 9/ 25 - Hour/Min/sec = 22/ 23/ 35 - ms = -861

将会触发CFR第一层异常处理机制,从 interaltable(如下图)中提取相关这个对象信息并记录到CFR的Log中,但是在做firststart前没有删除旧的restore index 文件,(firststart 完成后在AW侧会产生一个新的restore index文件),会导致一层二层Index table 一些值出现不匹配现象,因此CFR 中Get_Object_Name程序在程序索引中找不到该对象,这时将会触发CFR第二层异常处理机制(fatal exception),最终导致CFR停机,导致平台数据不刷新从而失去监视功能。

针对CFR检测到从一层收到错误的时间戳数据后自动断开DCS一二层系统之间的通讯的行为,经与厂家工程师在现场召开会议讨论,认为可以取消系统因检测到错误时间戳而自动断开一二层数据通讯的功能,提高系统的容错能力。厂家在 2016年2月6日前完成软件补丁的相关评估和测试,目前在2号机组已经安装,运行情况良好,1号机组将在2月底到3月中旬的停堆小修期间进行安装,目前运行情况良好,将继续进行观察。

针对一层发送错误的数据时标问题(时钟有偏差,负毫秒级),厂家经过分析认为是由两个方面导致的:1、时钟工作站冗余工作机制有问题,在主时钟站离线时,其它的工作站同时发送校时数据导致时钟冲突;2、一层控制器固件存在问题,需要进行升级。厂家经过验证,制定了以下措施来解决该问题:

升级控制器的EEPROM(可编程存储器)固件版本(升级到:920040版);

修改1HS2HC(历史服务器)和2HS2HC的时钟管理程序HPSTK.EXE,在主时钟1MTKHC(主时钟服务器)和2STKHC(从时钟服务器)同时离线时,控制器采用机器时间做为时钟;

屏蔽除了1HS2HC、2HS2HC、1MTKHC、2STKHC以外一层工作站的时钟校时功能HPSTK.EXE,避免在主时钟离线时出现时钟冲突。

针对二层修改数据后下装FIRST start之前未及时重新生成restore_index文件的问题,厂家已经通过正式分析报告提出要求,同时现场在每次下装后系统重启前都将在API网管服务器重新生成restore_index再进行FIRST start操作,确保一层和二层对点工作的正确性。

作者简介:

陈善安,工程师,维修处,现从事仪控维修工作,chensa@hnpc.cc;

邹雅文,工程师,维修处,现从事仪控维修工作,zouyw@hnpc.cc

论文作者:陈善安,邹雅文

论文发表刊物:《电力设备》2016年第12期

论文发表时间:2016/8/25

标签:;  ;  ;  ;  ;  ;  ;  ;  

DCS二层平台不可用的原因分析论文_陈善安,邹雅文
下载Doc文档

猜你喜欢