发电厂#1机组POC站异常离线分析处理分享
发电厂#1机组POC站异常离线分析处理分享
一、故障现象
POC站频繁异常离线时间线整理
故障现象:
1、DCS系统状态页面POC站离线状态报警(红色报警离线,图1为正常运行状态,仅POC9离线作为维护站);
图1 机组正常运行DCS系统状态
2、系统信息弹框报离线状态,操作系统数据刷新、显示正常,正常电脑运行可监视操作;
3、POC8离线时,实时趋势暂停刷新,显示屏黑屏,其他POC站仅离线报警,无其他异常。
图2 POC第1次离线报警记录
二、检查过程
1、检查过程
检查操作站数据收发正常,查看电脑光网、以太网网口连接正常,查看交换机、LANBOX指示灯状态正常,无单网故障报警,主工程师站小黑框无光网异常报警,判断光网正常。重点排查以太网。
图3 交换机运行正常
检查SAP主从分配:POC5为主系,POC1为SAP监控、HIST1为历史数据处理和输入处理。
检查日立操作系统日志报警。
检查工程师站小黑框报警内容。
检查系统信息弹框报警及信息一览记录,整理异常时间线。
检查主系电脑POC5负荷率(40%)。
2、处理过程
逐一退出POC站日立CV8系统并重启,将所有操作站完成程序重启。
将主系POC5保持离线状态,缓减以太网负荷。
3、收集错误信息移交日立厂家分析:所有POC站CV8系统备份日志文件、OS系统错误信息记录、计算机错误信息记录。
三、日立分析回复
故障原因:目前本厂日立系统为CV8.10.03,POC8电脑长时间记录实时趋势显示,引起计算机内存高,从而使计算机访问网络出现延时,误报其他POC站离线信息。
解决方法:
1、临时解决办法:出现该情况,将离线电脑的实时趋势关闭,退出并重启日立CV8操作系统。
2、终极解决办法:POC站升级,新版本已经解决实时趋势引起的内存高问题。
四、后续措施
基于日立厂家恢复和我厂实际情况,采取以下预防措施:
1、运行减少小窗口的不必要使用,降低非必要的实时趋势显示。
2、#1机组操作系统已计划本年度升级系统及硬件,维护在此期间加强操作站的日常巡检和维护。
3、关注同类型(如四管泄露)记录并读取历史数据的工控设备运行情况,提高巡检频次。
4、建议运行部定期更换除了大屏以外的其他电脑实时趋势显示,减少单台电脑长期高负荷运行产生内存升高。