故障处理原则
- 故障分析、定位和处理原则:
- 以尽快恢复业务为原则。
- 定位故障时,应及时采集故障数据信息,并尽量将采集到的故障数据信息保存在移动存储介质中或其它计算机中。
- 在确定故障处理的方案时,应先评估影响,优先保证业务的正常运行。
- 第三方的硬件故障,可查看第三方的相关资料或拨打第三方公司的服务电话。
- 如果无法定位出故障点或无法按手册解决故障,及时联系技术支持,最大程度减少业务中断时间。
- 定位处理前注意事项:
- 严格遵守操作规程和行业安全规程,确保人身安全与设备安全。
- 应先分析故障现象,定位原因后再进行处理。在原因不明的情况下应避免盲目操作,导致问题扩大化。
- 在处理故障前,需要保留好故障现场的任何记录,不能随意删除数据或日志。
- 在处理故障时,为了确保客户网络的安全和隐私,如果需要采集相关故障日志,请事先得到客户的同意和授权。
- 在进行任何修改前,应先通过脚本导出、手工备份等方式备份数据。
- 更换和维护设备部件过程中,要做好防静电措施,佩戴防静电腕带。
- 在维护过程中遇到的任何问题,应详细记录各种原始信息。
- 所有的重大操作,如重启进程等操作,均应作记录,并在操作前仔细确认操作的可行性,在作好相应的备份、应急和安全措施后,方可由有资格的操作人员执行。
- 在系统恢复后,必须对运行情况进行观察,确认故障已经排除并及时填写相关的处理报告。
- 慎重使用高危操作及命令。
- 对维护人员的要求:
- 具备网络设备、操作系统和数据库基础知识,掌握其常用的操作命令,并能熟练使用它们开展维护工作。
- 熟知现场业务系统的逻辑结构、系统各部件和现场设备的对应关系以及现场设备之间的物理连接关系。
- 熟悉业务流程、系统结构,能熟练操作业务相关的软硬件。
- 了解基本故障相关定位和处理方法。
- 掌握远程接入方式的使用。
父主题: 概述