-
具备网络设备、操作系统和数据库基础知识,能熟练使用它们开展维护工作。
-
掌握故障定位方法。
-
每天监控系统,并监控操作系统参数,如硬盘使用情况、网络状况等。
应急维护注意事项
紧急故障具有危害大、后果严重的特点。为提高处理效率、最大限度的降低损失,维护人员在处理紧急故障过程中,请遵循以下注意事项:
-
应急维护以快速恢复业务和设备的正常运行为核心。因此,为提高处理效率,维护人员需提前准备好各种紧急故障的处理预案。
-
应急维护人员必须接受必要的应急维护培训,掌握紧急故障的定位和处理技能。
-
维护人员可以随时联系星环技术支持人员获取帮助。
-
故障发生后,越快恢复业务越好。
-
先定位故障部件/模块,然后再使用恢复手段。不可在定位故障前直接重新安装操作系统。
-
收集日志以便进行故障定位以及故障分析。
-
及时上报工作进度。
-
记录详细步骤。
-
遵循紧急故障处理流程。
对应急人员的要求
紧急维护人员应熟悉 IT 和网络知识、机器环境以及 ArgoDB 集群的各个服务信息等。 应达到下表中列出的要求:
类别 | 要求 |
---|---|
基本知识 |
|
ArgoDB |
了解 ArgoDB 集群及其组件的基本信息。 |
Transwarp Manager |
熟悉 Transwarp Manager 统一管理平台,了解其特性以及功能基本操作。 |
文档反馈