联 系 我 们
售前咨询
售后咨询
微信关注:星环科技服务号
更多联系方式 >
9.2.2 故障处理一般流程
更新时间:5/30/2023, 6:29:38 AM

当 Transwarp ArgoDB 出现故障时,对于一般故障(非紧急故障)的处理流程如下图所示:

trouble general process
图 4.2.1:故障处理一般流程图

以下向您提供流程图说明,帮助您更加清楚的了解故障处理一般流程的含义及实现方式:

表 4.2.1:一般流程图说明
编号 步骤 步骤描述

步骤 1

开始

ArgoDB 数据库管理员发现故障,收集故障详细信息。

步骤 2

故障定位

根据故障影响范围及严重程度,定位紧急程度。定位方法请参考故障类型判断

步骤 3

紧急故障

判断该故障是否为紧急故障。

步骤 4

应急处理流程

如果该故障为紧急故障,则触发故障应急处理流程

步骤 5

故障排查,确定故障类型。

根据 ArgoDB 数据库故障诊断排查要点,依次排查此故障涉及的具体来源,并确定解决思路。具体故障排查方法和推荐排查次序,请参考故障排查方式

步骤 6

故障处理

根据故障排查确定的故障根本原因,进行故障处理。具体故障处理方法,请参考 5 至 8 章节。处理故障过程中按需进行备份恢复、数据迁移操作。

步骤 7

故障已清除

故障处理完成后,测试故障是否被解决,集群是否正常运行。

步骤 8

SLA 流程;返回步骤 5。

  • 如果故障未被清除,或集群无法正常运行,您可以选择提交星环 SLA 流程申请技术人员支持,具体 SLA 流程提交请参考《SLA 制度及流程》。

  • 或者返回步骤 5,重新进行故障排查处理,寻找其他被遗漏的原因,再依次进行处理等后续工作。

步骤 9

记录处理过程

当故障经过测试已经成功清除之后,需要故障处理人员对整个处理过程进行记录归档,方便后续进行复盘及预防。

步骤 10

结束

至此,ArgoDB 故障的一般处理流程到此结束。