
当 Transwarp ArgoDB 出现故障时,对于一般故障(非紧急故障)的处理流程如下图所示:

以下向您提供流程图说明,帮助您更加清楚的了解故障处理一般流程的含义及实现方式:
编号 | 步骤 | 步骤描述 |
---|---|---|
步骤 1 |
开始 |
ArgoDB 数据库管理员发现故障,收集故障详细信息。 |
步骤 2 |
故障定位 |
根据故障影响范围及严重程度,定位紧急程度。定位方法请参考故障类型判断。 |
步骤 3 |
紧急故障 |
判断该故障是否为紧急故障。 |
步骤 4 |
应急处理流程 |
如果该故障为紧急故障,则触发故障应急处理流程。 |
步骤 5 |
故障排查,确定故障类型。 |
根据 ArgoDB 数据库故障诊断排查要点,依次排查此故障涉及的具体来源,并确定解决思路。具体故障排查方法和推荐排查次序,请参考故障排查方式。 |
步骤 6 |
故障处理 |
根据故障排查确定的故障根本原因,进行故障处理。具体故障处理方法,请参考 5 至 8 章节。处理故障过程中按需进行备份恢复、数据迁移操作。 |
步骤 7 |
故障已清除 |
故障处理完成后,测试故障是否被解决,集群是否正常运行。 |
步骤 8 |
SLA 流程;返回步骤 5。 |
|
步骤 9 |
记录处理过程 |
当故障经过测试已经成功清除之后,需要故障处理人员对整个处理过程进行记录归档,方便后续进行复盘及预防。 |
步骤 10 |
结束 |
至此,ArgoDB 故障的一般处理流程到此结束。 |