联 系 我 们
售前咨询
售后咨询
微信关注:星环科技服务号
更多联系方式 >
5.1 Manager常见故障处理
更新时间:8/7/2024, 2:57:40 AM

问题描述

使用浏览器无法打开Manager的8180页面,显示无法访问或拒绝连接。

故障排查整体思路
Manager 8180
Manager服务启停排错
  • 登录Manager节点,执行以下命令:

ps -ef | grep ManagerMaster

或者
jps
复制

Manager 8.0之前的版本,master进程是TranswarpManagerCan

Manager 8.0及之后的版本,master进程是ManagerMaster

  • 如果进程不存在,执行以下命令启动服务:

#Manager 8.0之前的版本

/etc/init.d/transwarp-manager start

#Manager 8.0及之后的版本

systemctl  start transwarp-manager
复制

服务启动后再尝试访问8180页面,如果无法访问可以用下面步骤排查

排查服务器问题
  • 检查下磁盘空间是否足够

如果没有日志刷新,很可能是磁盘满了,清理磁盘空间最好保存在使用率低于80%。

  • 网络连接不畅

在浏览器所在的机器去ping manager节点的ip,看机器之间的网络是否正常。

如果不通请先检查网络连接,包括防火墙

  • 浏览器不支持或者浏览器缓存问题

查看安装手册,确认支持的浏览器,如果使用的浏览器不在支持列表中,请更换为支持的浏览器。

清空浏览器缓存之后尝试重新访问8180界面。

  • 检查HTTPS是否打开

如果https配置未打开,无法使用https访问8180

#Manager 8.0前版本:
/etc/transwarp-manager/master/application.conf里面参数

ssl-encryption = on


#Manager 8.0及以后版本:
/etc/transwarp-manager/master/application.properties里面参数

server.ssl.enabled=false|true
复制

Agent常见故障处理

删除节点出错
  • 删除时节点时提示有未完成的迁移操作

原因

可能因为之前的迁移操作没有做完,但是迁移状态已经修改过来了,迁移状态也是节点删除前置校验的条件之一。

解决方案

修改数据库service表的migrating,设置为0

agent节点服务启动失败
  • 端口号占用

agent启动需要10208跟48121两个端口,任何一个端口被其他进程占用都会导致启动失败。

  • 加载metricInfo目录错误

报错信息:

io.transwarp.manager.agent.metric.utils.MetricInfoHelper$$anonfun$load$1.apply(MetricInfoHelper.scala:24)
at io.transwarp.manager.agent.metric.utils.MetricInfoHelper$$anonfun$load$1.apply(MetricInfoHelper.scala:22)
复制

原因是:

agent启动过程中会加载/var/lib/transwarp-manager/agent/metricInfo/目录下的文件,如果缺少这个目录,启动会报错,如果这个目录下有除了agent自己生成的其他文件、启动也会报错。

  • 加载roleInfo目录错误

报错信息:

at io.transwarp.manager.agent.utils.RoleInfoHelper$$anonfun$load$1.apply(RoleInfoHelper.scala:19)
at io.transwarp.manager.agent.utils.RoleInfoHelper$$anonfun$load$1.apply(RoleInfoHelper.scala:17)
复制

原因:

agent启动过程中会加载/var/lib/transwarp-manager/agent/roleInfo/目录下的文件,如果缺少这个目录,启动会报错;如果这个目录下有除了agent自己生成的其他文件、启动也会报错;如果这个目录下的文件损坏、启动还是会报错.