
问题描述
使用浏览器无法打开Manager的8180页面,显示无法访问或拒绝连接。
故障排查整体思路

Manager服务启停排错
-
登录Manager节点,执行以下命令:
ps -ef | grep ManagerMaster 或者 jps复制
Manager 8.0之前的版本,master进程是TranswarpManagerCan Manager 8.0及之后的版本,master进程是ManagerMaster |
-
如果进程不存在,执行以下命令启动服务:
#Manager 8.0之前的版本 /etc/init.d/transwarp-manager start #Manager 8.0及之后的版本 systemctl start transwarp-manager
复制
服务启动后再尝试访问8180页面,如果无法访问可以用下面步骤排查
排查服务器问题
-
检查下磁盘空间是否足够
如果没有日志刷新,很可能是磁盘满了,清理磁盘空间最好保存在使用率低于80%。
-
网络连接不畅
在浏览器所在的机器去ping manager节点的ip,看机器之间的网络是否正常。
如果不通请先检查网络连接,包括防火墙
-
浏览器不支持或者浏览器缓存问题
查看安装手册,确认支持的浏览器,如果使用的浏览器不在支持列表中,请更换为支持的浏览器。
清空浏览器缓存之后尝试重新访问8180界面。
-
检查HTTPS是否打开
如果https配置未打开,无法使用https访问8180
#Manager 8.0前版本: /etc/transwarp-manager/master/application.conf里面参数 ssl-encryption = on #Manager 8.0及以后版本: /etc/transwarp-manager/master/application.properties里面参数 server.ssl.enabled=false|true
复制
Agent常见故障处理
删除节点出错
-
删除时节点时提示有未完成的迁移操作
原因
可能因为之前的迁移操作没有做完,但是迁移状态已经修改过来了,迁移状态也是节点删除前置校验的条件之一。
解决方案
修改数据库service表的migrating,设置为0
agent节点服务启动失败
-
端口号占用
agent启动需要10208跟48121两个端口,任何一个端口被其他进程占用都会导致启动失败。
-
加载metricInfo目录错误
报错信息:
io.transwarp.manager.agent.metric.utils.MetricInfoHelper$$anonfun$load$1.apply(MetricInfoHelper.scala:24) at io.transwarp.manager.agent.metric.utils.MetricInfoHelper$$anonfun$load$1.apply(MetricInfoHelper.scala:22)
复制
原因是:
agent启动过程中会加载/var/lib/transwarp-manager/agent/metricInfo/目录下的文件,如果缺少这个目录,启动会报错,如果这个目录下有除了agent自己生成的其他文件、启动也会报错。
-
加载roleInfo目录错误
报错信息:
at io.transwarp.manager.agent.utils.RoleInfoHelper$$anonfun$load$1.apply(RoleInfoHelper.scala:19) at io.transwarp.manager.agent.utils.RoleInfoHelper$$anonfun$load$1.apply(RoleInfoHelper.scala:17)
复制
原因:
agent启动过程中会加载/var/lib/transwarp-manager/agent/roleInfo/目录下的文件,如果缺少这个目录,启动会报错;如果这个目录下有除了agent自己生成的其他文件、启动也会报错;如果这个目录下的文件损坏、启动还是会报错.