联 系 我 们
售前咨询
售后咨询
微信关注:星环科技服务号
更多联系方式 >
3.8 常见问题排查指南
更新时间:9/5/2024, 3:36:02 AM

安装过程中初始化License失败,报错步骤’安装License Node',查看失败日志发现报错内容’UnknownHostException: xx: Name or service not known'

【问题描述】

installlicense error

查看报错步骤的右侧查看日志按钮,发现如下报错

errorlog license

【解决办法】

请仔细查看manager上配置的主机名是否与服务器主机名一致,以及是否按照安装文档做好了 安装前系统配置改动 。服务器检查内容如下:

hostname error

重启容器后服务组件全部都挂掉

社区版组件服务依赖于全局服务,因此在所有组件都挂掉的情况下请优先处理全局服务:License Server、Aquila、Guardian
  1. 全局服务

    • 用户可以按序依次启动或批量全部启动:

      global service start
      global service start 2
      global service start 3
  2. 集群服务

    • 一键启动

      或按序Zookeeper → HDFS → YARN → Hyperbase → quark

      service start 1
      service start 2
      service start 3

8180 Manager页面问题

8180 Manager页面打开后无反应

【问题描述】

QA 8180.1

【解决办法】

清除缓存,重新刷新

8180 Manager页面显示拒绝访问

【问题描述】

QA24.9

【问题根因】

在启动新的容器时,环境还有正在运行的其他容器,端口未释放,导致启动新容器时端口冲突。即使后续有停止其他容器,但是此时manager自启动已失败,所以无法访问。

【解决办法】

在启动新容器之前,请再次务必确保环境上没有正在运行的其他开发版产品容器。
  1. 进入容器

    docker ps
    docker exec -it <containerid> bash
    复制
  2. 查看manager服务状态

    systemctl status transwarp-manager-db
    复制
  3. 重启manager服务

    systemctl restart transwarp-manager-db
    复制

某个服务启动失败

常规排查步骤

关于某个服务启动失败的常规排查步骤:

  1. 重试当前task,看能否启动成功

  2. 返回服务主界面,选择重启服务,看能否启动成功

  3. 通过 systemctl list-units | grep <组件名>,查找服务角色对应的service

  4. 通过 systemctl status <service_name> 查看服务角色状态

  5. 查看服务日志,看是否有明显报错

  6. 若无日志生成,通过journalctl -u <service_name> 查看服务启动日志,看是否有明显报错

端口冲突导致

【问题描述】

安装过程中您可能会遇到启动某个服务失败,比如zookeeper启动失败。

【排查思路】

进入容器内部,查看/var/log下的日志。该目录下存有TDH各服务组件的日志,当服务启动失败或遇到不可用等问题,可在此目录下查看对应服务的日志。

QA24.1

比如本示例是Zookeeper启动失败,因此查看/var/log/zookeeper1/zookeeper.log即可。

QA24.2

根据日志显示:“Address already in use”。该信息表示端口已被占用,页面有时可以显示出具体涉及的端口。 如果没有显示,可以通过下述方式确认冲突的端口信息。

  1. 查看是哪个服务哪个角色启动报错

  2. 登录manager页面查看这个服务/角色对应有哪些端口配置

  3. 通过netstat -nalp | grep <目标端口> 查看是否占用

  4. 修改端口配置到一个没被占用的端口,配置服务重启服务。

注意,由于zookeeper是基础服务,后续该服务配置更改有记录会导致quark不可用,因此zookeeper恢复正常后也需要重新配置quark并重启quark
QA24.3
QA24.4
QA24.5
QA24.5.1
QA24.6
QA24.7
QA24.8