CDH升级数据迁移

CDH在大数据平台的应用,帮助企业,更全面、更便捷、更智能、更安全地运用数据,加速企业数字化转型。TDH的存储与计算组件兼容CDH/HDP,可以实现平滑迁移,大大降低企业迁移成本低。专业的迁移工具实现数据一键迁移,高效便捷。此外,星环科技已经有大量的迁移成功案例,经验丰富,保障整个迁移过程安全可靠。本文将基于某金融机构的数据仓库批处理场景来手把手带领大家“三步”完成CDH到星环TDH的平滑迁移张表和脚本,百TB级别数据量,这里我们对其中完整逻辑做了抽象,精简的过程便以理解迁移过程。CDH集群信息硬件信息节点数3CPU40核/节点内存256G/节点磁盘12*1.7T/节点软件信息软件版),之后我们就可以在TBAK的可视化界面通过简单的“三步”来实现CDH到星环TDH的平滑迁移。TranswarpBackup(TBAK)是星环的大数据平台数据备份恢复软件,可独立于生产集群与备份集群、迁移。三步实现CDH到星环TDH的平滑迁移Step1配置CDH和TDH集群该步骤主要是用来配置CDH和TDH集群,为后续数据迁移做准备。星环TBAK提供可视化的界面进行集群配置,我们根据界面指引式向导

CDH升级数据迁移 更多内容

CDH在大数据平台的应用,帮助企业,更全面、更便捷、更智能、更安全地运用数据,加速企业数字化转型。TDH的存储与计算组件兼容CDH/HDP,可以实现平滑迁移,大大降低企业迁移成本低。专业的迁移工具实现数据一键迁移,高效便捷。此外,星环科技已经有大量的迁移成功案例,经验丰富,保障整个迁移过程安全可靠。本文将基于某金融机构的数据仓库批处理场景来手把手带领大家“三步”完成CDH到星环TDH的平滑迁移张表和脚本,百TB级别数据量,这里我们对其中完整逻辑做了抽象,精简的过程便以理解迁移过程。CDH集群信息硬件信息节点数3CPU40核/节点内存256G/节点磁盘12*1.7T/节点软件信息软件版),之后我们就可以在TBAK的可视化界面通过简单的“三步”来实现CDH到星环TDH的平滑迁移。TranswarpBackup(TBAK)是星环的大数据平台数据备份恢复软件,可独立于生产集群与备份集群、迁移。三步实现CDH到星环TDH的平滑迁移Step1配置CDH和TDH集群该步骤主要是用来配置CDH和TDH集群,为后续数据迁移做准备。星环TBAK提供可视化的界面进行集群配置,我们根据界面指引式向导
CDH在大数据平台的应用,帮助企业,更全面、更便捷、更智能、更安全地运用数据,加速企业数字化转型。TDH的存储与计算组件兼容CDH/HDP,可以实现平滑迁移,大大降低企业迁移成本低。专业的迁移工具实现数据一键迁移,高效便捷。此外,星环科技已经有大量的迁移成功案例,经验丰富,保障整个迁移过程安全可靠。本文将基于某金融机构的数据仓库批处理场景来手把手带领大家“三步”完成CDH到星环TDH的平滑迁移张表和脚本,百TB级别数据量,这里我们对其中完整逻辑做了抽象,精简的过程便以理解迁移过程。CDH集群信息硬件信息节点数3CPU40核/节点内存256G/节点磁盘12*1.7T/节点软件信息软件版),之后我们就可以在TBAK的可视化界面通过简单的“三步”来实现CDH到星环TDH的平滑迁移。TranswarpBackup(TBAK)是星环的大数据平台数据备份恢复软件,可独立于生产集群与备份集群、迁移。三步实现CDH到星环TDH的平滑迁移Step1配置CDH和TDH集群该步骤主要是用来配置CDH和TDH集群,为后续数据迁移做准备。星环TBAK提供可视化的界面进行集群配置,我们根据界面指引式向导
CDH在大数据平台的应用,帮助企业,更全面、更便捷、更智能、更安全地运用数据,加速企业数字化转型。TDH的存储与计算组件兼容CDH/HDP,可以实现平滑迁移,大大降低企业迁移成本低。专业的迁移工具实现数据一键迁移,高效便捷。此外,星环科技已经有大量的迁移成功案例,经验丰富,保障整个迁移过程安全可靠。本文将基于某金融机构的数据仓库批处理场景来手把手带领大家“三步”完成CDH到星环TDH的平滑迁移张表和脚本,百TB级别数据量,这里我们对其中完整逻辑做了抽象,精简的过程便以理解迁移过程。CDH集群信息硬件信息节点数3CPU40核/节点内存256G/节点磁盘12*1.7T/节点软件信息软件版),之后我们就可以在TBAK的可视化界面通过简单的“三步”来实现CDH到星环TDH的平滑迁移。TranswarpBackup(TBAK)是星环的大数据平台数据备份恢复软件,可独立于生产集群与备份集群、迁移。三步实现CDH到星环TDH的平滑迁移Step1配置CDH和TDH集群该步骤主要是用来配置CDH和TDH集群,为后续数据迁移做准备。星环TBAK提供可视化的界面进行集群配置,我们根据界面指引式向导
CDH在大数据平台的应用,帮助企业,更全面、更便捷、更智能、更安全地运用数据,加速企业数字化转型。TDH的存储与计算组件兼容CDH/HDP,可以实现平滑迁移,大大降低企业迁移成本低。专业的迁移工具实现数据一键迁移,高效便捷。此外,星环科技已经有大量的迁移成功案例,经验丰富,保障整个迁移过程安全可靠。本文将基于某金融机构的数据仓库批处理场景来手把手带领大家“三步”完成CDH到星环TDH的平滑迁移张表和脚本,百TB级别数据量,这里我们对其中完整逻辑做了抽象,精简的过程便以理解迁移过程。CDH集群信息硬件信息节点数3CPU40核/节点内存256G/节点磁盘12*1.7T/节点软件信息软件版),之后我们就可以在TBAK的可视化界面通过简单的“三步”来实现CDH到星环TDH的平滑迁移。TranswarpBackup(TBAK)是星环的大数据平台数据备份恢复软件,可独立于生产集群与备份集群、迁移。三步实现CDH到星环TDH的平滑迁移Step1配置CDH和TDH集群该步骤主要是用来配置CDH和TDH集群,为后续数据迁移做准备。星环TBAK提供可视化的界面进行集群配置,我们根据界面指引式向导
CDH在大数据平台的应用,帮助企业,更全面、更便捷、更智能、更安全地运用数据,加速企业数字化转型。TDH的存储与计算组件兼容CDH/HDP,可以实现平滑迁移,大大降低企业迁移成本低。专业的迁移工具实现数据一键迁移,高效便捷。此外,星环科技已经有大量的迁移成功案例,经验丰富,保障整个迁移过程安全可靠。本文将基于某金融机构的数据仓库批处理场景来手把手带领大家“三步”完成CDH到星环TDH的平滑迁移张表和脚本,百TB级别数据量,这里我们对其中完整逻辑做了抽象,精简的过程便以理解迁移过程。CDH集群信息硬件信息节点数3CPU40核/节点内存256G/节点磁盘12*1.7T/节点软件信息软件版),之后我们就可以在TBAK的可视化界面通过简单的“三步”来实现CDH到星环TDH的平滑迁移。TranswarpBackup(TBAK)是星环的大数据平台数据备份恢复软件,可独立于生产集群与备份集群、迁移。三步实现CDH到星环TDH的平滑迁移Step1配置CDH和TDH集群该步骤主要是用来配置CDH和TDH集群,为后续数据迁移做准备。星环TBAK提供可视化的界面进行集群配置,我们根据界面指引式向导
在当今数字化时代,数据被视为企业的重要资产,因此数据迁移已成为企业发展和转型的关键环节之一。企业级数据迁移不仅涉及大量数据的转移,还需要解决安全性、完整性和一致性等诸多挑战。企业级数据迁移的挑战企业级数据迁移面临诸多战,其中包括数据量大、数据类型多样、数据一致性、数据安全性和迁移时间等方面的问题。这些挑战主要源于以下几个方面:数据量大:企业的数据量往往巨大,需要耗费大量时间和资源,可能会导致迁移,并且小化对业务操作的影响,以避免业务中断和损失。企业级数据迁移的关键策略与方法如何成功地实施企业级数据迁移是每个企业都面临的重要问题。以下是一些关键策略与方法,供参考:制定详细的迁移计划:在进行数据迁移中断。测试和监控:在数据迁移完成后,企业应进行充分的测试和监控,以确保迁移的顺利进行和数据的正确性。企业级数据迁移是一个复杂而重要的过程。面对诸多挑战,企业需要制定详细的迁移计划,选择合适的迁移工具和延误和成本增加。数据类型多样:企业数据通常包括结构化数据和非结构化数据,如数据库、文档、图像、视频等,不同类型的数据需要采用不同的迁移方法。数据一致性:在数据迁移过程中,要保证源数据和目标数据的一致性
技术博客
CDH/HDP迁移之路
工信部代码自主研发率扫描测试。同时TDH完成了与主流信创生态厂商的适配互认工作,满足信创验收要求。CDH/HDP迁移到TDH将获得的能力数据库能力支持SQL2003标准,兼容Oracle、DB2机制更加精细。数据治理元数据、血缘和监管链,高级数据发现和业务词汇表Navigator到Atlas的迁移,提高了性能和可伸缩性星环科技于2020年发布的TDS2.X版本产品具备完整的数据开发和数据治理功能、稳定性、灾备与可靠性、安全性、自主可控、国产生态、解决方案、售后服务等多方面对比各迁移方向,供用户参考。兼容性兼容性,直接决定迁移成本。很多客户认为CDP是CDH/HDP的高版本,应可以平滑升级,基于开源整合的产品,也可以平滑升级,而TDH是国内自主研发的大数据产品,兼容性不好,升级成本高,其实不然。CDPCDH5升级CDP有严重组件版本兼容性问题,包括sentry换成ranger,Hive2升级到Hive3,升级对组件的兼容性影响大;例如:某客户CDH5升级到CDP的升级时间长达数月之久。开源封装产品基础存储和计算组件同样有兼容性问题;CDH安全、运维管理等不开源组件和功能无法升级,且目前
技术博客
CDH/HDP迁移之路
工信部代码自主研发率扫描测试。同时TDH完成了与主流信创生态厂商的适配互认工作,满足信创验收要求。CDH/HDP迁移到TDH将获得的能力数据库能力支持SQL2003标准,兼容Oracle、DB2机制更加精细。数据治理元数据、血缘和监管链,高级数据发现和业务词汇表Navigator到Atlas的迁移,提高了性能和可伸缩性星环科技于2020年发布的TDS2.X版本产品具备完整的数据开发和数据治理功能、稳定性、灾备与可靠性、安全性、自主可控、国产生态、解决方案、售后服务等多方面对比各迁移方向,供用户参考。兼容性兼容性,直接决定迁移成本。很多客户认为CDP是CDH/HDP的高版本,应可以平滑升级,基于开源整合的产品,也可以平滑升级,而TDH是国内自主研发的大数据产品,兼容性不好,升级成本高,其实不然。CDPCDH5升级CDP有严重组件版本兼容性问题,包括sentry换成ranger,Hive2升级到Hive3,升级对组件的兼容性影响大;例如:某客户CDH5升级到CDP的升级时间长达数月之久。开源封装产品基础存储和计算组件同样有兼容性问题;CDH安全、运维管理等不开源组件和功能无法升级,且目前
CDH的局限性CDH作为传统大数据平台的代表,在架构设计上存在明显不足。其复杂的组件依赖关系导致部署和维护成本居高不下,版本升级过程繁琐且风险较大。在云原生时代,CDH的架构难以充分利用容器化技术带来的CDH的替换解决方案:大数据平台的新选择在大数据技术快速发展的今天,曾经的主流大数据平台,正面临前所未有的挑战。随着云计算、容器化等新技术的普及,企业开始寻求更灵活、更具成本效益的CDH替代方案的测试计划、做好数据备份和验证等。大数据平台的演进不会停止,未来的趋势将更加注重智能化、自动化和服务化。企业需要保持技术敏感度,持续评估和优化自身的大数据架构。选择合适的CDH替代方案,不仅是为了解决当前问题,更是为未来的数据驱动创新奠定基础。优势,资源利用率较低。此外,CDH的许可成本较高,对于中小型企业来说负担较重。技术架构方面,CDH采用集中式架构,难以满足现代企业对弹性扩展的需求。其组件更新速度较慢,无法及时集成最新的开源技术成果成本。迁移风险评估则需要制定详细的迁移计划和回滚方案。实施路径通常包括三个阶段:评估规划阶段、试点迁移阶段和全面实施阶段。每个阶段都需要明确的目标和评估标准。实践建议包括:建立跨部门迁移团队、制定详细
服务安装完成后,用户必须安装TDH客户端,才可以在交互界面上执行各个服务的命令行,如beeline、hdfsdfs等。安裝步驟安装过程如下。获取安装包在TranswarpManager界面上点击→下载客户端,下载TDH客户端。选择客户端需要访问的服务解压文件将下载的tdh-client.tar文件放在集群中的任意机器上,然后于该机器上执行如下命令解压文件:tar-xvftdh-client.tar执行成功后文件会被解压至目录TDH-Client中。执行脚本请执行位于目录TDH-Client内的脚本init.sh。sourceTDH-Client/init.sh您可以以任何用户执行该脚本,但是我们建议以root用户身份执行。当以其他用户身份执行时,需要输入root密码。注意,用户必须使用source命令执行该脚本。当新建一个连接到服务的终端session时,都需要重新执行sourceinit.sh,bashinit.sh和./init.sh都不起作用。TDH社区版客户端既可以在集群內也可以在集群外的任意机器上使用。目前只支持Linux环境(CentOS,Ubuntu等),不支持Windo...
产品文档
1 产品介绍
QuarkGateway是连接客户端与QuarkServer服务器的一个中间件,是客户请求QuarkServer服务的总入口,它严格按照用户预定义的配置文件,根据用户的不同需求来提供负载均衡、SQL规则路由、高可用(包括超时转发和宕机转发)、Web运维、Inceptor安全(LDAP,KERBEROS)等各项功能。QuarkGateway可以在多个QuarkServer间平衡业务流量,能够有效地为客户端屏蔽掉集群细节,能将不同的SQL类型路由到不同的QuarkServer,并且解决了QuarkServer超时或宕机后无法执行任务的问题,提高了产品的可用性。QuarkGateway的主要功能包括:负载均衡在这种情景下QuarkGateway可以将特定的业务分担给多个QuarkServer,从而实现多个InceptorServer平衡业务流量的功能,完成此项功能的前提是QuarkServer的TAG属性一致。SQL规则路由QuarkGateway基于特定规则,可将不同类型的SQL路由到不同的QuarkServer。高可用性包括超时转发和宕机转发等,QuarkGateway可将超时或者宕机的...
许可证申请您在申请完许可证后可以在许可证页面看到许可证覆盖的产品范围,如果申请完成后又上传了其他的子产品,如Hyperbase,那么您需要再填写一次申请表单申请Hyperbase的许可证。访问星环云官网,注册账号或登录已有账号星环云网址:https://cloud.transwarp.cn/home登录后点击右上角图标,选择创建组织,填写自定义组织名称后,点击保存。回到TDHManager,点击系统管理-许可证页面,点击申请许可证。登录星环云账号进行申请。注意:输入星环云账号,而不是组织名称。申请成功重新返回Manager页面,重启服务方可使用。许可证管理许可证管理页面分为“摘要”和“角色”两个板块。“摘要”板块显示许可服务的健康状态,ServerKey、序列号、当前许可证情况,点击“启动”和“停止”可以启动或者停止许可证集群。“摘要”板块显示当前每一个已安装服务的License类型、版本、节点容量、License到期时间。“角色”板块展示了许可服务的角色运行的节点、每个角色运行的健康状态。查看许可证授权管理如果您已经上传过License,您可以点击“查看/更改许可证”来查看您的Lic...
Waterdrop是为开发人员和数据库管理人员提供的数据库管理工具,可以进行跨平台,可作为InceptorSQL客户端,除了Inceptor还支持并兼容其余多种数据库。它具有有四个主要的功能模块:DatabaseNavigator、SQLEditor、SQLExecutor、DataViewer/Editor,分别用来帮助用户实现数据库管理、SQL编辑、SQL执行、数据操作这四项功能。此外,Waterdrop还提供了一系列数据库开发和ETL工具,例如存储过程测试器,数据导出工具(支持excel,csv,html,xml,json),同源/异源数据库间数据传输等等。为了方便您安装和使用,社区版团队为您准备了安装视频教程,可以与手册内容一起查看:https://transwarp-ce-1253207870.cos.ap-shanghai.myqcloud.com/TDH-CE-2024-5/%E8%A7%86%E9%A2%91/%E7%A4%BE%E5%8C%BA%E7%89%88%20Waterdrop2.0%20%E4%BD%BF%E7%94%A8%E6%BC%94%E7%A4%BA...
产品文档
6.5 数据入库
6.5.1数据写入概览6.5.2【集成方案】Sqoop对接TDH社区版
产品文档
4.2 环境要求
硬件环境要求注意:社区版采用自助申请许可证的形式,因此搭建社区版的服务器需要能够连接外网。TranswarpCommunityEdition(简称社区版)提供集群服务来保证服务的高可用性,因此集群系统必须是3台以上服务器组成,每台服务器最低配置如下(仅用于部署hadoop,inceptor,aquila基础组件):4核心或以上带超线程x86指令集或ARM指令集CPU的服务器8GB以上内存2个100G以上的硬盘做RAID1,作为系统盘4个以上的100GB容量以上的硬盘作为数据存放硬盘2个千兆以上网卡上述配置仅可满足基础组件的安装以及进行基础功能测试,不支持跑批量数据,测试进阶功能等场景,如需体验更多功能或使用更多组件,如Hyperbase/Guardian等,为实现更好的性能请基于自身需求将配置提升至:标准4核心或以上带超线程x86指令集或ARM指令集CPU的服务器32GB以上内存2个300G以上的硬盘做RAID1,作为系统盘4个以上的300GB容量以上的硬盘作为数据存放硬盘2个千兆以上网卡进阶2颗6核心或以上带超线程x86指令集CPU的服务器64GB以上内存6个600GB容量以上的硬盘...
系统磁盘分区要求本章节内容基于社区版推荐的最佳配置展开,即1-2颗4-6核心或以上带超线程x86指令集或ARM指令集CPU的服务器32-64GB以上内存2个300G-600G以上的硬盘做RAID1,作为系统盘4个以上的300G-600G容量以上的硬盘作为数据存放硬盘2个千兆以上网卡如果您的配置当前不满足,且无需进行性能或批量数据测试,可将本章节涉及的配置值适当降低。系统安装和运行需要占用硬盘空间,在安装前操作系统硬盘必须留出300GB空间。对磁盘进行分区时需要遵守以下几点要求:至少要分出swap和加载于“/”的系统分区。推荐系统分区大小为200GB~300GB,并将该分区挂载到/目录。请在某数据盘上为KunDB预留不小于200GB的空间,并将KunDB的datadir设置为该数据盘的某个目录(例如/mnt/disk1/kundbdata/)。推荐把每个物理磁盘挂载在/mnt/disknn(nn为1至2位的数字)上不同的挂载点。建议使用EXT4文件系统。每个这样的目录会被管理节点自动配置为HDFSDataNode的数据目录。HDFSDataNode的数据目录不能放在系统分区,以避免空间不...
为了方便您接下来的安装使用,社区版团队为您准备了视频教程,可以搭配手册内容一起查看:https://transwarp-ce-1253207870.cos.ap-shanghai.myqcloud.com/TDH-CE-2024-5/%E8%A7%86%E9%A2%91/%E5%BC%80%E5%8F%91%E7%89%88StellarDB%E5%AE%89%E8%A3%85%E8%A7%86%E9%A2%912024.5.mp4安装教程在安装启动StellarDB社区开发版容器之前,请务必执行dockerps确保环境当前无其他正在运行的开发版容器,如果有,请及时停止以防止后续端口冲突。请务必确保您的安装环境已经配置好了hostname以及/etc/hosts文件,否则hostname和IP地址将无法映射,最终导致安装失败。具体配置方式详见安装前系统配置改动安装流程步骤一将从官网下载下来的产品包上传至安装环境产品包名称:TDH-Stellardb-Standalone-Community-Transwarp-2024.5-X86_64-final.tar.gz步骤二执行下述命令进行解...
2.1关于社区版您可能想要知道的2.2怎么联系到我们?遇到问题怎么办2.3产品资源汇总
产品文档
4.7 配置集群
配置集群打开客户端浏览器(推荐使用GoogleChrome浏览器),输入安装好的管理节点IP或DNS地址比如http://172.xx.x.xxx:8180/(172.xx.x.xxx是管理节点的IP地址)。访问这个地址,您会看到下面的登录页面。Manager会试着根据您的系统判断您使用的语言,如果当前显示的语言和您想要使用的不同,可以点击右上角的语言图标来选择不同语言。目前Manager支持中文和英文。初次登录以admin的身份登录,密码也是admin。登录后,您需要先接受最终用户协议才可以进行进一步操作。您需要给您的集群设置一个名字。输入集群名字后点击“下一步”:全局设定在这一步,Manager针对配置集群中的节点访问提供了两个选项:DNS配置如果配置集群中的节点可以通过用主机名互相访问,用户必须配置有效的DNS服务器或/etc/hosts文件。否则请选择需要管理工具配置/etc/hosts,TranswarpManager会相应为您配置/etc/hosts文件,然后添加节点。NTP配置NTP主要是用于对计算机的时间同步管理操作,使用NTP服务器可以确保集群中节点时钟同步,您可以指...