联 系 我 们
售前咨询
售后咨询
微信关注:星环科技服务号
更多联系方式 >

行业资讯

首页>行业资讯>湖仓一体数据平台>

湖仓一体数据平台

发布时间 2025-02-10

湖仓一体
星环科技湖仓一体平台依托多模型数据管理平台,打破传统Hadoop+MPP混合架构,提供统一资源管理、统一存储管理、统一计算引擎和统一数据操作四层统一架构,真正实现湖仓技术架构统一。贯穿这四层架构,星环科技湖仓一体平台还提供全生命周期的数据管控能力,可以实现多模态数据以及元数据的统一管控,同时支持统一的多租户管理,可确保在湖仓一体平台上的租户从资源层、数据层、应用层等都能实现完整隔离。

湖仓一体数据平台融合了数据湖数据仓库的优势,是一种新型的数据管理和分析平台。以下是关于湖仓一体数据平台的介绍:

 

架构

统一存储层:采用分布式文件系统或云存储,支持多种数据格式,能存储结构化、半结构化和非结构化数据,如用 Parquet 格式存储结构化数据、JSON 格式存储半结构化数据,还能存储图像、视频等非结构化数据。

数据治理:提供数据质量控制、元数据管理、数据安全和权限管理等全面的数据治理功能,可记录数据的来源、转换过程和使用情况,为不同用户和角色设置访问权限。

数据处理与分析层:支持批处理、流处理、SQL 查询、机器学习等多种数据处理和分析方式。

事务管理层:支持事务处理,遵循 ACID 原则,确保在数据的写入、更新和删除操作中,多个用户同时访问数据时的一致性和完整性。

 

关键技术

事务支持技术:通过数据库的事务处理机制,确保数据并发访问和修改的一致性,保证数据的准确性和可靠性,常见的技术如锁机制、事务日志等。

数据治理技术:包括数据质量管理技术,如数据清洗、数据校验等;元数据管理技术,用于管理数据的定义、结构、关系等信息;数据安全技术,如访问控制、加密、脱敏等。

存算分离技术:将数据存储和计算资源分离,使存储和计算可以独立扩展,提高资源利用率和系统的灵活性、可扩展性,存储层可采用分布式存储系统,计算层可根据需求动态调配计算资源。

 

优势

融合性优势:克服了数据湖数据仓库各自的局限性,既能灵活处理各种类型的原始数据,又能提供高效的数据管理和分析服务。

数据一致性和治理加强:通过统一的数据治理机制,对数据的来源、转换过程和使用情况进行全程跟踪和管理,提高数据质量,降低数据风险。

支持多种工作负载:可以同时支持实时数据处理、批处理、交互式查询、机器学习模型训练等多种不同的数据工作负载。

性能优化:通过数据索引、数据缓存和分布式计算等技术,提高数据处理的速度和效率,能够快速地摄入和存储大量数据,也能高效地进行数据查询和分析。

 

应用场景

企业数字化转型:作为数据基础设施,满足企业对数据的全面管理和深度利用的需求,帮助企业将各种业务数据存储在平台中进行整合、分析和挖掘,为业务决策提供支持。

数据中台建设:作为数据中台的核心架构,帮助企业构建统一的数据平台,实现数据的共享和复用,将企业内部分散的数据集中起来统一加工和处理,提供给不同业务部门使用,提高企业的数据协同能力。

人工智能与机器学习应用:为人工智能和机器学习提供良好的数据环境,企业可在其中存储大量训练数据,进行数据预处理和特征工程,然后训练各种机器学习模型,用于预测、分类、推荐等应用场景。

 

关键词:
湖仓一体,数据平台

热门产品

  • TDC星环数据云平台(TDC),基于云原生技术融合数据 PaaS、分析PaaS、应用 PaaS,实现数据端到端全生命周期管理。

  • TDS数据开发 | 数据治理 | 共享交换 支撑企业级数据治理和数据资产平台建设

  • SophonSophon-星环智能分析工具,分布式计算、多模态处理、图形化建模、隐私密保护、云边化一体。

  • KunDB星环分布式交易型数据库 SQL兼容、强一致、高性能、高可用

  • ArgoDBTranswarp ArgoDB 是星环科技自主研发的分布式分析型闪存数据库,可以替代Hadoop+MPP混合架构。支持标准SQL语法,提供多模分析、实时数据处理、存算解耦、混合负载、数据联邦、异构服务器混合部署等领先技术能力。