北京宽表数据库

实时NoSQL数据库
Transwarp Hyperbase是星环科技自主研发的实时NoSQL数据库。Hyperbase支持百万级高并发、毫秒级低延时业务需求,可以在普通廉价服务器集群上高效支持企业的高并发精确查询与范围查询、流处理应用、全文搜索以及高并发非结构化数据检索,同时支持以标准SQL为接口的高效数据访问,帮助用户快速开发历史数据查询、业务在线检索等应用。

北京宽表数据库 更多内容

复杂多变的数据成为各单位机构面临的一大难题。基于上述的挑战,星环推出了TranswarpHyperbaseNoSQL数据库,用来满足企业级用户经济灵活高效地管理数据的需求。Hyperbase能够随着信息时代的到来,数据已逐渐成为金融、企业、政府、运营商等单位机构的重要决策依据。以传统关系型数据库为代表的技术由于性能,成本,可扩展性等缺陷,很难满足爆炸式数据增长的需要,如何经济高效地管理海量轻易地通过在集群中增加或者减少硬件数量来实现性能的伸缩,从而进一步提升集群的运行速度以及处理能力,轻松应对百万级高并发的查询业务。Hyperbase支持以标准SQL为接口的高效数据访问,并提供高效的数据迁移工具,不仅能大幅度降低企业级用户数据应用变更和数据平台迁移的实施成本,还满足了用户在统一的数据平台上同时支撑新老业务的需求,大幅度降低了企业的运维成本。
简单、更便捷的进行大数据分析。为了满足更多用户在存储以及高并发点查方面的需求,此次TDH社区版推出了星环科技自主研发的NoSQL数据库TranswarpHyperbase。TranswarpHyperbase介绍Hyperbase是什么TranswarpHyperbase是星环科技自主研发的NoSQL数据库,支撑百万级高并发、毫秒级低延时业务需求。支持结构化数据,及文本、图像、视频、对象等实时处理应用的需求。传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题(分库分也不能很好解决),很难实现横向扩展,纵向扩展的空间也比较有限。Hyperbase能够轻易地通过在集群中增加或者Hyperbase关系数据库已经流行很多年,尽管Hadoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于MapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据减少硬件数量来实现性能的伸缩,提升集群的运行速度以及处理能力,轻松应对百万级高并发的查询业务。不同于传统的关系型数据库,Hyperbase采用列式存储模式,每个列族都由几个文件保存,不同列族的文件是
被一起查询的相关数据。当前DB-Engine中NoSQL数据库的排名如下表,可以看到受欢迎的主要是Cassandra、HBase和Azure上的CosmosDB。接下来我们将介绍一下HBase的情况。HBase是一个面向列的分布式NoSQL数据库,是GoogleBigtable框架的开源实现,能够响应随机、实时的数据检索需求。HBase主要的存储和处理对象是大,存储模式可以兼容本地存储机制确保数据库容错能力。通常的适用场景为:面向多版本、稀疏的、半结构化和结构化的数据高并发写入/查询的OLTP业务。HBase的数据模型由不同的逻辑概念构成,包括:、行、行键、列、列族、单元、时间戳。。Document类似于关系型数据中行的概念,一个Document包含每一个Field中与之相应的数据值。Type类似数据库中的级别概念,而Index是Elasticsearch中大的数据单位,与SQL的对于写密集型应用,每天写入量巨大,数据增长量无法预估,且对性能和可靠性要求非常高,普通关系型数据库无法满足其需求。对于全文搜索和数据分析这类对查询性能要求极高的场景也是如此。为了进一步满足上面两类
行业资讯
多模态数据库
各种类型的数据进行集中存储、查询和处理,满足对结构化、半结构化和非结构化数据的统一管理需求。TranswarpArgoDB是星环科技自主研发的分布式数据库,基于多模型统一架构支持关系型存储,存储。中国信通院在数据库发展研究报告(2021年)》中指出,在后关系型数据库阶段,数据结构越来越灵活多样、业务类型越来越复杂多变,为应对此类现状,越来越多的用户选择通过多模型数据库实现“一多用“,将先进技术能力,一站式满足OLAP、AETP、多模型融合分析、联邦计算、数据仓库、实时数仓、湖仓集一体等场景。2019年8月,ArgoDB成为全球第四个通过TPC-DS基准测试并经过TPC官方审计的数据库产品。在架构上,ArgoDB基于存算解耦,实现了多模数据库的“四个统一”:统一的SQL编译引擎,支持SQL99/2003标准语法,兼容TD,Oracle,DB2等多种方言,对不同模式的数据提供统一接口,将多个操作访问入口变为一个入口,将多种数据库语言变为一种语言,降低开发和迁移成本,简化用户操作。统一的计算引擎,将多套计算引擎变为一套引擎,将多份计算资源变为一份资源,提供高性能的分析计算和执行效率
产品文档
6.3.9
是ArgoDB针对高维度、海量字段业务需求推出的数据存储方案,适用于业务主题汇总、报表分析和数据集市场景。支持多达上千个字段的存储与管理,并可灵活开启部分列更新功能——即业务系统可仅更新或插入部分列,无需写入或处理全量字段,有效提升计算资源利用效率和数据时效性。使用背景在数据集市建设、指标体系构建与主题域建模等场景中,企业通常需要将来自多个业务系统或数据源的众多字段汇总到一个统一的中,以便为下游的数据分析、报表呈现、实时查询与服务调用提供高效的数据支持。例如,在客户分析场景中,常见的“客户账户信息”会整合来自客户信息、账户状态、交易行为等多个维度的数据,以完整体现客户画像,其优势如下:数据集中管理:业务相关的指标和字段集中在同一张中,简化数据维护和管理复杂性。提升查询效率:无需频繁进行跨关联,所有数据集中存储,有效降低查询延迟。便于数据消费:提供统一且清晰的数据视图,便于报表分析、建模以及下游服务快速调用,提升数据的易用性。部分列更新前面我们介绍了的背景和业务价值,而传统的设计中也存在一些问题,例如在数据写入/更新时都需覆盖整行数据,即便业务仅
数据库索引:索引是对数据库中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库中的特定信息。数据库索引是数据库中用于加速数据检索的一种数据结构,可以提高数据库的查询效率。索引可以理解为书籍的目录,将书籍内容按照关键字排序,方便读者快速查找特定内容。数据库索引同样是将中的数据按照某种规则排序,并建立对应的数据结构,从而使查询变快。一般情况下,数据库索引是通过树或哈希这两种数据结构来实现的。建立了适当的索引,数据库系统就可以优化数据库的查询性能,从而提高系统的响应速度和并发能力。在数据库中,索引的作用是为了快速定位和查找中的数据。相比于全扫描,使用索引可以大大提高查询效率。例如,在一张包含10000行数据中,如果不使用索引,系统需要逐行扫描所有数据才能找到满足查询条件的行。如果使用了索引,通过索引可以快速缩小查询范围,只需要访问几百行数据就可以得到结果,大大降低了查询的时间消耗。
近日,北京国家金融科技认证中心发布了《2021年分布式数据库标准符合性检测参检机构名单》。截止2021年12月,北京国家金融科技认证中心累计完成了12款主流数据库产品的标准符合性验证工作,从测试结果个项目中,KunDB有6个项目表现优异。此外,KunDB还完成了500GB和1TB的OLAP的加项测试,展现了作为HTAP数据库的性能优势。北京国家金融科技认证中心是国家级权威第三方合格评定机构,开展来看所有参测数据库产品的检测项符合率均在70%以上,其中8款产品的符合率在85%以上。星环科技分布式交易型数据库KunDB以优异的成绩通过检测,整体项目测试通过率超过90%,特别是在TP性能测试的10全类别检测认证评估,推动金融标准落地实施,保障金融科技质量安全,促进金融服务提质增效。星环科技此次成功通过检测,标志着KunDB满足分布式数据库金融行业标准的各项要求,可以更有力支撑金融机构的业务系统。这彰显了国家级权威机构对星环科技技术领先性的高度认可,是星环科技数据库产品市场化进程中的又一里程碑。当前,信息技术的自主、安全、可控已经成为影响国家安全和社会稳定的重要因素,数据库与芯片、操作系统
非关系型数据库指以非关系模型(文档模型、键值模型、图模型)数据作为基本存储和处理单元的数据库。星环非关系型数据库数据库HyperbaseTranswarpHyperbase是星环科技推出的一款NoSQL数据库,支撑百万级高并发、毫秒级低延时业务需求。Hyperbase支持结构化数据,及文本、图像、视频、对象等非结构化数据的存储;支持全文索引、二级索引等索引技术;提供多租户管理;支持SQL标准语法,并兼容开源HBase。Hyperbase帮助用户快速开发历史数据查询、业务在线检索等应用。键值数据库KeyByteTranswarpKeyByte是星环科技推出的一款高性能键值数据库,提供缓存、高并发数据存储、实时或限时业务支持等应用。时空数据库SpactureTranswarpSpacture是星环科技推出的一款分布式时空数据库,支持空间地理、时空轨迹、遥感影像等海量数据的存储。Spacture帮助用户快速开发时空查询分析、时空模式挖掘、时空轨迹聚类等应用,广泛应用于位置服务、城市管理、交通物流、疫情防控等场景。时序数据库TimeLyreTranswarpTimeLyre是星环科技推出的
行业资讯
国产化数据库
多种场景。分布式数据库-HyperbaseHyperbase是星环科技研发的分布式数据库,支撑百万级高并发、毫秒级低延时业务需求。Hyperbase支持结构化数据,及文本、图像、视频、对象等非帮助用户快速开发热点数据缓存、高并发数据存储、实时或限时业务支持等应用。分布式数据库-HyperbaseHyperbase是星环科技研发的分布式数据库,支撑百万级高并发、毫秒级低延时业务需求国产化数据库是指由中国企业自主研发的数据库管理系统,目的是降低对于国外数据库软件的依赖,提升国家信息安全和技术自主创新能力。国产化数据库通常具有以下特点:自主研发:由中国企业自主研发,具有完全。安全可控:有助于提升国家的信息安全和数据安全。相比国外数据库软件,国产化数据库避免可能存在的安全隐患和后门问题。技术支持:通常由国内企业提供技术支持和售后服务。这可以提高响应速度,并且能够更好地针对,实现大数据基础软件的全面自主可控,并在产品架构、功能、性能、安全、运维、易用性等方面得到大幅提升。分布式数据库-ArgoDBArgoDB是星环科技自主研发的面向数据分析型业务场景的国产化分布式多模数据库
数据入湖是指将企业内外部的各种数据汇聚到数据湖中进行统一存储和管理的过程。数据来源涵盖企业内部的业务系统数据,如客户关系管理系统(CRM)、企业资源计划系统(ERP)、办公自动化系统等产生的结构化数据;也包括来自网络的日志数据、社交媒体数据,以及物联网设备产生的传感器数据等半结构化和非结构化数据。入湖方式批量导入:对于一些已经存在的历史数据或定期产生的批量数据,通常采用批量导入的方式将数据加载到数据湖中。可以使用ETL工具、数据迁移工具等,按照一定的时间周期或数据量进行批量抽取、转换和加载。实时接入:对于实时性要求较高的数据,如物联网数据、实时日志数据等,需要通过实时数据接入技术将数据实时地传输到数据湖中。常见的实时接入方式包括使用消息队列(如Kafka)进行数据缓存和传输,然后由数据湖的实时处理组件进行消费和存储。数据同步:对于一些需要与源数据保持实时或准实时同步的数据,采用数据同步技术实现数据入湖。可以通过数据库的复制技术、数据同步中间件等,将源数据的变化及时同步到数据湖中。关键技术数据抽取与转换:在数据入湖过程中,需要对不同来源、不同格式的数据进行抽取和转换,使其符合数据湖的存储...
行业资讯
数据湖
数据湖是一种以原始格式存储大量数据的存储库,它具有灵活、可扩展等特点,可支持多种类型数据的存储和分析。数据湖是一个集中存储大量原始数据的系统,这些数据可以是结构化数据(如关系型数据库中的表)、半结构化数据和非结构化数据(如文本文件、图像、视频等),数据湖允许企业以原始格式存储数据,直到需要使用时再进行处理和分析。特点存储容量大:能够存储海量数据,满足企业不断增长的数据存储需求。可以轻松扩展存储容量,支持PB级甚至EB级数据的存储。数据多样性:支持各种类型的数据,包括传统的关系型数据、日志文件、传感器数据、社交媒体数据等,打破了传统数据仓库只能处理结构化数据的限制。灵活性高:数据以原始格式存储,不需要在存储时进行预定义的模式或结构设计,企业可以根据不同的业务需求随时对数据进行各种分析和处理,具有很强的灵活性。支持多用户并发访问:可以同时支持多个用户和应用程序对数据的并发访问,不同的用户和团队可以根据自己的需求对数据进行探索和分析,提高了数据的共享和协作效率。架构数据采集层:负责从各种数据源收集数据,并将其传输到数据湖中。数据源可以包括数据库、文件系统、云存储、物联网设备等。存储层:是数据...
行业资讯
大数据湖
大数据湖是在数据湖概念基础上,结合大数据技术特点和需求而发展起来的一种更加强大、灵活的数据存储和分析架构。海量数据存储:能够轻松应对海量数据的存储需求,可存储PB级甚至EB级的数据,涵盖各种类型的数据,包括结构化数据、半结构化数据和非结构化数据。高可扩展性:基于分布式架构,能够方便地进行水平扩展,随着数据量的增加,可以通过添加节点的方式快速扩展存储和计算能力。数据多样性支持:不仅支持传统的关系型数据,还能存储各种非传统数据类型,如文本、图像、视频、音频、日志文件、社交媒体数据等,为企业提供全面的数据视角。灵活性与敏捷性:数据以原始格式存储,不需要预先定义严格的数据模型,用户可以根据不同的业务需求随时对数据进行各种分析和处理,快速响应业务变化。架构与组件存储层:通常采用分布式文件系统或对象存储系统作为底层存储,具有高可靠性、高吞吐量和容错性,确保数据的安全存储和高效访问。数据管理层:包括元数据管理、数据目录、数据血缘等功能。元数据管理记录数据的来源、格式、含义等信息,方便用户查找和理解数据;数据目录提供数据的分类和索引,便于数据的搜索和发现;数据血缘则跟踪数据的流转和处理过程,确保数据的...
行业资讯
多方安全计算
多方安全计算(SecureMulti-PartyComputation,简称MPC)是隐私计算的一个重要分支。多方安全计算允许多个参与方在不泄露各自隐私数据的情况下,共同完成对数据的计算和分析任务。其目标是在保护数据隐私的前提下,实现数据的共享和协同处理,以挖掘数据的价值。主要基于密码学技术,如同态加密、不经意传输、秘密共享等。通过这些技术,将数据进行加密或转换,使得在计算过程中,参与方只能看到加密后的结果或与自己相关的部分信息,而无法获取其他方的隐私数据。技术特点隐私保护性:多方安全计算能够确保参与方的隐私数据在整个计算过程中不被泄露,即使在存在恶意参与者的情况下,也能保证数据的安全性。去中心化:不需要依赖可信的第三方来处理数据,各参与方之间通过密码学协议进行交互和协作,实现数据的分布式计算。可验证性:计算结果可以被参与方进行验证,确保计算的正确性和完整性。灵活性:可以支持各种类型的计算任务,如算术运算、比较运算、逻辑运算等,适用于不同的应用场景。应用场景金融领域联合风控:多家金融机构可以在不共享客户敏感信息的情况下,联合进行风险评估和信用评分,提高风控的准确性和效率。隐私保护的投资...
隐私计算在金融行业具有极其重要的地位和广泛的应用前景。应用场景信贷风控联合建模:金融机构之间可以通过联邦学习等隐私计算技术,在不共享敏感数据的情况下,联合建立信贷风险评估模型。数据查询与验证:在信贷审批过程中,金融机构需要查询外部数据源来获取客户的更多信息,如征信报告、税务记录等。隐私计算技术可确保在查询和验证这些数据时,客户的隐私信息不被泄露,同时保证数据的真实性和完整性。精准营销客户画像构建:金融机构通过多方安全计算等技术,与其他企业合作构建更全面的客户画像。营销效果评估:在营销活动中,隐私计算可用于评估不同营销渠道和策略的效果。通过对客户反馈数据的加密分析,金融机构可以了解客户对不同营销活动的响应情况,而不会泄露客户的隐私信息,从而优化营销方案。金融监管数据报送与共享:金融机构需要向监管部门报送大量的业务数据,隐私计算技术可确保数据在报送过程中的安全和隐私保护。同时,监管部门之间也可以通过隐私计算实现数据共享,提高监管效率和协同监管能力。风险监测与预警:利用隐私计算技术,监管部门可以在不直接获取金融机构敏感数据的情况下,对金融市场的风险进行实时监测和预警。例如,通过多方安全计算对...
数据湖是一个集中存储海量原始数据的存储库,旨在存储企业所有类型和来源的数据,为企业提供全面的数据资产视图,并支持灵活的数据处理和分析。数据湖是一种存储企业各种原始数据的大型仓库,这些数据包括结构化数据、半结构化数据和非结构化数据。数据湖允许企业以原始格式存储数据,而无需在存储时进行预定义的模式或结构设计,用户可以根据不同的业务需求随时对数据进行各种分析和处理。核心特点海量存储:具备强大的存储能力,可轻松应对PB级甚至EB级数据的存储需求,能够存储企业从各个业务系统、设备以及外部数据源收集而来的大量数据。数据多样性:支持各种类型和格式的数据,打破了传统数据存储系统对数据格式的限制,使得企业能够将不同来源、不同结构的数据统一存储在一个地方。灵活性与敏捷性:数据以原始形态存储,不依赖于特定的模式或模型,用户可以根据具体的业务问题和分析需求,灵活选择不同的分析工具和技术对数据进行处理和探索,无需受限于预先设定的结构。支持多用户并发访问:可以同时支持多个用户和应用程序对数据的并发访问,不同的用户和团队可以根据自己的需求对数据进行探索和分析,提高了数据的共享和协作效率。关键技术分布式存储技术:通常...
数据安全与隐私计算紧密相关、相互促进,共同为数据的安全利用与隐私保护提供保障。数据安全是隐私计算的基础和目标数据安全涵盖了数据的保密性、完整性和可用性等多方面要求,旨在防止数据被未经授权的访问、泄露、篡改或破坏。隐私计算的出现正是为了在数据处理和共享过程中更好地满足这些数据安全需求,尤其是在涉及多源数据融合、跨域数据协作等复杂场景下,确保数据的保密性和完整性不受损害。隐私计算是数据安全的技术支撑和创新手段隐私计算为数据安全提供了一系列先进的技术手段,包括多方安全计算、联邦学习、同态加密、零知识证明等。这些技术在不同程度上解决了数据在流通和使用过程中的隐私保护问题,使得数据能够在安全的环境中被充分挖掘和利用。二者协同发展推动数据价值释放与合规应用随着数字化进程的加速,数据已成为企业和社会发展的重要资产,但数据安全问题一直是制约数据流通和共享的关键因素。隐私计算技术的不断发展和应用,为数据安全提供了更有效的解决方案,使得数据能够在安全的前提下实现跨机构、跨领域的流通和共享,从而充分释放数据的价值。
联邦学习与隐私计算是紧密相关且相互促进的两个概念,以下是它们之间的详细关系及相关情况:联系目标一致:都旨在解决在数据隐私保护前提下的数据处理与分析问题。在大数据时代,数据分散在不同的机构或个人手中,而这些数据往往包含敏感信息。联邦学习和隐私计算都致力于在不泄露隐私数据的情况下,实现数据的价值挖掘和共享,打破数据孤岛,促进数据的流通和协同使用。技术融合:联邦学习是隐私计算的重要技术分支和应用场景之一。在联邦学习的过程中,会运用到多种隐私计算技术来确保数据的安全性和隐私性,如加密技术、差分隐私技术等。相互促进:隐私计算技术的发展为联邦学习提供了更强大的隐私保护手段,使其能够在更广泛的场景中应用。而联邦学习的实践也推动了隐私计算技术的不断创新和完善,为隐私计算技术提供了更多实际应用需求和挑战,促使其在性能、安全性等方面不断优化。区别概念侧重:联邦学习侧重于机器学习模型的训练和优化,强调在多个数据拥有方之间进行协同学习,通过交换模型参数而不是原始数据来实现模型的训练和更新。隐私计算则是一个更广泛的概念,涵盖了多种技术和方法,旨在对隐私数据进行全生命周期的保护,包括数据的存储、传输、处理和共享等...
隐私计算是一种在保护数据隐私的前提下实现数据价值挖掘和流通的技术体系,涵盖多方安全计算、联邦学习、同态加密、零知识证明等多种技术手段。定义与背景定义:隐私计算是指在不泄露数据隐私的情况下,对数据进行分析、计算和共享的一系列技术和方法的统称。它允许不同的参与方在数据不出本地的情况下,通过加密、分布式等技术手段进行协同计算,实现数据的互联互通和价值最大化,同时确保数据的隐私和安全得到有效保护。背景:随着数字化进程的加速,数据已成为企业和社会发展的重要资产,但数据的隐私泄露风险也日益增加。在数据共享和协同处理过程中,如何既充分发挥数据的价值,又保护数据所有者的隐私,成为亟待解决的问题,隐私计算应运而生。关键技术多方安全计算:多个参与方在不泄露各自数据隐私的情况下,通过特定的加密协议和算法进行协同计算。例如,在多方数据求和、数据比较等场景中,各方数据在加密状态下进行交互和计算,最终得到正确的结果,而任何一方都无法获取其他方的原始数据。联邦学习:一种机器学习技术,多个参与方在本地训练机器学习模型,然后将模型参数进行加密聚合,得到全局模型。在这个过程中,数据始终留在本地,不会被传输到其他方,从而保...
数据要素与隐私计算存在紧密的联系,隐私计算为数据要素的安全流通和价值释放提供了关键技术支撑,二者相互促进、共同发展。隐私计算是面向隐私信息全生命周期保护的计算理论和方法,涉及信息搜集者、发布者和使用者在信息产生、感知、发布、传播、存储、处理、使用、销毁等全生命周期过程的所有计算操作。它包括支持海量用户、高并发、高效能隐私保护的系统设计理论与架构,旨在实现数据的“可用不可见”。数据要素市场化:数据作为一种新型生产要素参与分配,隐私计算在数据要素市场化进程中扮演核心基础技术的角色。它帮助建立有序可控的共享机制,促进数据要素市场的蓬勃发展。数据要素只有在安全、高效的流通中才能充分发挥价值,隐私计算可以在保障数据流通过程计算安全性、赋能不同行业场景释放数据价值、适配数据要素流通多种应用模式上发挥价值。技术应用:隐私计算技术可以应用于数据的收集、脱敏、存储、使用、交换、删除、存证与取证等环节,涵盖隐私信息全生命周期的操作过程。它通过融合密码学、人工智能、安全硬件等跨学科技术体系形成一套可以保障数据流通安全合规的基础设施。数据安全与隐私保护:隐私计算实现了在数据流通过程中对国家安全、商业机密、个人...