大数据智能时代,数据量呈现爆发式的增长,数据互联的关系也变得越来越复杂,企业对于数据库的需求已经从一般的数据管理演变为从复杂的数据关系中 大化提取数据价值。图数据库作为一项新兴的数据存储管理系统,因为其灵活的建模能力和优异的关联关系查询性能,在政府、金融、通信、社交等对海量数据关系分析需求旺盛的领域受到了很高的关注和应用。
然而,随着客户业务方面的深入探索和发展,对图数据库的性能和其他系统方面的要求越来越高。
- 高性能 图数据库能够存储更多数据的同时,也要求在TP/AP/HTAP等业务应用场景中的数据分析计算过程中能够更快地做出响应。
- 图智能 图数据智能的高速发展,利用图相关的智能技术如图机器学习技术来赋能图数据价值的挖掘。
- 动态图 针对图数据动态变化的特性,实现更加简洁、直观的模型构建,并从变化的趋势中挖掘出更多的数据价值。
- 可视化分析 图数据库采用点、边结构来存储和分析计算数据,具有高度解释性,利用可视化数据分析能力进一步降低用户数据分析门槛,加速业务创新。
- 数据融合分析 多种类型数据之间的数据壁垒给企业用户挖掘更深层次的数据价值带来很大的挑战。
StellarDB5.0:更高性能、更智能、更易用
为了解决上述问题,StellarDB在存算引擎、深度图框架、动态图模型、可视化等方面引入了更多新的设计和迭代升级,推出了更高性能、更智能、更易用的企业级分布式图数据库StellarDB 5.0。
性能数倍提升,加速数据分析创新
StellarDB5.0实现了存储引擎和计算引擎双引擎升级。在存储部分,全新设计了底层数据存储结构,在计算部分优化了TEoC编译器,同时对多场景计算框架进行了深度优化,为多场景的高性能要求奠定了坚实的基础。
在实时场景中,响应速度提升了近5倍,并且在高并发场景下,QPS可达上万以上。在关联关系场景中,多跳查询能力 高提升达到10倍。此外,StellarDB5.0对近50种图算法进行了深度的优化,性能平均提升8倍。
StellarDB5.0实现从实时场景到关联关系分析场景,到图算法分析场景全方位的性能提升,大幅提高了客户业务效率。
深度图学习,赋能工业级图智能应用
在视觉推理、基于社交网络的推荐等场景中,图机器学习技术的使用能够有效提升结果的准确率,特别是对于解决分类、风险识别、关联推荐、以及知识推理等问题,图机器学习都能够给予更好的支持。然而将图机器学习真正应用于生产实践,门槛较高,需要用户具有非常强的知识和技术积累。
为了能够将图机器学习技术在实际生产中落地,StellarDB5.0接入了星环科技自研的ZenGraph深度图框架,将图数据库技术和深度图技术深度融合,利用图数据库的优势实现图数据快速地读取和写回,提供快速子图过滤能力,从而提升整个深度图链路的处理效率;ZenGraph深度图框架可以针对不同的业务场景提供不同的深度图模型,满足多样化的业务场景。
在实践过程中,StellarDB结合ZenGraph深度图框架,预测准确率达到了业内较高水平。例如,论文引用推荐场景中,在630万点边,128个特征数的数据集下,推荐准确率高达81.23%,比传统链路预测算法提升了23%。类似的,如基于内容本身的微博推荐、书籍推荐、商品推荐或者歌曲推荐等场景中,结合ZenGraph,推荐准确率可以得到大幅提升。
同样,图数据子图过滤场景中,在6800万点边,5个过滤特征的数据集下,使用StellarDB进行子图过滤仅需4.97秒,极大加速了深度图链路处理效率。
下一阶段,StellarDB将进一步融合图数据库技术和深度图技术,提供更加易用、一体化的工业级图深度学习解决方案。
简洁的动态图模型,图数据变化直观、高效分析
许多图数据应用场景中的图数据并不是静态不变的,而是动态变化的。例如,金融交易网络中不同交易实体之间在不同时间点发生多笔交易,或者新增交易关系时,传统的做法是使用多条边来表示不同时间或发生的不同交易关系。当交易关系增多时,这种模式会让图数据模型变得非常复杂,增加了数据冗余存储,并增加了数据分析的难度。

StellarDB5.0提供动态图模型的构建。例如在上述场景中,当账户在不同时间段发生交易时,用户无需添加多条边来描述交易情况,仅需在之前属性为交易的边上继续添加不同时间的交易信息即可。这些随时间变化的信息都是存储在点和边的属性当中,简化了数据建模,降低了数据冗余,同一张画布可以承载更多的点边数据,让图数据分析变得更加便捷。
此外,动态图模型能够将图数据变化的历史全部记录下来,可以按照时间点查询图的历史变更,也可以一次性获取点/边属性的所有历史记录。通过对动态图进行时间轴可视化,可以直观、便捷地对图数据变化进行分析,帮助用户更容易的发现图背后的规律。例如在金融反欺诈应用中,图结构的动态变化可以表征欺诈团伙的人员变化和交易关系变化等,从而帮助业务人员更准确、更高效地进行数据分析和预测。
面向数据分析的深度可视化,易用性大幅提高
StellarDB5.0对可视化组件KG Explorer进行深度升级,包括全新的UI界面,支持图算法的可视化、支持动态图时间轴可视化以及丰富的数据交互分析辅助功能,如案例上传下载,将易用性和实用性相结合,加速企业数据分析和业务创新。


突破数据模型屏障,挖掘数据融合分析价值
大数据时代数据量井喷、业务融合多样化,企业需要部署多个不同类型的数据库用来存储不同的数据类型,而在做一些复杂业务分析时需要多种类型数据进行联合分析。但数据库与数据库之间的不兼容,数据需要导入导出复杂操作等给企业业务发展带来了很大的阻碍。
基于星环科技多模型统一技术架构,StellarDB5.0能够与关系型数据、时序数据、时空数据等不同类型数据进行统一存储管理,并能够实现跨数据模型联合查询分析。例如,将用于数据关联的图场景StellarDB和用于OLAP场景的星环关系型分析引擎Inceptor联合,通过星环科技自研的统一编译器,用户只需一条SQL语句,即可实现两种类型数据的关联查询,大大简化了开发复杂度和用户操作。同时数据也仍保留在原存储引擎中,不用对数据进行导入导出,不会存在数据不一致或数据冗余存储的问题。
更多提升和新能力,加速图数据应用创新
StellarDB5.0针对开发者,新增了ORM编程,优化了Java SDK负载均衡和重试机制,并进一步完善了Python SDK的能力,提高Python应用快速对接图技术的效率。
在运维方面,StellarDB5.0进一步优化了运维管理路径,对数据副本迁移功能进一步优化,让数据副本维护变得更加轻松。
StellarDB5.0在性能、智能化、可视化、数据融合分析等方面的迭代升级,能够更好地服务客户,让用户能够感受到数据互联的价值,助力每一个企业的业务创新。