运营商大数据治理
星环以其自身丰富、先进的大数据基础软件、大数据分析软件和数据运营服务能力,对外可为电信运营商集团及其省分公司的业务场景提供技术解决方案,实现精准营销,优化客户感知,促进业务增值;对内可为集团提供基础软件技术保障,构建PaaS能力平台,支撑业务经营分析,优化集团管理决策,协助集团技术层面的数字化转型。
运营商大数据治理 更多内容
)技术对服务器资源进行统一管理,实现资源池化、资源共享。4)大数据能力共享困难,存在重复建设问题某运营商总部有整体的服务器资源,而在总部底下是各个省分公司和子公司,他们希望总部的平台能够为其提供一个具备大数据处理能力的租户环境,这样省分公司和子公司就可以在各自租户上进行自身的数据加工和处理,不需要再自己筹资建设平台。然而某运营商早期在使用大数据技术时,大部分是物理部署Hadoop集群。这种架构本身共享,应用赋能的效果。解决方案星环科技综合利用大数据、云计算、机器学习、深度学习等技术,采用云计算模式进行设计,从IaaS、PaaS、SaaS以及云平台运维等四个方面帮助某运营商建立基于容器云的大数据能力开放平台,并提供技术支持。某运营商大数据能力开放平台总体功能架构图如下:图1:某运营商大数据能力开放平台总体功能架构其中IaaS层主要依托某运营商集团现有服务器资源,为整个能力开放平台建设提供物理需求。实施成效某运营商借助星环科技相关组件及前沿技术,实现了容器化大数据能力开放平台的构建,实现了整体IT技术架构的容器化升级。主要实现以下应用效益:1)整体资源利用率提升60%星环科技通过统一资源管理

技术博客
当大数据遇上SSD
大数据时代,人们越来越清楚地意识到数据中蕴藏的价值。海量数据的拥有者——运营商,银行,物流公司等等——都在积极地寻求方法利用手中的数据。然而,爆发式增长的数据量正在超出传统数据库的处理能力。为了应对,“我们的产品为企业提高生产力,而将内存替换为SSD可以在不影响性能的情况下提升用户体验并且降低成本。”在为某省级移动通信运营商部署大数据解决方案时,星环科技第一次将SSD作为内存的替代应用在了生产中。在测试、积极响应的售后服务方案和强大的渠道供货能力,更是为项目提供了强有力的后盾。与传统方案相比,星环科技的解决方案有如下几点优势:该省级移动运营商单月清单数量在1000亿条左右,每月数据量达100TB。企业为自己的传统数据库做纵向扩展只会钱越花越多,收效越来越少。Hadoop架构很好地解决了扩展的瓶颈,它设计部署在经济实惠的硬件上,通过横向扩展,便可无限地提升数据处理能力。基于Hadoop的大数据软件因为其强大的处理能力和高性价比在数据分析市场崭露头角。星环信息科技(上海)有限公司(以下简称星环科技)的企业级一站式大数据综合平台TranswarpDataHub(以下简称TDH)是Hadoop发行版

容器化大数据能力开放平台此前,星环科技助力某运营商建设的容器化大数据能力开放平台,获得了中国通信标准化协会颁发的“云原生十大优秀案例”。该容器化大数据能力开放平台可实现跨数据中心的异构计算资源管理和调度,构筑了大数据及云计算创新空间,赋能各类合作伙伴的应用孵化和创新探索。目前已在某运营商40余个省公司、子公司、创新基地投入使用,实现了全国1.2万个生产任务的调度。同时,引入金融、电商、汽车几个方面:1.IT系统呈“竖井式”发展运维难度大,跨系统协同困难某运营商经过前几年信息化建设的不断迭代,IT架构呈现“多而散”的状态。各个业务系统自建大数据处理平台,数据中心有超过20个独立的,需要通过DC/OS(DataCenterOperatingSystem)技术对服务器资源进行统一管理,实现资源池化、资源共享。4.大数据能力共享困难,存在重复建设问题某运营商总部有整体的服务器资源运营商早期在使用大数据技术时,大部分是物理部署Hadoop集群。这种架构本身不是基于云平台的模式设计,所以在多租户管理、资源隔离、弹性伸缩等方面存在许多不足之处,无法很好的解决省分公司提出的能力共享问题

容器化大数据能力开放平台此前,星环科技助力某运营商建设的容器化大数据能力开放平台,获得了中国通信标准化协会颁发的“云原生十大优秀案例”。该容器化大数据能力开放平台可实现跨数据中心的异构计算资源管理和调度,构筑了大数据及云计算创新空间,赋能各类合作伙伴的应用孵化和创新探索。目前已在某运营商40余个省公司、子公司、创新基地投入使用,实现了全国1.2万个生产任务的调度。同时,引入金融、电商、汽车几个方面:1.IT系统呈“竖井式”发展运维难度大,跨系统协同困难某运营商经过前几年信息化建设的不断迭代,IT架构呈现“多而散”的状态。各个业务系统自建大数据处理平台,数据中心有超过20个独立的,需要通过DC/OS(DataCenterOperatingSystem)技术对服务器资源进行统一管理,实现资源池化、资源共享。4.大数据能力共享困难,存在重复建设问题某运营商总部有整体的服务器资源运营商早期在使用大数据技术时,大部分是物理部署Hadoop集群。这种架构本身不是基于云平台的模式设计,所以在多租户管理、资源隔离、弹性伸缩等方面存在许多不足之处,无法很好的解决省分公司提出的能力共享问题

容器化大数据能力开放平台此前,星环科技助力某运营商建设的容器化大数据能力开放平台,获得了中国通信标准化协会颁发的“云原生十大优秀案例”。该容器化大数据能力开放平台可实现跨数据中心的异构计算资源管理和调度,构筑了大数据及云计算创新空间,赋能各类合作伙伴的应用孵化和创新探索。目前已在某运营商40余个省公司、子公司、创新基地投入使用,实现了全国1.2万个生产任务的调度。同时,引入金融、电商、汽车几个方面:1.IT系统呈“竖井式”发展运维难度大,跨系统协同困难某运营商经过前几年信息化建设的不断迭代,IT架构呈现“多而散”的状态。各个业务系统自建大数据处理平台,数据中心有超过20个独立的,需要通过DC/OS(DataCenterOperatingSystem)技术对服务器资源进行统一管理,实现资源池化、资源共享。4.大数据能力共享困难,存在重复建设问题某运营商总部有整体的服务器资源运营商早期在使用大数据技术时,大部分是物理部署Hadoop集群。这种架构本身不是基于云平台的模式设计,所以在多租户管理、资源隔离、弹性伸缩等方面存在许多不足之处,无法很好的解决省分公司提出的能力共享问题

11月5日,星环科技与大唐电信科技股份有限公司举行战略合作签约仪式。战略合作基于双方在各自领域的优势整合,就大数据、人工智能在运营商、交通、智慧城市等关键领域的应用建立战略合作关系;在市场上形成并上的)Hadoop架构,完成了大数据基础核心软件的重构,实现自主研发并持续保持创新。目前星环科技是国内少有的能够覆盖几乎全部数据库品类的厂商。作为一家自主研发的大数据基础软件提供商,星环科技的平台已经在众多行业开始替代包括甲骨文、IBM等国外Hadoop供应商的产品。在自主可控大数据软件和硬件得到国家政策的鼓励与支持背景下,希望双方进一步加强技术对接,市场联合拓展等方面,合力推动行业的创新利用双方强有力的行业资源优势、技术优势,共同开拓中国大数据、人工智能领域的业务合作。大唐电信科技股份有限公司党委书记、总裁雷信生、副总裁商利平,星环科技创始人兼CEO孙元浩、渠道销售部总经理刘辉、渠道部专注于企业级容器云计算、大数据和人工智能核心平台的研发的公司,目前产品已经覆盖包括金融、能源、交通、制造业、传媒等在内的20多个行业的超1600多家用户。经过六年的技术发展,星环科技抛弃了过时的(狭义

11月5日,星环科技与大唐电信科技股份有限公司举行战略合作签约仪式。战略合作基于双方在各自领域的优势整合,就大数据、人工智能在运营商、交通、智慧城市等关键领域的应用建立战略合作关系;在市场上形成并上的)Hadoop架构,完成了大数据基础核心软件的重构,实现自主研发并持续保持创新。目前星环科技是国内少有的能够覆盖几乎全部数据库品类的厂商。作为一家自主研发的大数据基础软件提供商,星环科技的平台已经在众多行业开始替代包括甲骨文、IBM等国外Hadoop供应商的产品。在自主可控大数据软件和硬件得到国家政策的鼓励与支持背景下,希望双方进一步加强技术对接,市场联合拓展等方面,合力推动行业的创新利用双方强有力的行业资源优势、技术优势,共同开拓中国大数据、人工智能领域的业务合作。大唐电信科技股份有限公司党委书记、总裁雷信生、副总裁商利平,星环科技创始人兼CEO孙元浩、渠道销售部总经理刘辉、渠道部专注于企业级容器云计算、大数据和人工智能核心平台的研发的公司,目前产品已经覆盖包括金融、能源、交通、制造业、传媒等在内的20多个行业的超1600多家用户。经过六年的技术发展,星环科技抛弃了过时的(狭义
猜你喜欢
产品文档
5.3 写入类操作
本节介绍Hippo表写入相关操作。Hippo会返回写入成功数据的下标以及总共写入成功的数据条数,如果出现行级错误(比如主键冲突),Hippo会返回具体的行级错误。插入本节介绍如何向Hippo中插入数据。curl-ushiva:shiva-XPUT'localhost:8902/hippo/v1/{table}/_bulk?database_name={database_name}&pretty'-H'Content-Type:application/json'-d'{"fields_data":[{"field_name":"book_id","field":[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74...
产品文档
5.8 查看集群信息
查看Master节点通过以下命令,查看集群Master节点信息:curl-ushiva:shiva-XGET'localhost:8902/hippo/v1/_cat/master?v'返回结果:epochtimestampactive.master.hostactive.master.portmaster.group169079683909:47:19172.29.203.18926841172.29.203.189:26841,172.29.203.189:26851,172.29.203.189:26861查看数据节点curl-ushiva:shiva-XGET'localhost:8902/hippo/v1/_cat/nodes?v'//查看所有节点curl-ushiva:shiva-XGET'localhost:8902/hippo/v1/_cat/nodes/{node}?v'//{node}表示待匹配的节点地址,支持以*通配,支持指定多个pattern,多个pattern以逗号分割返回结果:
产品文档
1 Introduction
OverviewUnstructureddatamanagementismoreimportantthaneverduetotheriseofbigdata.Managingandgleaningbusinessvaluefromunstructureddataisofutmostimportancetoenterprisestoday.Advancementsinmachinelearning,aswellasdeeplearning,technologiesnowenableorganizationstoefficientlyaddressunstructureddataandimprovequalityassuranceefforts.Inthefieldofartificialintelligenceormachinelearning,embeddingsandvectordatabaseshavebecomeincreasinglyimportantfortacklingawiderangeofproblems.Thesetechniquesareusedtorepresen...
产品文档
5.10 任务相关
在Hippo中,比较耗时的操作如激活、加载向量索引实际上是一个分布式任务,用户可以通过任务相关接口查看、删除任务。查看任务curl-ushiva:shiva-XGET"localhost:8902/hippo/v1/_jobs?pretty"-H'Content-Type:application/json'-d'{"job_ids":["fc6feff4f303455a9347f9aab323dfc8"],"action_patterns":["hippo*"]}';返回结果:{"jobs":[{"job_id":"810935a1d91a46b7af2ec35013454fed","job_status":"SHIVA_JOB_SUCCESS","embedding_number":100,"task_results":[{"id":"54ab52493dfb4bab9fb7742d850c64c4","status":"TASK_SUCCESS","server":"172.29.40.26:27841","embedding_number":100,"execute_time":...
产品文档
10 Hippo 运维
运维管理界面WebserverWebserver是Hippo提供运维监控的界面。默认访问地址为:4567"class="bare">http://<webserver_ip>:4567。或者在Manager管理界面我们可以通过下图所示的查看链接这里进行跳转。图15.登录HippoWebserverWebserver主要由下面几个部分构成。概况图16.概况该页面展示了Hippo集群的基本信息,包括:Masterstatus:当前的ActiveMaster,MasterGroup,MasterAddress,Master的健康状态TabletServerStatus:TabletServerAddress,健康状态,逻辑机架和数据中心信息,容量使用以及Tablet个数TabletNum:当前集群表的个数Version:Hippo版本信息库表图17.库表页面以库和表的概念集群存储的各类数据信息。库信息:库名库创建时间库内各类表的信息:点击某个库,可以看到库下所有表的信息,主要包括:••表的ID••表的名字••表的状态••表的Tablet数量••表的Engine类型••表的副本数•...
产品文档
2 Quick Start
ThistutorialwillguideyouthroughthefollowingtaskswithinHippoCloud:EstablishingatablePerusingthetableIncorporatingdataExecutingsearchoperationsEliminatingrowsDissolvingthetableBeforeyoustartInthisguide,wewillbeutilizingthePythonAPI.Priortocommencement,ensurethatyouhave:RegisteredforaHippoCloudaccount.SubscribedtothecomplimentaryplanandestablishedatrialclusterwithinHippoCloud,orsubscribedtothestandard/enterpriseplansandconstructedadedicatedcluster.IfyouanticipateemployingPythonfordevelopment,ascert...
产品文档
5.7 查询类操作
过滤条件表达式Hippo当前支持如下表达式,可用于标量或向量查询。表46.过滤条件表达式表达式描述and当前版本支持and,不支持or/not==等值<小于⇐小于等于>大于>=大于等于inin[1,2,3]notinnot_in[1,2,3]like'_'表示匹配任一字符,'%'表示匹配任意字符,'\'为转义符向量相似性检索本节描述如何进行向量相似度搜索。Hippo中的向量相似性搜索计算查询向量与表中向量的距离,返回最相似的结果集。通过指定标量过滤条件,用户可以进行向量与标量的混合搜索。curl-ushiva:shiva-XGET'localhost:8902/hippo/v1/{table}/_search?pretty'-H'Content-Type:application/json'-d'{"output_fields":["book_id"],"search_params":{"anns_field":"book_intro","topk":2,"params":{"nprobe":10},"embedding_index":"ivf_flat_index"}...
产品文档
3.3 Cluster
OverviewAclusterisaHippoCloudinstanceassociatedwithspecificcomputingresources.Youcancreaterelatedtables,insertcorrespondingdata,andcompleteproductexperiencewithinacluster.Beforeyouusethedemoenvironment,youneedtocreateacluster.CreateClusterYouneedtogotothespecificproject.Iftherearenoclustersunderthecurrentproject,youcanclickthe'Createcluster'buttonbelowtheclustercreationguidancepagetoentertheclustercreation.Ifthereareclustersunderthecurrentproject,youcanclickthe'+Cluster'buttonabovetheclusterlist...
产品文档
8 性能分析
本节测试主要描述了Hippo1.0在关键测试上的一些性能表现,该份测试同样也是Hippo的基准测试,后续版本发布也会在不同版本上进行该测试进行对比分析。术语表142.Hippo性能测试术语TermDescriptionnq一次搜索请求中搜索的向量个数topk一次请求中对于要检索的每个向量(依赖nq),所能检索到最近距离的向量个数RT一次请求从发起到接受响应的时间]QPS请求在每秒内成功执行的次数dataset测试所用数据集,不同数据集表示不同的业务场景测试集群配置硬件配置表143.性能测试硬件配置硬件规范Nodes3CPUIntel®Xeon®Gold5218RCPU@2.10GHzMemory16*\16GBRDIMM,3200MT/sDISKNVMeSSD2T*4GPUNONE软件配置表144.性能测试软件配置软件版本Hippov1.2TranswarpManagerTDH9.3.0测试集表145.性能测试数据集数据集名称数据集介绍向量维度向量总数查询数量数据总量距离类型Sift-128-euclidean该数据集是基于Texmex的数据集整理,使用SIFT算法得到的图片特征向量。...
产品文档
5.18 全文检索
Hippo在1.2版本提供了全文索引能力,兼容ElasticSearch6.7.2语法,在底层架构上复用了公司产品TranswarpScope的一部分特性,支持以Java/HTTPRestful的形式通过Hippo的HTTPServer接口进行全文索引的创建、查询、使用等各类需求,通过该能力的支持,可以更好的实现向量与全文的混合检索。通过将向量检索加全文检索的联合召回,可以降低漏检和误检的概率,能够实现比单独使用向量或全文更高的精度。同时,一套数据库系统可避免部署多套系统带来的架构复杂、开发运维成本高等问题。具体的使用方法除了访问端口需要将端口从8902调整为9200外,均可参考《TranswarpScope手册》4.TranswarpScopeAPI介绍。