2018-11-23 graph图数据库概览,经过一个星期的Demo终于看懂了这篇文章20180818图数据库概览 - 腾讯云开发者社区-腾讯云


本站和网页 https://cloud.tencent.com/developer/article/1372970 的作者无关,不对其内容负责。快照谨为网络故障时之索引,不代表被搜索网站的即时页面。

2018-11-23 graph图数据库概览,经过一个星期的Demo终于看懂了这篇文章20180818图数据库概览 - 腾讯云开发者社区-腾讯云腾讯云备案控制台开发者社区学习实践活动专区工具TVP文章/答案/技术大牛搜索搜索关闭写文章提问登录/注册Albert陈凯527 篇文章2018-11-23 graph图数据库概览,经过一个星期的Demo终于看懂了这篇文章20180818图数据库概览转到我的清单专栏首页Albert陈凯2018-11-23 graph图数据库概览,经过一个星期的Demo终于看懂了这篇文章20180818图数据库概览30分享分享文章到朋友圈分享文章到 QQ分享文章到微博复制文章链接到剪贴板海报分享海报分享2018-11-23 graph图数据库概览,经过一个星期的Demo终于看懂了这篇文章20180818图数据库概览发布于2018-12-17 10:17:37阅读 1.8K020180818图数据库概览20180818图数据库概览朱金华朱金华1.总体趋势Knowledge Base of Relational and NoSQL Database Management Systems​db-engines.com根据DB-Engines的数据库DB-Engines排名,图数据库一骑绝尘,图数据库2018-8的最新排名如下Neo4j仍是最流行的图数据库,图中JanusGraph的排名并不靠前,但要考虑到他是之前很火已经被收购停止发展的titan的fork分支,所以这点加成还是可以算上的。图中与OrientDB趋势基本一致的哪个黑线就是titabDB生前的排名。CosmosDB/DatastaxStardog/Sqrrl等商业数据库就不做分析了, 本文只对Neo4j、OrientDB、JanusGraph、Giraph、HugeGraph做下分析,其中HugeGraph并不在上面,这是百度开源的图数据库,简单看了下也不错,列在这。2.图数据库组件一个完善的图数据系统应该至少包括图存储及图处理引擎,数据导入导出,管理运维,查询和计算,商业化产品需要有高可用及容灾备份。图存储和图处理:这个是图数据库的核心,图存储负责将关系型数据集非结构化数据转成图结构进行存储,这里的存储可以为原生存储或序列化之后的非原生存储;图处理则负责数据的更新及运算。数据导入导出:数据从外界到图存储的导入导出能力,如从外界的json、csv,rdf等数据形式导入到图数据库中,或将图数据库中的数据导出来。管理运维:管理运维则包含系统的监控,配置及可视化能力查询和计算:主要指提供查询语言供用户进行图的查询遍历等操作。3.图数据库:【1】Neo4j是老牌的图数据代表。其功能强大,性能也不错,单节点的服务器可承载上亿级的节点和关系,单节点性能不够时也可进行分布式集群部署。Neo4j有自己的后端存储,不必如同JanusGraph等一样还要依赖另外的数据库存储。
Neo4j在每个节点中存储了每个边的指针,因而遍历时效率相当高。Neo4j分为社区版和企业版,社区版功能受限,另外其提供可视化的客户端感觉很不错。据neo4j的中国合作方的社区中描述,主要区别如下:1、容量:社区版最多支持 320 亿个节点、320 亿个关系和 640 亿个属性,而企业版没有这个限制;2、并发:社区版只能部署成单实例,不能做集群。而企业版可以部署成高可用集群或因果集群,从而可以解决高并发量的问题;3、容灾:由于企业版支持集群,部分实例出故障不会影响整个系统正常运行;4、热备:社区版只支持冷备份,即需要停止服务后才能进行备份,而企业版支持热备,第一次是全量备份,后续是增量备份;5、性能:社区版最多用到 4 个内核,而企业能用到全部内核,且对性能做了精心的优化;6、支持:企业版客户能得到 5X10 电话支持(Neo4j 美国电话、邮件,微云数聚电话、微信、邮件);考虑到这些限制,要选开源免费大容量分布式的图数据库的可以跳过了,研究图论及小型应用或不差钱的项目则选其的支持服务则另当别论。另外neo4j的协议为GPLv3,这个也不适合选用。【2】OrientDBOrientDB据描述性能可以达到Neo4j的数倍,但也有测试表明在遍历时磁盘空间增加,以空间换时间,遍历性能不高,但计算最短路径等性能高。
Neo4J和OrientDB在插入数据时候都会默认建立索引,索引的不同也造成了其不同操作的性能差异;
Neo4J:擅长遍历图及不存在大量关系的节点的图计算
OrientDB:侧重文档数据库,主要还是SB树索引导致,空间浪费比较大;插入节点与neo4j差不多,但是在插入节点关系即边时无优化;在图论算法上性能高,但遍历性能低。
OrientDB也有社区版及企业版,但是其基于Apache2.0协议,这个更友好【3】JanusGraphDistributed graph database​janusgraph.org图标JanusGraph基于Titan发展而来,包含其所有功能,采用Tikerpop的Gremlin图查询语言,有单独的后端存储,支持Cassandra/HBase/BerkeleyDB等做存储,支持Solr/ES/Lucence等做图索引
支持Spark GraphX/Giraph等图分析计算引擎及Hadoop分布式计算框架
原生支持集成了Tinkerpop系列组件:Gremlin查询语言,Gremlin-Server及Gremlin applications。
采用很友好的Apache2.0协议,支持对接可视化组件如Cytoscape, plugin for Apache TinkerPop,Graphexp,KeyLines by Cambridge Intelligence,Linkurious【4】HugeGraph王二铁:百度安全开源大规模图数据库HugeGraph​zhuanlan.zhihu.com图标HugeGraph是支持Apache TinkerPop 3框架和Gremlin图查询语言的大型分布式图数据库,据其描述其性能是相当强劲,刚开源不久。不过貌似每个都说自己是最好最强的... HugeGraph是一款面向分析型,支持批量操作的图数据库系统,它能够与大数据平台无缝集成,有效解决海量图数据的存储、查询和关联分析需求。HugeGraph支持HBase和Cassandra等常见的分布式系统作为其存储引擎来实现水平扩展。HugeGraph可以与Spark GraphX进行链接,借助Spark GraphX图分析算法(如PageRank、Connected Components、Triangle Count等)对HugeGraph的数据进行分析挖掘。
HugeGraph的主要特点包括:
基于TinkerPop 3 API实现,支持Gremlin图查询语言;
拥有完善的周边工具链和相关功能组件,可以满足图数据库开发的基本需求,提供易用高效的使用体验;
具备独立的Schema管理模块,丰富完善的Schema校验机制,确保图数据库中的数据完整性和一致性;
支持数据的备份和还原,可以在不同的后端存储之间转换;
多种ID生成策略应对不同业务场景,拥有完善的索引管理机制,支持多种索引查询操作;
可以实现与Hadoop、Spark、HBase、ES等大数据系统集成,支持多种Bulk Load操作,实现海量数据快速插入;
除上述特定之外,HugeGraph还针对图数据库的高频应用(例如:ShortestPath、k-out、k-neighbor等)做了特定性能优化,并且为用户提供更为高效的使用体验
我的感觉是跟titan/JanusGraph蛮像的看其致谢果不其然,不过里面还是蛮多创新及扩展的,如果他能持续的接纳Janus和DataStax的新特性并长久发展的话用这个倒是不错。 HugeGraph relies on theTinkerPopframework, we refer to the storage structure ofJanusGraphand the schema definition ofDataStax. Thanks to Tinkerpop, thanks to JanusGraph and Titan, thanks to DataStax. Thanks to all other organizations or authors who contributed to the project.
3.图分析系统上面简单介绍了几个图数据库,也提到其后端存储,neo4j等使用自己的原生图存储,而JanusGraph/HugeGraph等则用非原生图存储。原生图存储一般都是经过专门为了存储和管理图结构而优化的,遍历查询性能很高,但掐非遍历类的查询则不占优势,且为了全局搜索还会占用大量内存。非原生图存储通常将图结构序列化存储到RDBMS或其他通用存储中,如JanusGraph的HBase/Cassandra,HugeGraph甚至增加了对MySQL等的支持。一个图分析系统除了图数据库外还要有图计算引擎,主要目的是为了进行除遍历外的图算法分析。前述的图数据库相当于OLTP,而图计算则相当于OLAP。有的图数据库也继承了少量的图计算能力,但真正的大型系统还是需要单独的计算框架。基于图的并行计算框架,有google的Pregel,基于Spark的GraphX,Apache下的Giraph/HAMA以及GraphLab,其中Giraph是Pregel的开源实现。本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!本文分享自作者个人站点/博客:https://www.jianshu.com/u/185a3c553fc6复制如有侵权,请联系 cloudcommunity@tencent.com 删除。展开阅读全文存储举报点赞 3分享登录 后参与评论0 条评论相关文章可交互的 Attention 可视化工具!我的Transformer可解释性有救了?视觉是人和动物最重要的感觉,至少有80%以上的外界信息是经过视觉获得的。我们看论文的时候,通过图表来确定文章的大致内容往往也是一个更高效的 说到深度神经网络的可...磐创AINebula Graph 在企查查的应用企查查是企查查科技有限公司旗下的一款企业信用查询工具,旨在为用户提供快速查询企业工商信息、法院判决信息、关联企业信息、法律诉讼、失信信息、被执行人信息、知识产权...NebulaGraphSpring Security(一)--Architecture Overview一直以来我都想写一写Spring Security系列的文章,但是整个Spring Security体系强大却又繁杂。陆陆续续从最开始的guides接触它,项目...kirito-moeMAT入门到精通(二)上一篇文章MAT入门到精通(一)介绍了MAT的使用场景和基本概念,这篇文章开始介绍MAT的基本功能,后面还有两篇,一篇是MAT的高级功能,另一篇是MAT实战案例...阿杜MAT入门到精通(二)上一篇文章MAT入门到精通(一)介绍了MAT的使用场景和基本概念,这篇文章开始介绍MAT的基本功能,后面还有两篇,一篇是MAT的高级功能,另一篇是MAT实战案例...kirito-moeSpring Security (一) Architecture Overview国庆 + 中秋,先祝大家双节快乐!接一下推荐一下国庆还在写干货的有为少年,也就是本篇的作者,文末卡片点击可关注他的个人公众号!
一直以来我都想写一写Spring...程序猿DD这样的Power BI周分析你见过吗?零售、电商、教育等领域的诸多业务场景中需要按周进行分析,然而Power BI并未提供周粒度的时间智能函数,这让很多人想分析时感觉力不从心、无从下手。
陈学谦TDSQL参加全球数据库顶级盛会 VLDB 2018回顾作者介绍:卞昊穹(hankbian):腾讯数据库TDSQL团队成员,高级工程师。中国人民大学博士,曾在SIGMOD、ICDE、CIKM等数据库相关领域顶级会议发...腾讯云数据库 TencentDBTDSQL带你走进数据库顶会VLDB 2018 | 论文纵览一年一届的数据库领域顶级会议VLDB 2018即将于当地时间8月27日-8月31日在巴西里约热内卢召开。
在本届大会上,腾讯公司TDSQL团队携手中国人民大学...腾讯技术工程官方号Nebula Graph 系列(1) —— 初识 NebulaNebula Graph 是一个高性能、可线性扩展、开源的分布式图数据库。Nebula Graph 采用 shared-nothing 分布式架构,企业可针对性...求和小熊猫ICCV2019 Oral论文:基于图嵌入的深度图匹配(已开源)由上海交通大学研究团队独立完成的论文Learning CombinatorialEmbedding Networks for Deep Graph Matchi...SIGAI学习与实践平台口罩识别问世,FaceBook进军VR设备,AutoML超越数据科学家 | AI大事件新冠病毒在地球上已经肆虐了快半年了,检测行人是否戴了口罩的AI系统终于诞生了。该系统可以通过眼睛、鼻子、嘴巴和耳朵的特征来判断行人是否佩戴了口罩。行人的照片由个...大数据文摘ICCV2019 Oral论文:基于图嵌入的深度图匹配(已开源)由上海交通大学研究团队独立完成的论文Learning CombinatorialEmbedding Networks for Deep Graph Matchi...小白学视觉如何处理异构数据?明略科学院最新成果:基于图数据模型,定义数据统一完整流程ACM CIKM全称为(ACM International Conference on Information and Knowledge Management...AI科技评论记一次面试的尴尬,说说作为数据库工程师,学好英语的重要性很多年前,我就知道自己很笨,不会察言观色,不会端茶递水,肯定不能在某些单位混得开。所以工作2年后,就动了跳槽的念头。看着外企招聘DBA,开出比自己当时高3-4倍...Lenis实时数仓方案五花八门,实际落地如何选型和构建!著有:《图解 Spark 大数据快速分析实战》;《offer 来了:Java 面试核心知识点精讲(原理篇)》;《offer 来了:Java 面试核心知识点精讲(...小晨说数据EA出品2020版「灌篮高手」:运球、抢断生成敏捷流畅,帮你找回童年梦想上世纪 90 年代,《灌篮高手》风靡亚洲,承载了无数 80、90 后的童年回忆和梦想。二十多年过去了,《灌篮高手》早已完结,但关于篮球的动画技术却一直在进步。在...机器之心新手阅读 Nebula Graph 源码的姿势对于一些刚开始接触 Nebula Graph 开源库的小伙伴来说,刚开始可能和我一样,想要提高自己,看看大神们的代码然后试着能够做点什么,或许能够修复一个看起来...NebulaGraph更多文章作者介绍Albert陈凯关注专栏文章527阅读量503K获赞2.6K作者排名438精选专题腾讯云原生专题云原生技术干货,业务实践落地。活动推荐腾讯云自媒体分享计划入驻社区,可分享总价值百万资源包立即入驻邀请好友加入自媒体分享计划邀请好友,同享奖励 30 / 100 / 180 元云服务器代金券立即邀请运营活动广告关闭社区专栏文章阅读清单互动问答技术沙龙技术视频团队主页腾讯云TI平台活动自媒体分享计划邀请作者入驻自荐上首页技术竞赛资源技术周刊社区标签开发者手册开发者实验室关于视频介绍社区规范免责声明联系我们友情链接归档问题归档专栏文章归档快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档腾讯云开发者扫码关注腾讯云开发者领取腾讯云代金券热门产品域名注册云服务器区块链服务消息队列 网络加速云数据库域名解析云存储视频直播热门推荐人脸识别腾讯会议企业云CDN 加速视频通话图像分析MySQL 数据库SSL 证书语音识别更多推荐数据安全负载均衡短信文字识别云点播商标注册小程序开发网站监控数据迁移Copyright © 2013 - 2022 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有 京公网安备 11010802017518 粤B2-20090059-1扫描二维码扫码关注腾讯云开发者领取腾讯云代金券