图数据库:1 简介

来源:互联网 发布:java反射到底是什么 编辑:程序博客网 时间:2024/05/22 13:41

第一章 简介

图论

图是什么:实体与实体之间的关联

Gartner定义了商业世界的5个图-----社交、意向、消费、兴趣和移动,并指出运用这些图的能力是一个”可持续的竞争优势“。

现在最流行的图模型----带标签的属性图:

  • 它包含节点和联系
  • 节点上有属性(键值对)
  • 节点可以有一个或多个标签
  • 联系有名字和方向,并总是有一个开始节点和一个结束节点
  • 联系也可以有属性


1.2 图领域概览

   从高空俯瞰,可以将图领域划分成以下两部分:

  • 主要用于联机事务图的持久化技术,通常直接实时地被应用程序访问:被称为图数据库
  • 主要用于离线图分析的技术,通常按一系列步骤执行:被称为图计算引擎

从另一个视角去划分图领域,去观察各种技术使用的图模型。主流的图模型有3种,分别是属性图、资源描述框架(RDF)三元组和超图。


图计算引擎

    使我们可以在大数据集上使用全局图算法。如”在一个社交网络中,平均每个人有多少联系?“这样的问题,因为偏重于全局查询,图计算引擎通常为扫描和批处理大规模信息做过优化,在这个方面,它们和其他批分析技术类似。只有一部分图计算引擎有自己的图存储层,其他的则只关注于如何处理外部传入的数据,然后返回结果到其他地方存储。


图计算引擎多种多样。最出名的有内存的、单机的图计算引擎Cassovary,以及分布式的图计算引擎Pegasus和Giraph。大多数分布式图计算引擎都是基于Google发布的Pregel白皮书,它主要讲述了Google如何使用图计算引擎来计算网页排名。

图数据库的威力

    性能:在数据集增大时,它的性能趋向于保存不变,这是因为查询总是只与图的一部分相关。

    灵活性:可扩展的

    敏捷性:



原创粉丝点击