图数据库OrientDB-基础篇

来源：互联网发布：怎么在eclipse中看源码编辑：程序博客网时间：2024/06/06 00:37

本文假设用户已有RDBMS及标准SQL的基础知识。

本文不对OrientDB的下载、安装、使用作说明。具体可参考：http://orientdb.com/getting-started/

主要内容

1、什么是图数据库

2、图数据库的适用场景

3、为什么要使用图数据库

4、OrientDB的特性

5、OrientDB的数据模型

6、OrientDB的一些基本概念

7、OrientDB的查询

1、什么是图数据库

图：一些节点和关联这些节点的联系的集合。

NoSql(Not Only Sql)数据库分为四大类：

key/value 例如: Redis

column-oriented 例如: Hbase

document 例如: MongoDB

graph 例如: Neo4j,OrientDB

图数据库是NoSql数据库的一种。

2、图数据库的适用场景

世界上的大部分领域实际上都可以建模成图。

Gartner定义了商业世界的5个图:

社交、

意向、

消费、

兴趣、

移动。

3、为什么要使用图数据库？

性能

灵活性

图天生是可扩展的。

新增加节点与边对现有的模型，SQL，应用程序等没有任何影响。

敏捷性

可以与敏捷开发或者测试驱动开发模式保持一致。

我们知道现在的大型软件开发，业务模型不可能在开发初期就完美地确定下来。随着需求的变化，业务模型在后期可能会与当初设计大相径庭，而图数据库则拥抱变化。

4、OrientDB的特性

OrientDB是用JAVA语言实现的，运行在JVM之上。

Multi-Model：OrientDB支持多种模型：Key/Value, Object, Document, and Graph。

Multi-Master Replication： OrientDB集群部署时每个点都是Master，每个Master上都有完整的数据。一旦一个Master上的数据发生变更，会将发生变更的数据同步通知其它Master。

Extended SQL: OrientDB支持大部分标准的SQL，同时在标准的SQL之上扩展了部分功能以方便图的操作。

Easy Integration ：使用teleporter可以很容易地将数据从RDBMS迁移到OrientDB上。

OOP：OrientDB定义数据结构的Class符合OOP(Object-oriented programming)的理念，支持继承和多态的特性。

Document-Graph：如下图API的依赖关系。

5、OrientDB的数据模型

OrientDB支持多种模型： Key/Value, Object, Document, and Graph 。

Key/Value

Object

Document

Graph

6、OrientDB的一些基本概念

Classes : 类比关系型数据库系统中的Table与传统文档数据库的collections。这个概念来自于OOP（Object-oriented programming）的理念。class用于定义数据结构的模型。

Record：record是OrientDB中最小的加载和存储的单位。record有四种类型：Document、RecordBytes（BLOB）、Vertex、Edge。

Document：是OrientDB中最灵活的record。Document支持schema-less,schemal-full,schema-mixed，即可以在定义数据结构的时候指定属性及约定条件，也可以不指定。它通过create class语法来定义一个数据结构。

Vertex：在OrientDB的graph模型下，每个结点叫作Vertex，每个Vertex也是一个Document。

Edge：在OrientDB的graph模型下，连接两个Vertex的边叫作Edge。Edge是有向性的而且仅能连接两个Vertex。

Clusters : 用于存储record。每个数据库最多有32767个cluster。每个class都必须至少有一个对应的cluster。默认情况下OrientDB会自动为每个class创建与当前cpu核数相同的cluster，其中有一个默认的cluster。

Cluster Selection：当新增加一条reocrd时OrientDB会根据cluster section为这条记录选择一个cluster。cluster section有四条类型：

detault、round-robin、balanced、local。

Record ID：每个record都有一个record id。 record id的格式如下：

#<cluster-id>:<cluster-position>。

Relationships： OrientDB中不使用join，它通过在每个reocrd中定义一个关系类型的属性来维护关系。这个关系属性存储的实际是record id，就像定义一个指针在内存中将两个record联系起来。

Inheritance & Polymorphic： OrientDB支持面向对象的继承和多态特性。

7、OrientDB的SQL

在写图数据库的SQL时，第一步是要确认起始点(这个也是图数据库比较耗时的地方)，一旦起始点确认后，我们便可以近乎物理连接的方式查询这个起始点相关联的数据。

基本的SQL：OrientDB支持大部分标准的SQL查询。

例如：SELECT FROM Person WHERE name LIKE 'Luk%'

Traverse：traverse语法可以遍历获取一个record联结的reocrd。它比select使用起来更简单和快速。

例如：RAVERSE out("Friend") FROM #10:1234 WHILE $depth <= 3

Match：match是一种表述力很强的查询语法结构，类比Neo4j的Cypher语法结构。它以一种说明式的方式来查询。

例如：

MATCH {class: Person, as: person, where: (name = 'John' AND surname = 'Doe')}.both('Friend').both('Friend')

{as: friendOfFriend} RETURN person, friendOfFriend

本文转自微信公众号 “GraphDB"

0 0