NoSQL的总结

来源:互联网 发布:sql server外键约束 编辑:程序博客网 时间:2024/05/17 04:03

本文主要复习各个算法,在全局是什么样的作用。


首先在这个领域基础的两篇论文:Bigtable和Dynamo。

豆瓣在招聘时提到:http://www.douban.com/campus#job-os

Cassandra的Overview中也提到:http://wiki.apache.org/cassandra/ArchitectureOverview

SQL生态系统全面的乱侃了一遍:http://hongweiyi.com/2012/07/the-nosql-ecosystem/



Bigtable

数据模型



row key, column key, and timestamp 作为 KEY;

array of bytes 作为 VALUE。


table,column family,column。

Column key, column family, column content.

在一个table不同的column family数目很少,但是column数目无限多。

通过row key控制tablet,控制locality。


这里有个不同的概念:

连续的数据应该放在一个节点上,备份的数据应该放在不同的物理机器上。


解决错误的算法

vector clock:每次有个Key的值被修改,其vector clock就加一,相当于保存了一个版本信息。

Hinted Handoff,“sloppy quorum”:Hinted Handoff如果负责某个key的节点挂了,就临时找一个节点保存当机期间的写操作,直到故障恢复。“sloppy quorum”是Dynamo中把成功写到临时节点的数目也加到W中。

读时修复:最终一致性,读的时候才来同步。

Anti-Entropy,Merkle Tree:节点通过逐层交换Hash Tree中的信息来找到两个节点的信息不一致的部分。

冲突解决:Dynamo选择把冲突留给应用层来解决。

Gossip:每隔一段时间,随机联系一个阶段,交换节点的健康状态。


一致性hash算法

virtual nodes


NWR之间必须要满足下面关系:R+W>N








Anti-Entropy,Merkle Tree
原创粉丝点击