cassandra的数据分布和副本策略
来源:互联网 发布:淘宝网中老年皮鞋 编辑:程序博客网 时间:2024/04/29 05:48
由于cassandra集群的每个节点是对等的,所以数据的分布和副本是在一起的。
数据是通过表组织起来的,通过行键(主键)标识,主键决定了数据存储在哪个节点。每一行会有多个副本(replica),注意第一份数据也被称为副本。
当建立一个集群时,必须指定以下内容:
虚拟节点:把数据分配到物理机器节点
分片器:在整个集群中对数据进行分片
副本策略:决定每行数据的副本
Snitch: 决定副本策略的拓扑信息。
数据分布
1.一致性hash
cassandra为每个主键计算一个hash值,为每个节点指定一个其负责的hash值范围,根据主键hash值和节点负责的hash值范围将不同的行存储到不同的节点。2.数据如何分布
在1.2之前,必须为每个节点分配一个token,每个token决定了节点在集群环上的位置以及它负责保存的数据(根据主键hash值)。
1.2版引入了虚拟节点,允许每个节点拥有多个小的hash范围。虚拟节点也使用一致性hash分布数据,但是不需要产生和分配token。
如下图所示:
副本策略
一行有几个副本由副本因子参数决定,1表示每行只有一个副本,2表示每行有2个副本,保存子不同的节点上。所有的节点都同样重要,没有主次之分。
副本数量应该不超过集群节点的数量。有两种副本策略:
SimpleStrategy:适用于只有一个数据中心的状况。第一个副本的存储位置由分片器(partitioner)决定,其他副本按照顺时针方向依次放在其它节点。
NetworkTopologyStrategy: 推荐方式,因为可以扩展到多数据中心。
- cassandra的数据分布和副本策略
- Cassandra数据分布和副本
- Cassandra数据副本策略
- 分布式文件系统的副本分布策略
- Cassandra数据分布测试
- 基于副本索引的数据副本一致性维护策略
- Datastax文档Apache Cassandra v2.1 第二部分 理解Cassandra架构_数据分发和副本
- Cassandra数据分布之1数据中心(DC)和机架(RACK)
- Cassandra数据分布之3几个概念之间的联系
- cassandra 如何写数据以及放置副本
- 数据分布的六种策略
- HDFS数据副本存放策略
- hadoop2.0的datanode多目录数据副本存放策略
- hadoop2.0的datanode多目录数据副本存放策略
- Cassandra数据分布之5分区器
- HDFS副本放置策略的研究和优化
- HDFS的副本存放策略
- crush:一种可控,可扩展、去中心的数据副本分布方法(一)
- 未能加载文件或程序集“Oracle.DataAccess”或它的某一个依赖项。试图加 载格式不正确的程序。
- Aptana Studio 3汉化成简体中文版
- Android随记------NDK入门使用
- javaScript开发小技巧(很实用)
- PE文件结构剖析
- cassandra的数据分布和副本策略
- PHP获取远程图片并调整图像大小
- [代码片段] 【Android】 Log类
- 商务电话拨号项目总结
- keepalived健康检查 HTTP_GET .
- 最具创新力公司50强:耐克居首
- demo08
- sh ./程序名 not found的一种原因
- Android使用AsyncTask下载显示图片