es配置项解释以及脑裂问题的解决方案

来源:互联网 发布:c语言数组循环左移 编辑:程序博客网 时间:2024/05/17 23:21

elasticsearch重要配置项解释:

  • 集群的名字
 cluster.name:  test-elasticsearch
  • 配置当前节点的名字,每个节点的名字都应该是唯一的
node.name: "node1"
  • es存储数据的地方
path.data:: "/opt/elasticsearch/data"
  • es存储日志的地方
path.logs: "/opt/elasticsearch/logs"
  • 这两个配置有4种配置方法,表示这个节点是否可以充当主节点,以及点是否充当数据节点。具体的解释在 es迁移分片,重置主节点这个博客中有具体的介绍。
node.master: truenode.data: false
  • 绑定host,0.0.0.0代表当前节点的ip
network.host: "0.0.0.0"
  • 这个是对外提供http服务的端口
http.port: 9200
discovery.zen.ping.multicast.enabled: falsediscovery.zen.fd.ping_timeout: 100sdiscovery.zen.ping.timeout: 100sdiscovery.zen.minimum_master_nodes: 3discovery.zen.ping.unicast.hosts:                   - 172.18.1.22:9300                   - 172.18.1.23:9300                   - 172.18.1.24:9300                   - 172.18.1.25:9300                   - 172.18.1.26:9300
discovery.zen.ping.multicast.enabled 这个设置把组播的自动发现给关闭了,为了防止其他机器上的节点自动连入。discovery.zen.fd.ping_timeout和discovery.zen.ping.timeout是设置了节点与节点之间的连接ping时长discovery.zen.minimum_master_nodes 这个设置为了避免脑裂。比如5个节点的集群,如果设置为3,那么当一台节点脱离后,按照上面的情况重新选择master要超过3个投票才可以成为master节点,并不会出现脑裂现象。discovery.zen.ping.unicast.hosts 这个设置了自动发现的节点。action.auto_create_index: false 这个设置了自动发现的节点。

elasticsearch选举master机制

  • 对所有可以成为master的节点根据nodeId排序,每次选举每个节点都把自己所知道节点排一次序,然后选出第一个(第0位)节点,暂且认为它是master节点。

  • 如果对某个节点的投票数达到一定的值(可以成为master节点数n/2+1)并且该节点自己也选举自己,那这个节点就是master。否则重新选举。

注意:这里理解的是有机会成为master节点的机器拥有投票权,如果仅仅是数据节点应该不具备选举权


脑裂现象的产生

由于某些节点的失效,部分节点的网络连接会断开,并形成一个与原集群一样名字的集群,这种情况称为集群脑裂(split-brain)现象。这个问题非常危险,因为两个新形成的集群会同时索引和修改集群的数据,这个时候就会出现数据冲突了。

可能产生“脑裂”的原因?

  • 网络原因
    内网一般不会出现此问题,可以监控内网流量状态。外网的网络出现问题的可能性大些。

  • 节点负载
    由于master节点与data节点都是混合在一起的,所以当工作节点的负载较大(确实也较大)时,导致对应的ES实例停止响应,而这台服务器如果正充当着master节点的身份,那么一部分节点就会认为这个master节点失效了,故重新选举新的节点,这时就出现了脑裂;
    这里最好是master节点和数据节点分开。

  • 回收内存
    由于data节点上ES进程占用的内存较大,较大规模的内存回收操作也能造成ES进程失去响应。

脑裂现象的解决办法

  • 推测出原因应该是由于节点负载导致了master进程停止响应,继而导致了部分节点对于master的选择出现了分歧。为此,一个直观的解决方案便是将master节点与data节点分离。

可以用上面说到的配置来限制其角色:

node.master: true node.data: false 

其他节点设置,这样master节点和data节点就分开了

node.master: false node.data:  true
  • discovery.zen.ping_timeout(默认值是3秒,可以设置为120s):默认情况下,一个节点会认为,如果master节点在3秒之内没有应答,那么这个节点就是死掉了,而增加这个值,会增加节点等待响应的时间,从一定程度上会减少误判。

  • discovery.zen.minimum_master_nodes(默认是1):这个参数控制的是,一个节点需要看到的具有master节点资格的最小数量,然后才能在集群中做操作。官方的推荐值是(N/2)+1(向下取整),其中N是具有master资格的节点的数量。

原创粉丝点击