Flume --文件通道(file channel)

来源:互联网 发布:千岛湖 蓝色天使 知乎 编辑:程序博客网 时间:2024/05/16 17:18
文件通道是Flume的持久通道。它将所有事件写入磁盘,因此不会丢失进程或机器关机或崩溃的数据。文件通道可确保任何提交到通道的事件只有在接收到事件并提交事务时才会从通道中删除,即使机器或代理程序崩溃并重新启动。它被设计为高度并发,同时处理多个source和sink。
     文件通道设计用于需要数据持久性和不能容忍数据丢失的情况。由于通道将数据写入磁盘,因此不会在数据崩溃或失败时丢失数据。由于将数据写入磁盘的事实,额外的一个好处是,该通道可以具有非常大的容量,特别是与内存通道相比。
     只要磁盘空间可用,文件通道可以具有极大的容量,高达数十或数亿的事件。这是非常有用的,当预期从渠道获取的汇款将无法跟上有限的高峰期,并且大量积压的事件是可能的。如果配置正确,文件通道也可以处理更长的下游停机时间。由于通道在事件提交后不会将内存保留在内存中,因此与等效容量的内存通道相比,占用的空间要少得多。
文件通道保证写入的每个事件将通过代理和机器故障或重新启动而可用。它通过写出将通道放入磁盘的每个事件来实现。一旦提交了一个事务,该事务中的事件就可用于执行。这些事件从磁盘读取,并在从通道获取时传递给接收器,并且完全取消引用,并在提交交易事件后有资格删除。
     文件通道允许用户通过将其安装在不同的安装点上来配置多个磁盘的使用。当配置为使用多个磁盘时,通道在磁盘之间循环,从而允许通道在更多磁盘可用时执行得更好。建议(尽管不需要)为文件通道检查点使用单独的磁盘。检查点反映了检查点写出时刻的通道的确切状态。文件通道使用检查点快速重新启动,而不必读取所有数据文件。它在运行时会将检查点写入磁盘。在重新启动时,通道加载最后一个写出的检查点,仅重放放样,并在该检查点之后进行,并允许通道快速启动并准备好进行正常操作。默认情况下,两个连续检查点之间的间隔设置为30秒,尽管它是可配置的。
文件通道允许用户传递几个配置参数,使他们可以根据硬件微调通道的性能。文件通道的配置参数如表所示。



2.文件通道
数据写入到磁盘,可靠性,速率低。容灾.
                a1.sources = r1a1.channels = c1a1.sinks = k1a1.sources.r1.type=seqa1.sources.r1.totalEvents=10000a1.channels.c1.type = filea1.channels.c1.checkpointDir = /home/centos/flume/chka1.channels.c1.dataDirs = /home/centos/flume/dataa1.sinks.k1.type=loggera1.sources.r1.channels=c1a1.sinks.k1.channel=c1

原创粉丝点击