flume 自定义正则过滤器
来源:互联网 发布:知乎搜索引擎地址 编辑:程序博客网 时间:2024/06/16 15:34
本文实现:flume 读取日志信息时,通过正则匹配过滤,将匹配到的结果存放在指定文件目录。
本文结构:
1. 编写自定义过滤器
2. 编写flume配置文件
3. 运行测试
日志信息
过滤前:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
只是提取其中 以Parsing events:为开头关键字,以END为结尾的日志信息内容。
过滤后
- 1
1. 自定义过滤器
新建maven 项目,pom.xml 文件如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
新建自定义过滤器类MyInterceptor 继承Interceptor 类
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
1.3 打包
将此maven项目打成jar包,将jar 包放到flume的lib 目录下。
关于jar 包管理请看 flume自定义组件的 jar 包管理
2. 编写flume配置文件
在flume的conf 文件夹下新建exec.conf 配置文件内容如下:
- 1
- 2
- 3
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
3. 运行测试
在flume 的bin目录下执行启动命令
- 1
- 2
- 1
在监控目录下心间tail.log 文件,并放入过滤前的日志原信息,保存文件。到结果目录(/opt/apps/tmp)下查看生成的结果文件。查看过滤结果是否正确。
- 1
- 2
结果如下:
阅读全文
0 0
- flume 自定义正则过滤器
- flume 自定义正则过滤器
- flume 的官方正则过滤器
- 过滤器与自定义过滤器
- angular过滤器、自定义过滤器
- 自定义过滤器:
- 自定义过滤器
- 自定义过滤器
- 自定义过滤器
- 自定义过滤器
- flume的自定义配置
- flume自定义sink source
- flume自定义sink
- flume开发--自定义Sink
- flume 自定义拦截器
- flume 自定义开发HttpSink
- flume开发--自定义Sink
- flume自定义source
- 进程和线程的区别
- css的一些问题与细节
- unable to access jarfile 解决方法
- 一致逼近核(Universal Kernels)
- 常用的spring-data-jpa 规范
- flume 自定义正则过滤器
- 23种设计模式(3):抽象工厂模式
- Android软键盘将标题栏顶上去的解决办法
- 根据身份证号计算年龄、性别
- 算法与数据结构-Hash表的理解
- BZOJ 1072 [SCOI 2007] 状压DP 解题报告
- TYVJ 4864 天天去哪吃 || 清北学堂金秋杯大奖赛
- 23种设计模式(4):建造者模式
- Java知识:集合遍历的几种方法