日志分析之输入分隔符m修饰符

来源:互联网 发布:hadoop 数据存储目录 编辑:程序博客网 时间:2024/06/03 22:49

Perl默认的内部变量

$- 当前页可打印的行数,属于Perl格式系统的一部分
$!
根据上下文内容返回错误号或者错误串
$”
列表分隔符
$#
打印数字时默认的数字输出格式
$$ Perl
解释器的进程ID
$%
当前输出通道的当前页号
$&
与上个格式匹配的字符串
$(
当前进程的组ID
$)
当前进程的有效组ID
$*
设置1表示处理多行格式.现在多以/s/m修饰符取代之.
$,
当前输出字段分隔符
$.
上次阅读的文件的当前输入行号
$/
当前输入记录分隔符,默认情况是新行
$:
字符设置,此后的字符串将被分开,以填充连续的字段.
$;
在仿真多维数组时使用的分隔符.
$?
返回上一个外部命令的状态
$@ Perl
解释器从eval语句返回的错误消息
$[
数组中第一个元素的索引号
$/
当前输出记录的分隔符
$] Perl
解释器的子版本号
$^
当前通道最上面的页面输出格式名字
$^A
打印前用于保存格式化数据的变量
$^D
调试标志的值
$^E
在非UNIX环境中的操作系统扩展错误信息
$^F
最大的文件捆述符数值
$^H
由编译器激活的语法检查状态
$^I
内置控制编辑器的值
$^L
发送到输出通道的走纸换页符
$^M
备用内存池的大小
$^O
操作系统名
$^P
指定当前调试值的内部变量
$^R
正则表达式块的上次求值结果
$^S
当前解释器状态
$^T
从新世纪开始算起,脚步本以秒计算的开始运行的时间
$^W
警告开关的当前值
$^X Perl
二进制可执行代码的名字
$_
默认的输入/输出和格式匹配空间
$|
控制对当前选择的输出文件句柄的缓冲
$~
当前报告格式的名字
$`
在上个格式匹配信息前的字符串
$’
在上个格式匹配信息后的字符串
$+
与上个正则表达式搜索格式匹配的最后一个括号
$<
当前执行解释器的用户的真实ID
$<digits>
含有与上个匹配正则表达式对应括号结果
$=
当前页面可打印行的数目
$>
当前进程的有效用户ID
包含正在执行的脚本的文件名
$ ARGV
从默认的文件句柄中读取时的当前文件名
%ENV
环境变量列表
%INC
通过dorequire包含的文件列表
%SIG
信号列表及其处理方式
@_
传给子程序的参数列表
@ARGV
传给脚本的命令行参数列表
@INC
在导入模块时需要搜索的目录列表

 

 

$/ 当前输入记录分隔符,默认情况是新行

用法:在读入一个文件时while<FILE>默认情况下是一行一行读的(即以/n作为输入记录分隔符)

面对如下需求时:

一个log文件

# Query_time: 0  Lock_time: 0  Rows_sent: 1  Rows_examined: 2
SELECT template
FROM mos_templates_menu
WHERE client_id='0' AND menuid='0';

# Query_time: 0  Lock_time: 0  Rows_sent: 0  Rows_examined: 0
DELETE FROM mos_session
WHERE (time < 1198124076);

# Query_time: 0  Lock_time: 0  Rows_sent: 1  Rows_examined: 285
SELECT count(*) FROM mos_stats_agents
WHERE agent='Mozilla 5.0' AND type='0';

# Query_time: 0  Lock_time: 0  Rows_sent: 0  Rows_examined: 0
UPDATE mos_stats_agents SET hits=(hits+1) WHERE agent='Mozilla 5.0' AND type='0';

# Query_time: 0  Lock_time: 0  Rows_sent: 1  Rows_examined: 285
SELECT count(*) FROM mos_stats_agents
WHERE agent='Unknown' AND type='1';

# Query_time: 0  Lock_time: 0  Rows_sent: 0  Rows_examined: 0
UPDATE mos_stats_agents SET hits=(hits+1) WHERE agent='Unknown' AND type='1';


# Query_time: 1  Lock_time: 0  Rows_sent: 1  Rows_examined: 285
SELECT count(*) FROM mos_stats_agents WHERE agent='com' AND type='2';

 

要求从log文件中选出Query_time:1sql语句

以上log文件有如下特点:

比较整齐,每个sql间用空行分隔,或者以;分隔

日志分析要仔细观察日志的特点 

用到两个关键知识点:

1.日志文件读取时不是按行,而是按照块读取,即while<FILE>得到的是一个多行文本块

2.模式匹配的/m /s修饰符的作用。

 

代码如下:

#! /usr/local/bin/perl

#

# 多行日志分析

 

use strict;

 

my $logFile = "/shvpn/test/wlj/perl/sqlLog.log";

 

open FILE, $logFile or die "cant open logfile $! /n";

 

$/ = ";";  # 更改默认的输入记录分隔符,或设置为$/ = “”:这样可以以单行或多行分隔

 

while (<FILE>) { # 每次读入一个多行文本块

      if (/# Query_time: 1[^;]*;/s*/mig) { #以多行文本块进行模式匹配

           print "$_ /n";

      }

}

 

模式匹配修饰符/m/s 的作用:

m的作用是将字符串视作多行,这样^$不仅匹配整个字符串的开头和结尾,也匹配所有换行符的前后

s的作用是让.”匹配所有字符包括换行符

m的作用只影响^$的匹配,s的作用只影响/n的匹配,所以两者可以混合使用

测试代码:

my $src = "it

                                  is

                                  ok

                                  thanks!";

#my $src = "it /n is /n ok /n thanks!/n";

if ($src =~ /k$/m || ($src =~ /s$/m || ($src =~ /!$/m || ($src =~ /t$/m) {

      print "$src /n";

}

运行的结果都会打印出$src,因为/m修饰符将匹配所有的/n前后

 

但如果这样匹配:

my $src = "it

                                  is

                                  ok

                                  thanks!";

#my $src = "it /n is /n ok /n thanks!/n";

If ($src =~ /^i.*k$/sm || $src =~ /^i.*s$/sm) { # 要用.匹配所有的字符(包括换行符,#就必须用/x修饰符)

print "$src /n";

}

 

 
原创粉丝点击