日志分析之输入分隔符m修饰符

来源：互联网发布：hadoop 数据存储目录编辑：程序博客网时间：2024/06/03 22:49

Perl默认的内部变量

$- 当前页可打印的行数,属于Perl格式系统的一部分
$! 根据上下文内容返回错误号或者错误串
$” 列表分隔符
$# 打印数字时默认的数字输出格式
$$ Perl解释器的进程ID
$% 当前输出通道的当前页号
$& 与上个格式匹配的字符串
$( 当前进程的组ID
$) 当前进程的有效组ID
$* 设置1表示处理多行格式.现在多以/s和/m修饰符取代之.
$, 当前输出字段分隔符
$. 上次阅读的文件的当前输入行号
$/ 当前输入记录分隔符,默认情况是新行
$: 字符设置,此后的字符串将被分开,以填充连续的字段.
$; 在仿真多维数组时使用的分隔符.
$? 返回上一个外部命令的状态
$@ Perl解释器从eval语句返回的错误消息
$[ 数组中第一个元素的索引号
$/ 当前输出记录的分隔符
$] Perl解释器的子版本号
$^ 当前通道最上面的页面输出格式名字
$^A 打印前用于保存格式化数据的变量
$^D调试标志的值
$^E在非UNIX环境中的操作系统扩展错误信息
$^F最大的文件捆述符数值
$^H由编译器激活的语法检查状态
$^I内置控制编辑器的值
$^L发送到输出通道的走纸换页符
$^M备用内存池的大小
$^O操作系统名
$^P指定当前调试值的内部变量
$^R正则表达式块的上次求值结果
$^S当前解释器状态
$^T从新世纪开始算起,脚步本以秒计算的开始运行的时间
$^W警告开关的当前值
$^X Perl二进制可执行代码的名字
$_ 默认的输入/输出和格式匹配空间
$| 控制对当前选择的输出文件句柄的缓冲
$~ 当前报告格式的名字
$` 在上个格式匹配信息前的字符串
$’ 在上个格式匹配信息后的字符串
$+ 与上个正则表达式搜索格式匹配的最后一个括号
$< 当前执行解释器的用户的真实ID
$<digits>含有与上个匹配正则表达式对应括号结果
$= 当前页面可打印行的数目
$> 当前进程的有效用户ID
包含正在执行的脚本的文件名
$ ARGV 从默认的文件句柄中读取时的当前文件名
%ENV 环境变量列表
%INC 通过do或require包含的文件列表
%SIG 信号列表及其处理方式
@_ 传给子程序的参数列表
@ARGV 传给脚本的命令行参数列表
@INC 在导入模块时需要搜索的目录列表

$/ 当前输入记录分隔符,默认情况是新行

用法：在读入一个文件时while<FILE>默认情况下是一行一行读的（即以/n作为输入记录分隔符）

面对如下需求时：

一个log文件

# Query_time: 0  Lock_time: 0  Rows_sent: 1  Rows_examined: 2
SELECT template
FROM mos_templates_menu
WHERE client_id='0' AND menuid='0';

# Query_time: 0  Lock_time: 0  Rows_sent: 0  Rows_examined: 0
DELETE FROM mos_session
WHERE (time < 1198124076);

# Query_time: 0  Lock_time: 0  Rows_sent: 1  Rows_examined: 285
SELECT count(*) FROM mos_stats_agents
WHERE agent='Mozilla 5.0' AND type='0';

# Query_time: 0  Lock_time: 0  Rows_sent: 0  Rows_examined: 0
UPDATE mos_stats_agents SET hits=(hits+1) WHERE agent='Mozilla 5.0' AND type='0';

# Query_time: 0  Lock_time: 0  Rows_sent: 1  Rows_examined: 285
SELECT count(*) FROM mos_stats_agents
WHERE agent='Unknown' AND type='1';

# Query_time: 0  Lock_time: 0  Rows_sent: 0  Rows_examined: 0
UPDATE mos_stats_agents SET hits=(hits+1) WHERE agent='Unknown' AND type='1';

# Query_time: 1  Lock_time: 0  Rows_sent: 1  Rows_examined: 285
SELECT count(*) FROM mos_stats_agents WHERE agent='com' AND type='2';

要求从log文件中选出Query_time:1的sql语句

以上log文件有如下特点：

比较整齐，每个sql间用空行分隔，或者以；分隔

日志分析要仔细观察日志的特点

用到两个关键知识点：

1.日志文件读取时不是按行，而是按照块读取，即while<FILE>得到的是一个多行文本块

2.模式匹配的/m /s修饰符的作用。

代码如下：

#! /usr/local/bin/perl

# 多行日志分析

use strict;

my $logFile = "/shvpn/test/wlj/perl/sqlLog.log";

open FILE, $logFile or die "cant open logfile $! /n";

$/ = ";"; # 更改默认的输入记录分隔符，或设置为$/ = “”:这样可以以单行或多行分隔

while (<FILE>) { # 每次读入一个多行文本块

if (/# Query_time: 1[^;]*;/s*/mig) { #以多行文本块进行模式匹配

print "$_ /n";

}

模式匹配修饰符/m/s 的作用：

m的作用是将字符串视作多行，这样^和$不仅匹配整个字符串的开头和结尾，也匹配所有换行符的前后

s的作用是让”.”匹配所有字符包括换行符

m的作用只影响^和$的匹配，s的作用只影响/n的匹配，所以两者可以混合使用

测试代码：

my $src = "it

thanks!";

#my $src = "it /n is /n ok /n thanks!/n";

if ($src =~ /k$/m || ($src =~ /s$/m || ($src =~ /!$/m || ($src =~ /t$/m) {

print "$src /n";

}

运行的结果都会打印出$src，因为/m修饰符将匹配所有的/n前后

但如果这样匹配：

my $src = "it

thanks!";

#my $src = "it /n is /n ok /n thanks!/n";

If ($src =~ /^i.*k$/sm || $src =~ /^i.*s$/sm) { # 要用.匹配所有的字符（包括换行符，#就必须用/x修饰符）

print "$src /n";

}