06文本处理工具

来源:互联网 发布:淘宝查号怎么查 编辑:程序博客网 时间:2024/06/05 06:37

shell脚本命令

1.diff
diff file file1 比较两个文件的不同
-c 显示周围的行
-u 按照一格式统一输出生成补丁
-r 比较两个目录中文件的不同

patch file file.path 打补丁
-b 备份原文件
这里写图片描述
2.grep
grep 关键字符 文件|目录 在文件或目录中查找含有关键字的行

grep -i 忽略大小写
-n 显示关键字所在行
-c 显示过滤结果的个数
-v 反向过滤
-E “关键字1|关键字2” 过滤多个关键字
-r 目录 在目录中查找含有关键字的文件
注意: ^关键字 以关键字开头
关键字$ 以关键字结尾
这里写图片描述
3.cut
cut 截取字符
cut -d 分隔符 指定分隔符
cut -f 1,7 显示指定的列
cut -c 1-4 显示指定的字符
这里写图片描述
4.sort 排序
sort
-n 纯数字排序
-u 去冗余
|uniq -c 去除冗余并统计冗余次数
-t 指定分隔符
-k 指定列
sort file |uniq -c 去除冗余并统计冗余次数
-d 显示冗余行
-u 显示唯一行
这里写图片描述
5.sed
sed ‘s/原字符/替换字符/g’ file
sed -e ‘策略1’ -e ‘策略2’ file
sed -i file 把转换后的内容输入到指定文件
sed ‘3,5s/原字符/替换字符/g’ 3-5行替换
sed xd 屏蔽指定行
sed xp 复制指定行
sed -n xp 只显示指
这里写图片描述
6.awk
awk最常用的工作一般是遍历一个文件中的每一行,然后分别对文件的每一行进行处理,一个完整的awk命令形式如下:

awk [options] ‘BEGIN{ commands } pattern{ commands } END{ commands }’ file

其中options表示awk的可选的命令行选项,其中最常用的恐怕是 -F 它指定将文件中每一行分隔成列的分隔符号。而紧接着后面的单引号里面的所有内容是awk的程序脚本,awk需要对文件每一行分割后的每一列做处理。file则是awk要处理的文件名称。让我们通过demo来体会awk的功能。
这里写图片描述

0 0
原创粉丝点击