文本处理命令

来源:互联网 发布:python自然语言分析 编辑:程序博客网 时间:2024/06/02 04:17

1.diff

diff file file1 比较两个文件的不同
-c 显示周围的行
-u 按照一格式统一输出生成补丁
-r 比较两个目录中文件的不同
这里写图片描述
patch file file.path ##打补丁
-b ##备份原文件
使用补丁时,如果系统内没有,需要使用yum命令手动安装
这里写图片描述
使用方式如下
这里写图片描述

2.grep

grep 关键字符 文件|目录 ##在文件或目录中查找含有关键字的行

grep -i ##忽略大小写
-n ##显示关键字所在行
-c ##显示过滤结果的个数
-v ##反向过滤
-E “关键字1|关键字2” ##过滤多个关键字
-r 目录 ##在目录中查找含有关键字的文件
注意: ^关键字 ##以关键字开头
关键字$ ##以关键字结尾
测试如下,/mnt下的test文件编辑如下
这里写图片描述
我们使用grep命令对test文件中的文本内容匹配如下
这里写图片描述
把句首和句尾的test匹配可以进行如下操作
这里写图片描述

3.cut

cut ##截取字符
cut -d 分隔符 ##指定分隔符
cut -f 1,7 ##显示指定的列
cut -c 1-4 ##显示指定的字符
这里写图片描述

4.sort 排序

sort
-n ##纯数字排序
-u ##去冗余
|uniq -c ##去除冗余并统计冗余次数
-t ##指定分隔符
-k ##指定列
number文件中编辑如下,我们将进行接下来的操作
这里写图片描述
使用sort命令后,-n为纯数字排序,无则按照首个数字排序
这里写图片描述
反向排序
这里写图片描述
修改number为如下
这里写图片描述
使用sort按列排序,结果如下
这里写图片描述

5.uniq

sort file |uniq -c ##去除冗余并统计冗余次数
-d ##显示冗余行
-u ##显示唯一行
这里写图片描述

6.sed

sed ‘s/原字符/替换字符/g’ file
sed -e ‘策略1’ -e ‘策略2’ file
sed -i file ##把转换后的内容输入到指定文件
sed ‘3,5s/原字符/替换字符/g’ ##3-5行替换
sed xd ##屏蔽指定行
sed xp ##复制指定行
sed -n xp ##只显示指行
这里写图片描述

这里写图片描述
也可以通过文件的形式来替换
这里写图片描述

0 0