第六 文本处理工具

来源:互联网 发布:阿里云大数据平台 sql 编辑:程序博客网 时间:2024/05/29 14:01
 文本处理工具


diff
diff         file file1        ##比较两个文件的不同
    -c                ##显示上下文周围的行
    -u                ##按照一格式统一输出生成补丁

    -r                ##递归式比较两个目录中文件的不同



patch        file    file.path    ##生成补丁

    -b                ##备份原文件


grep

grep    关键字符    文件|目录    ##在文件或目录中查找含有关键字的行

grep    -i            ##执行忽略大小写搜索
    -n            ##显示关键字所在行的行号
    -c            ##显示过滤结果的行的计数
    -v            ##反向过滤
    -E  "关键字1|关键字2"    ##过滤多个关键字
    -r    目录        ##在目录中查找含有关键字的文件
注意:    ^关键字            ##以关键字开头

    关键字$            ##以关键字结尾





字符
cut -d    分隔符            ##指定分隔符
cut -f 1,7            ##显示指定的列
cut -c 1-4            ##显示指定的字符




sort            ##排序                                                                         

sort
    -n            ##纯数字排序
    -u            ##去重复
    -t            ##指定分隔符
    -k            ##指定列


uniq

sort file |uniq -c        ##去除重复并统计重复次数
        -d        ##显示重复行

        -u        ##显示唯一行



sed
sed 's/原字符/替换字符/g' file     ##替换字符
sed -e '策略1' -e '策略2' file    ##替换多个字符
sed -i  file            ##把转换后的内容输入到指定文件
sed '3,5s/原字符/替换字符/g'    ##3-5行替换
sed xd                ##屏蔽指定行
sed xp                ##复制指定行

sed -n xp            ##只显示指定行



awk
cut                 ##截取
0 0