文本处理

来源:互联网 发布:云计算提供什么服务 编辑:程序博客网 时间:2024/05/29 17:05

grep
正则表达式
扩展正则表达式

egrep

文件内容:less和cat
文件截取:head和tail
按列抽取:cut
按关键字抽取:grep


文件查看命令:cat, tac,rev
cat [OPTION]... [FILE]...
-E: 显示行结束符$
-n: 对显示出的每一行进行编号
-A:显示所有控制符
-b:非空行编号
-s:压缩连续的空行成一行

more: 分页查看文件
more [OPTIONS...] FILE...
-d: 显示翻页及退出提示
less:一页一页地查看文件或STDIN输出
查看时有用的命令包括:
/文本搜索文本
n/N跳到下一个或上一个匹配
less命令是man命令使用的分页器


cat sysctl.conf | head -n10   或  head -10写法    显示前10行

cat sysctl.conf | head -c 10  显示前10个字节


cat sysctl.conf | tail -n10   或  tail-10写法    显示后10行

cat sysctl.conf | tail -c 10  显示后10个字节

tail +2 sysctl.conf      从地2行开始显示到末尾

tail -f  sysctl.conf    实时跟踪sysctl.conf的动态


[root@localhost text]# cat test.txt 

No Name Mark Percent 

01  tom    69     91 

02   jack   71     87 

03   alex    68    98

[root@localhost text]# cut -f 1 test.txt     取列

No 

01

02

03

[root@localhost text]# cut -f 1,2 test.txt     取1和2列

No  name

01  tom

02  jack

03  alex




使用 -d 选项指定字段分隔符: 

[root@localhost text]# cat test2.txt 

No;Name;Mark;Percent 

01;tom;69;91 

02;jack;71;87 

03;alex;68;98 

[root@localhost text]# cut -f2 -d";" test2.txt 

Name 

tom 

jack

alex


示例 [root@localhost text]# cat test.txt 

abcdefghijklmnopqrstuvwxyz 

abcdefghijklmnopqrstuvwxyz 

abcdefghijklmnopqrstuvwxyz 

打印第1个到第3个字符: 

[root@localhost text]# cut -c1-3 test.txt 

abc 

abc 

abc

打印前2个字符:

[root@localhost text]# cut -c-2 test.txt

ab 

ab 

ab 

打印从第5个字符开始到结尾:

 [root@localhost text]# cut -c5- test.txt 

efghijklmnopqrstuvwxyz 

efghijklmnopqrstuvwxyz 

efghijklmnopqrstuvwxyz 


--------------------------------------------------------

paste 将多个文件合并队列

[root@CentOS6 app]#cat ff1
aa
aa
aa
aa
aa
[root@CentOS6 app]#cat ff2
bb
bb
bb
bb
bb
[root@CentOS6 app]#cat ff3
cc
cc
cc
cc
cc

[root@CentOS6 app]#paste ff1 ff2 ff3   
aa      bb      cc
aa      bb      cc
aa      bb      cc
aa      bb      cc
aa      bb      cc
[root@CentOS6 app]#paste -s ff1 ff2 ff3  
aa      aa      aa      aa      aa
bb      bb      bb      bb      bb
cc      cc      cc      cc      cc

--------------------------------------------------------------------------

wc统计

-l只计数行数
-w只计数单词总数
-c只计数字节总数
-m只计数字符总数
-L显示文件中最长行的长度


diff f1 f2   -u  >new.pacth 比较两个文件不同输出new.pacth

patch -b f1 new.pacth    为f1文件打补丁的同时备份f1原文件





原创粉丝点击