文件内容统计——Linux wc命令

来源:互联网 发布:网络彩票开售最新进展 编辑:程序博客网 时间:2024/05/16 13:06

文件内容统计——Linux wc命令 

标签: linux
 2152人阅读 评论(0) 收藏 举报
 分类:

有了该命令,就可以得到当前目录下所有符合条件的文件总数,如下:

find -type f | wc -l

wc--Linux()

这个命令的功能也很好记,因为它功能很有限:

wc-c filename:显示一个文件的字节数

wc-m filename:显示一个文件的字符数

wc-l filename:显示一个文件的行数

wc-L filename:显示一个文件中的最长行的长度

wc-w filename:显示一个文件的字数



[rocrocket@rocrocketprogramming]$ cat wc1.txt

12

345

你好

[rocrocket@rocrocketprogramming]$ wc -c wc1.txt

16wc1.txt 

[rocrocket@rocrocketprogramming]$ wc -m wc1.txt

12wc1.txt 

[rocrocket@rocrocketprogramming]$ wc -l wc1.txt

3wc1.txt 

[rocrocket@rocrocketprogramming]$ wc -L wc1.txt

4wc1.txt 

[rocrocket@rocrocketprogramming]$ wc -w wc1.txt

5wc1.txt


每行结尾的换行符也算一个字符,空格也算一个字符。



由于采用UTF-8编码,所以一个汉字在这里被转换为3字节,所以wc-c显示的结果是16,即“第一行的4个字节+第二行的5个字节+第三行的7个字节”=4+5+7=16

而当使用-m选项时,一个汉字就作为一个字符计算,所以是4+5+3=12

当使用-L时,是给出最长行的长度,第二行最长,有4个字符长。(显然是不把换行符计算在内)



使用-w是计算字数,一个字是一个word,所以“34”表示一个word一个“你好”表示一个word(我试过了,当中文是连在一起的,不管多少个,在计算字数word时,只有一个),因此2+2+1=5



插孔说说tab制表符,这个符号比较特殊,当使用-L时,制表符算7个字符(这要依据一个制表符的长度而定,在我的系统中一个制表符算7个空格长度)。而当使用-w时,制表符和空格没有两样,都作为字的间隔来看待。当用-c时,一个制表符也就算一个字符,因为它的确就只是一个字符而已。

如果你直接执行wcwc1.txt,则显示:

[rocrocket@rocrocketprogramming]$ wc wc1.txt 3  5 16 wc1.txt

输出信息依次是:行数 字数字节数 文件名称。

0 0
原创粉丝点击