一句shell命令搞定代码行数统计

来源：互联网发布：牛聪聪知乎编辑：程序博客网时间：2024/05/21 06:46

语法：wc [选项] 文件…

说明：该命令统计给定文件中的字节数、字数、行数。如果没有给出文件名，则从标准输入读取。wc同时也给出所有指定文件的总统计数。字是由空格字符区分开的最大字符串。

该命令各选项含义如下：

　　- c 统计字节数。

　　- l 统计行数。

　　- w 统计字数。

这些选项可以组合使用。

输出列的顺序和数目不受选项的顺序和数目的影响。

总是按下述顺序显示并且每项最多一列。

行数、字数、字节数、文件名

如果命令行中没有文件名，则输出中不出现文件名。

例如：

$ wc - lcw file1 file2 4 33 file1 7 52 file2 11 11 85 total

举例分析：

1.统计demo目录下，js文件数量：

find demo/ -name "*.js" |wc -l

2.统计demo目录下所有js文件代码行数：

find demo/ -name "*.js" |xargs cat|wc -l 或 wc -l `find ./ -name "*.js"`|tail -n1

3.统计demo目录下所有js文件代码行数，过滤了空行：

find /demo -name "*.js" |xargs cat|grep -v ^$|wc -l

今天面试时，突然被面试官问到怎样用shell命令搞定某个文件夹下java代码行数的统计。

想了一下，基本思路就是找到这个文件夹下面的所有java文件，然后每个文件统计一下代码，外层套个for循环，叠加一下结果，就拿到想要的结果了。

不过显然面试官希望我用一句shell搞定，当场晕菜了，没搞定。回来想了一下，其实确实不是啥太难的问题。

最粗略版

Shell代码  
find . -name "*.java"|xargs wc -l|grep "total"|awk '{print $1}'  
find . -name "*.java"|xargs cat|wc -l    #Output:37634  

上面的两句效果一样，只不过第二种是先利用cat将多个java文件的内容合并输出了。然后再统计。

不过两个都有共同的毛病——连文件里面的空行都给统计进去算作一行了。

去除空行版

Shell代码  
find . -name "*.java"|xargs cat|grep -v ^$|wc -l    #Output:36335  

这个版本靠谱一些了，可以看到去掉空行之后的统计结果变为了：36335，比上个版本干掉了1299行的空行。。。

但是，java代码还有注释呢啊？！Fuck，还得干掉注释！

去除注释版

Shell代码  
# exclude the lines begin with //  
find . -name "*.java"|xargs cat|grep -v -e ^$ -e ^\s*\/\/.*$|wc -l    #Output:36064  

好，这个方法发现，以//开头的注释有36335-36064=271行。这里需要注意的是，注释行未必就以//作为开头，可能N个空格之后才开始的的//，所以匹配时需要加上上面的^\s*放在开头。

大功告成啦？扯淡！！！

java里面注释好几种风格，再给你看看这个非常常见的注释，还是会在统计结果里面

Java代码  
/** 
 * @author xxx 2012-6-15 下午3:19:47 
 */  

咋搞？这种注释我还真没想好怎么方便的除去，简单粗暴的方法但是可以在上面grep的参数里面再加入3个正则，分别去除以/**、*、*/开头的行。不过我自己想着都觉得挫。不知道有没有更好的办法了。

原文链接：

http://www.cnblogs.com/fullhouse/archive/2011/07/17/2108786.html

http://hittyt.iteye.com/blog/1700584

0 0