一个使用命令处理文件的例子
来源:互联网 发布:seo诊断zhangzifan 编辑:程序博客网 时间:2024/05/06 18:01
对于含有以下内容的文件visited_url.db
http://www.csdn.nethttp://www.csdn.net/bloghttp://www.csdn.net/blog/201312http://www.csdn.net/infohttp://www.csdn.net/apphttp://www.csdn.net/infohttp://www.csdn.nethttp://www.csdn.net/app/2131http://www.youku.com/news/1http://www.youku.com/news/2http://www.youku.com/news/3http://www.youku.com/newshttp://www.youku.com/newshttp://www.csdn.net
1.去除重复url,使重复的url只显示一次,然后输出到标准输出
具体命令如下:
john@john-IdeaPad:~/c_workspace$ cat visited_url.db | sort | uniq http://www.csdn.nethttp://www.csdn.net/apphttp://www.csdn.net/app/2131http://www.csdn.net/bloghttp://www.csdn.net/blog/201312http://www.csdn.net/infohttp://www.youku.com/newshttp://www.youku.com/news/1http://www.youku.com/news/2http://www.youku.com/news/3
2.去除重复的url,使重复的url只显示一次并统计url出现的次数,然后输出到标准输出
使用uniq 的--count参数即可
john@john-IdeaPad:~/c_workspace$ cat visited_url.db | sort | uniq -c 3 http://www.csdn.net 1 http://www.csdn.net/app 1 http://www.csdn.net/app/2131 1 http://www.csdn.net/blog 1 http://www.csdn.net/blog/201312 2 http://www.csdn.net/info 2 http://www.youku.com/news 1 http://www.youku.com/news/1 1 http://www.youku.com/news/2 1 http://www.youku.com/news/3
3.只显示不重复的url,输出到标准输出
uniq -u
john@john-IdeaPad:~/c_workspace$ cat visited_url.db | sort | uniq -uhttp://www.csdn.net/apphttp://www.csdn.net/app/2131http://www.csdn.net/bloghttp://www.csdn.net/blog/201312http://www.youku.com/news/1http://www.youku.com/news/2http://www.youku.com/news/3
4.之显示重复的url,并统计出现次数并输出到标准输出
uniq -d
john@john-IdeaPad:~/c_workspace$ cat visited_url.db | sort | uniq -dhttp://www.csdn.nethttp://www.csdn.net/infohttp://www.youku.com/news
5.获取url中的域名部分,去除重复并统计出现次数
结合awk、sort、uniq
john@john-IdeaPad:~/c_workspace$ cat visited_url.db | awk -F'[/:]' '{print $4}' | sort | uniq -c 9 www.csdn.net 5 www.youku.com
- 一个使用命令处理文件的例子
- PyPDF2处理pdf文件的一个例子
- IO操作的一个例子(copy文件的命令)
- Yii上传文件(头像)的一个例子(后端处理)
- strace命令的一个例子
- abap-文件处理的例子
- 使用XmlSerializer创建xml文件的一个例子
- 使用CURL上传文件curl_formadd的一个例子
- 一个使用jspSmartUpload控件上传文件的例子
- 一个文件搜索(使用正则)的例子
- 一个使用DownloadManager下载文件的小例子
- 一个inf文件的例子
- 文件读写的一个例子
- struts异常的处理的一个例子
- 一个数组使用的例子
- SAOP使用的一个例子
- 使用paste的一个例子
- Boolean 使用的一个例子
- gcc 参数详解
- UVA 10905 (13.11.06)
- uniq命令
- POJ2352 简单树状数组 附加输入挂
- AsyncTask异常处理
- 一个使用命令处理文件的例子
- day 5
- Java中如何遍历Hashtable
- Anagrams 变位词 @LeetCode
- The terminal server has exceeded the maximum number of allowed connections
- 异常处理
- 新站快速排名的优化技巧
- Pow(x, n) 指数 @LeetCode
- 栈的概念及实现