gawk 随机抽取文本文件的若干百分比的数据

来源:互联网 发布:美容整形软件 编辑:程序博客网 时间:2024/05/17 22:24
例如, 抽取5%的样本
gawk '{if(rand()<0.05){print }}' text_file.txt > text_file_out.txt


其中rand()是gawk的一个随机数生成程序, 具体的可见其manpage