linux下打乱文本行序、文本分割与文本合并
来源:互联网 发布:unity3d 人物移动跳跃 编辑:程序博客网 时间:2024/06/02 02:30
一、打乱文本行序
linux下,将train.txt按行打乱,每行内容则保持不变,直接将输出写入新的文本train_rand.txt,命令:
- sudo awk 'BEGIN{ 100000*srand();}{ printf "%s %s\n", rand(), $0}' train.txt |sort -k1n | awk '{gsub($1FS,""); print $0}' > train_rand.txt
srand(); rand()在awk内获取随机数
gsub替换文本
二、文本分割
将一个大文本拆分为几个小文本可以用命令split:
split -l n 原始文件 拆分后文件名前缀
最后一个文件的行数没有n行则以剩余行数进行分配,比如有一个名为train.txt的文件,公有210行,进行拆分:
拆分后会生成三个文本,最后一个文本仅有10行
- split -l 100 train.txt train_split
三、文本合并
将几个文本train_1.txt train_2.txt train_3.txt合并为一个 train.txt可以用命令:
- cat train_1.txt train_2.txt train_3.txt > train.txt
阅读全文
0 0
- linux下打乱文本行序、文本分割与文本合并
- linux 文本排序、合并和分割 -转
- linux 文本分割命令
- 分割文本
- AWK 将文本按行打乱顺序
- FinalTXT文本合并整理分割搜索加强
- #Linux Shell 脚本编程(10)—文本过滤(合并与分割—sort、uniq、join、cut、paste、split)
- 文本
- 文本
- 文本
- 文本
- 文本
- 文本
- 文本
- 文本
- 文本
- 文本
- linux 下的文本处理之“行分割”——cut命令
- 面向对象程序设计上机练习一(函数重载)
- python3 使用pyaudio OSError: [Errno -9996] Invalid input device (no default output device)-ubuntu16.04
- Win7,Win8,Win10 UAC绕行方法
- ubuntu14.04命令大全
- offer
- linux下打乱文本行序、文本分割与文本合并
- Google benchmark:一个简单易用的C++ benchmark库
- js—列表的使用
- Map集合排序
- 教你如何迅速秒杀掉:99%的海量数据处理面试题 本文经过大量细致的优化后,收录于我的新书《编程之法》第六章中,新书目前已上架京东/当当/亚马逊 作者:July 出处:结构之法算法之道b
- java.lang.NoClassDefFoundError
- List,Set,Map遍历时删除元素
- springboot jar包 无法访问jsp
- TensorFlow下网络模型的存储与加载