量刑辅助系统项目(1)——python删选文件
来源:互联网 发布:轰炸商务印书馆知乎 编辑:程序博客网 时间:2024/04/29 21:10
项目介绍:
对给定的1469900个xml的刑事案件文件进行删选,找出其中道路交通类型的刑事案件。例如根据文件内容<QSZAY nameCN="起诉主案由" value="交通肇事罪">找到指定文件,删除其余文件。因为文件数量过于庞大,文件夹有53G,用python脚本筛选。
一、拆分文件夹
由于文件太多,打开文件夹时文件加载太慢,需要二十分钟,.py文件运行时无法读取xml文件。只能把这53G的文件夹拆分成2G的多个文件夹,手动拆分也不现实,用shell脚本来实现。
1、在文件夹里创建shell脚本 :
$vim make_dir.sh然后写入: for ((i=1;i<26;i++)); do `mkdir t$i` done保存退出,修改脚本权限:$chmod 777 make_dir.sh然后运行脚本,创建25个文件夹:$./make_dir.sh
2、继续创建脚本:
$vim mvfile.sh然后写入:for((i=0;i<1469900;i++)); do ((dir=i/58795+1)) dir=t$dir `mv $i.xml $dir` done
保存退出,修改权限:
$chmod 777 mvfile.sh
运行脚本,实现把这一百多万文件分别转移到这25个文件夹里,这个过程运行了四十多分钟。
$./mvfile.shpython代码如下:
阅读全文
0 0
- 量刑辅助系统项目(1)——python删选文件
- CFileDialog 多选文件
- 武汉大学教授开发电脑辅助量刑软件
- 承志医院管理系统项目解析 门诊医生工作站—辅助检查项目(六)
- CFileDialog多选文件问题
- JS计算input-file所选文件大小(一个或多个)
- 让CFileDialog可以多选文件
- 获取GetOpenFileName多选文件名
- 获取GetOpenFileName多选文件名
- 打开文件对话框选文件或者目录
- 项目2辅助学习1(修改)
- 雕塑系统和辅助项目管理系统
- 疯狂猜歌实现(4)—— 实现文字待选框与已选文字框布局
- 疯狂猜歌实现(5)—— 实现待选文字框动画以及点击事件
- 疯狂猜歌实现(6)—— 生成待选文字框随机文字以及动态生成已选框
- 项目2辅助学习1
- 件项目管理系统-功能模块
- 学习Java6(七)Desktop(5)打印所选文件
- Python中正则表达式的匹配规则
- 一个例子说明好的架构是怎样一步一步演变出来
- 李炎恢php视频教程
- Java中阻塞队列的几种实现方式
- netty源码分析之-ServerBootstrap启动流程分析(3)
- 量刑辅助系统项目(1)——python删选文件
- 关于JavaTamcat的配置
- hibernate使用session操作数据库
- 橘子洲游记
- gdi+图像裁剪
- 大端 小端模式
- linux下删除包含特殊符号的文件或目录
- 坚持#第207天~慕课网的云计算了解完了,接下来是腾讯课堂
- SRAM和SDRAM的区别