perl并行处理大文件
来源:互联网 发布:3m金融互助平台源码 编辑:程序博客网 时间:2024/05/18 13:46
有时候会需要对大文件进行并行处理.
对于文本文件,需要保证行的完整性.
一种是快速跳过不需要的行
#!/bin/env perluse strict;my $m=$ARGV[0]; #分成m份my $l=$ARGV[1]; #第l份my $file="test1.txt";#my $line=`wc -l $file`;#my ($linenum)=$line=~/(\d+)/;my $linenum=10;my $n=int($linenum/$m); #每份做n行open( READ, "<$file" );my $i=0;while (<READ>) { #print $i; if ($i>=($l-1)*$n){ &doit(); } $i++; last if ($i>=$l*$n || $i>linenum)}sub doit(){ print $_;}close READ;
改进一些的方法是使用seek,但是需要处理不完整行,可以让前一个进程多处理一行,后一个进程少处理一行
#!/bin/env perluse strict;my $m=$ARGV[0]; #分成m份my $l=$ARGV[1]; #第l份my $file="test1.txt";my @args = stat ($file);my $size = $args[7];my $n=int($size/$m); #每份做nbytesopen( READ, "<$file" );seek READ,(($l-1)*$n),0; #非第一份,少读第一行 if($l>1){ my $tmpline = <READ>; } while (<READ>) { &doit(); my $position = tell(READ); last if ($position> $l*$n || $position>=$size); #多读一行 }sub doit(){ print $_;}close READ;
- perl并行处理大文件
- perl处理大容量文件
- 如何提高perl处理大文件的效率
- Perl 处理excel文件
- Perl处理Excel文件
- perl 文件处理
- Perl处理Excel文件
- perl批量处理文件
- CSV 文件处理 PERL
- awk之文件并行处理
- Java 多线程并行处理大文件( 淘宝2012校招技术笔试题 )
- perl如何处理INI文件
- perl文件编码处理问题
- perl处理properties文件[转]
- perl 6 批量处理文件
- 大数据并行处理框架介绍
- (转)lzo文件的并行map处理
- hadoop lzo文件的并行map处理
- openssl 1.0.0编译
- Linux系统邮件服务器的搭建过程解析
- Unity3D地形挖坑
- malloc calloc realloc
- javascripte中的true和false
- perl并行处理大文件
- floyd算法
- 6410触摸屏无法进入校验
- Libjingle和各协议的关系 P2P的原理
- 输入密码时显示*并且退格可以删除密码
- ubuntu 12 中文输入法安装使用以及一些问题
- V4L
- oracle游标使用大全
- hdu3473