shell 抓取网页解析网页 自动读取poj测试数据——V2生成 pku poj acm编程模版

来源:互联网 发布:特锐德网络 编辑:程序博客网 时间:2024/05/22 16:00
#!/bin/bash##################################Copyright:free#Author:wangkai#Date:2013-10-13#Description:从poj抓取网页,将网页中的输入数据自动#保存到题号开头的文件中。网页特点是http://poj.org/problem?id=1001#1001表示题号#shell抓取网页,解析内容,允许测试环境ubuntu 12.04#传入的第一个参数为题号#################################send=`date '+%Y-%m-%d %H:%M:%S'`i=$1; #传入的第一个参数为题号id=$i;dir='Dropbox/#acm_linux/poj_code/data/'dircode='Dropbox/#acm_linux/poj_code/'if [ ! -d "$dir" ]; then      mkdir $dirfitouch ${dir}file_htmlcppname=${dircode}poj_${id}.cppif [ ! -d "$cppname" ]; thentouch $cppname;echo '/************************************************#Copyright:free#Author:wangkai#Date:2013-10-13#Description:从poj抓取网页,将网页中的输入数据自动#FileName:poj_'${id}'.cpp#Date:'${send}'************************************************/int main(){    freopen("poj_'${id}'.cpp","r",stdin)    return 1;}'>$cppnamefi#for((i=1010;i<=1020;i++));dofile_loc=${dir}${i};pre_html='http://poj.org/problem?id=';html=${pre_html}${id}wget $html -O ${dir}/file_htmlFILE_CONTENT=`cat ${dir}/file_html`FILE_CONTENT=${FILE_CONTENT#*<p class=\"pst\">Sample Input</p><pre class=\"sio\">} # 去除前缀FILE_CONTENT=${FILE_CONTENT%%</pre><p class=\"pst\">Sample Output</p><pre class=\"sio\">*} # 去除后缀echo $FILE_CONTENT >$file_loc# dos2unix $id # 出现则安装dos2unix使用此命令进行转化#done

更多关于我的信息请访问http://www.linkedin.com/in/wangkaikai





原创粉丝点击