python读网页解析内容写入文件
来源:互联网 发布:网络打印机安装步骤 编辑:程序博客网 时间:2024/05/21 15:45
快速入门 http://developer.51cto.com/art/201207/347006.htm
注意编译指令有一处错误
python -O -m py_compile hello.py
工程发布
http://blog.csdn.net/u011465933/article/details/9567375
下面是相关代码
import sysimport urllibimport randomimport timedef GetNowTime(): return time.strftime("%Y-%m-%d %H:%M:%S",time.localtime(time.time()))def GetDayTime(): return time.strftime("%Y-%m-%d",time.localtime(time.time()))def WriteFile(ip, dat):strCurTime = GetDayTime()output = open(strCurTime + "_" + ip, 'a+')output.writelines(dat)output.close()def GetHtml(url):response=urllib.urlopen(url)html = response.read()return htmldevIp = raw_input("ip: ") print devIpbaseUrl = 'http://' + devIp + '/goform/formIPQAM?type=3&cmd=1&language=1&gbeNo=0&ran='while True:url = baseUrl + str(random.uniform(0, 1)) + '&rowIndex=0'html = GetHtml(url);arrTsk = html.split('<*1*>')nIndx = len(arrTsk) - 1totalTskNum = 0if nIndx > 0:strTail = arrTsk[-1]strTail = strTail.split('<*2*>')strTail = strTail[-1]strTail = strTail.split('<')strTail = strTail[0]totalTskNum = int(strTail)WriteFile(devIp, "*****" + GetNowTime() + "****" + str(totalTskNum) + "********************\n")if nIndx > 0:WriteFile(devIp, html)while totalTskNum > nIndx:url = baseUrl + str(random.uniform(0, 1)) + '&rowIndex=' + str(nIndx)html = GetHtml(url)WriteFile(devIp, html)nIndx += 16print totalTskNumWriteFile(devIp, "*****end****************************************\n")time.sleep(3600)
0 0
- python读网页解析内容写入文件
- 使用python解析网页内容
- 【Python小工具】Python实现批量解析PDF文件提取内容并写入到Excel中
- python 打开文件,写入文件,关闭文件,读文件,清空文件内容
- python多线程抓取网页内容并写入MYSQL
- 网页内容写入word文档
- 将网页内容写入本地
- python中 .write 无法向文件写入内容
- Python中用print方法向文件中写入内容
- 输入文件名-创建文件-写入内容(Python)
- 用Python将较大内容写入文件的注意事项
- 读取写入文件内容
- 文件定位写入内容
- qt写入文件内容
- Python脚本解析BitTorrent种子文件内容
- python 实现文件打开读取内容然后写入更新内容(文件只打开一次)
- python解析网页中javascript动态添加的内容 一
- python解析网页中javascript动态添加的内容
- iOS文字实现超链接
- Linux电源管理(2)_Generic PM之基本概念和软件架构
- Java使用Axis2调用Web services接口(二)
- 拟工作todo
- 从今天开始把博客替代笔记吧
- python读网页解析内容写入文件
- 简单实用的加密解密算法
- MyBatis入门学习
- HDU2089 不要62(数位DP)
- 第 5 章 CSS 格式化排版
- Golang实现排序算法之冒泡排序
- Nginx+Lua开发入门
- OpenWrt 自学笔记(2)------交叉编译链配置
- 欢迎使用CSDN-markdown编辑器