python爬虫 根据关键字在新浪网站查询跟关键字有关的新闻条数(按照时间查询)
来源:互联网 发布:数据流程图,符号表示 编辑:程序博客网 时间:2024/05/17 08:54
# -*- coding: utf-8 -*-"""Created on Thu May 8 09:14:13 2014@author: lifeix"""import urllib2import refrom datetime import datetimedef craw1(keyword_name, startYear): a = keyword_name print a,"\t" today = datetime.today() ye = today.year mon = today.month for year in range(startYear,ye + 1): month = 13 if ye == year: month = mon for month in range(1,month): begintime = str(year) + "-" + "%02d"%month+"-01" endtime = str(year) + "-" + "%02d"%month+"-31" print begintime, endtime userMainUrl = "http://search.sina.com.cn/?time=custom&stime="+begintime+"&etime="+endtime+"&c=news&q="+a+"&sort=time&range=title" print userMainUrl req = urllib2.Request(userMainUrl) resp = urllib2.urlopen(req) respHtml = resp.read() urlpat = re.compile(r'<div class="l_v2">(.*?)</div>') match = urlpat.findall(respHtml) for numstr in match: searchnum = numstr[11:-2] print "searchnum=",searchnum craw1('大学',2014)
0 0
- python爬虫 根据关键字在新浪网站查询跟关键字有关的新闻条数(按照时间查询)
- python实现关键字查询
- 多线程新浪新闻搜索网络爬虫-基于关键字
- 关于Python爬虫之获取海量表情包+存入数据库+搭建网站通过关键字查询表情包
- 模糊查询的关键字
- 根据关键字查询oracle中所有表的记录
- 关键字查询
- 查询、关键字
- 根据关键字查询信息存储过程
- sql根据表关键字查询表名
- 爬虫实战(整站爬虫新浪新闻,并按照递归路径存储在本地)
- mysql按照时间查询
- mongodb按照时间查询
- mysql 按照时间查询
- MySQL 按照时间查询
- JDBC实现数据库的几种基本操作(查询,分页查询,根据关键字进行查询以及插入数据)
- 在linux中使用命令,根据文件名中的关键字查询文件,并按时间排序
- 在PHP中统计查询关键字的出现次数
- Tornado编译vxworks.bin镜像
- 【垃圾菜鸟笔记】ajax +用户注册小小实例
- Linux中cp和scp命令的使用
- Discuz!X3 修改在线人数在线会员以及统计数据的方法
- Unity3D研究院之与Android相互传递消息
- python爬虫 根据关键字在新浪网站查询跟关键字有关的新闻条数(按照时间查询)
- url汉字参数转化办法js代码
- 卫生纸的选购你了解多少?
- java--根据时间戳得到具体的时间
- 编译qte版本的qwt出错问题
- java JSP简介
- PHP 当前目录获取方法
- hashmap 排序
- 一些在线的工具