第一只虫子
来源:互联网 发布:录制手机屏幕的软件 编辑:程序博客网 时间:2024/04/28 15:04
#很久打算看python了,一直懒着,终于暑假有时间了,
#闲话少说,言归正传。
#这是针对http://www.jikexueyuan.com/course/821_2.html?ss=1此网页的某些tag做的爬虫
import requests
import re
#引入正则表达式模块
#hi={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'}
#模拟用户登录,避免爬虫被拒绝服务
html=requests.get('http://www.jikexueyuan.com/course/821_2.html?ss=1')
html.encoding='utf-8'
print( html.text)
#爬取网页context,定义编码格式
#title=re.findall('posOper=900027'>(.*?)</a>'.html.text.re.s)
# for each in title:
# print(each)
am='posOper=900027">(.*)</a>'
pm=html.text
#查看源码获取特征信息,这里最好分开写am,pm,
sm=re.findall(am,pm)
for each in sm:
print(each)
唯一的问题是红色部分把查找项与待查找项在一起写的时候为什么会出错,很奇怪。
- 第一只虫子
- 四只虫子问题
- 第一只博客
- 虫子妈妈
- 面包 & 虫子
- 第一只python小爬虫
- 第一只爬虫---糗事百科
- Codeforces Beta Round #69 (Div. 2 Only) E树型DP 一树,每个结点有虫子,一次只能吃一只,不能停留,问从根结点出发再回到根结点最多能吃多少只虫子
- 夜猫虫子
- VS2005的大“虫子”
- 抓到两只IE8的虫子
- 寻找金虫子
- 虫子的博客
- 小虫子的成长
- 苹果与虫子
- 苹果和虫子
- POJ 2492 虫子交配
- Subsequence(虫子法)
- html td
- C语言基本数据类型、程序结构和运算符操作(有上网查阅过)
- Git19--操作标签
- C++ pair(对组)用法
- 使用spring官方文档常见Maven管理的spring项目
- 第一只虫子
- LeetCode 21. Merge Two Sorted Lists
- ubuntu---sogou输入法设置
- 处理iPhone 6s plus/iPad 横屏启动App界面布局错乱问题
- Hdu 5336 XYZ and Drops(模拟)
- Mysql提示 “ Got a packet bigger than 'max_allowed_packet' bytes”
- netty学习(一)——概念简介
- 访问win7默认共享
- 217. Contains Duplicate