使用xpath提取极客学院python课程内容名称
来源:互联网 发布:手机网络创业 编辑:程序博客网 时间:2024/06/05 16:46
最近在熟悉python的时候偶然想试一试写一个简单的单线程爬虫,于是知道了有XPATH这个神器,它的主要用法如下:
1.//定位根节点
2./往下层寻找
3.提取文本内容:/text()
4.提取属性内容:/@xxxx
在使用的过程中写了一个提取极客学院python课程名的简单爬虫,代码不到20行,给想学习python以及网络爬虫技术的朋友一个参考:
#!/usr/bin/env pythonfrom lxml import etreeimport requestsimport jsonimport sysreload(sys)sys.setdefaultencoding('utf-8')url = "http://www.jikexueyuan.com/path/python"html = requests.get(url)selector = etree.HTML(html.text)content_field = selector.xpath('//h2[@class="lesson-info-h2"]/a/text()')for i in content_field:print i
1 0
- 使用xpath提取极客学院python课程内容名称
- python xpath 提取html 中使用<br>分割的文本
- python中使用XPath
- python---xpath使用
- python中使用XPath
- 使用XPath提取xml文档数据
- 极客学院使用体会
- Python爬虫实战:极客学院
- python爬虫下载极客学院视频
- Python抓取极客学院开放数据
- 极客学院python开发工程师视频教程
- python lxml xpath 使用实例!
- python selenium使用Xpath定位
- python 使用xpath解析html
- Python+Selenium--XPath的使用
- python selenium使用xpath定位
- python爬虫利器-xpath使用
- 【极客学院】-python学习笔记-3-单线程爬虫 (request安装遇到问题及解决,应用requests提取信息)
- NiftyDialogEffects
- ajax 解决跨域的四种方法
- Ubuntu 14.04 安装JDK1.6
- tableview个人中心-布局思路
- oracle 查看用户所在的表空间
- 使用xpath提取极客学院python课程内容名称
- DTD 文档类型定义
- Cocos2d-JS中CollectionView实现不同大小Cell同时显示的技巧(ListView中添加显示标签)
- WebRTC学习之十:最简单的视频聊天(使用WebRtcVideoEngine2)
- request.getRequestDispatcher().forward(request,response)和response.sendRedirect()的区别
- 高斯牛顿迭代法
- LBS初体验----百度地图SDK
- js中转换json对象 js自带转换
- LTE建模仿真交流