#小练习 使用字典保存HTMLParser解析的数据
来源:互联网 发布:jquery.min.js下载 编辑:程序博客网 时间:2024/06/16 09:07
#coding:utf-8
import HTMLParser
class myhp(HTMLParser.HTMLParser):
def __init__(self):
HTMLParser.HTMLParser.__init__(self)
self.d={}
self.tag=None
self.content=None
def handle_starttag(self,tag,attr):
#注意:tag不区分大小写,此时也可以解析 <A 标签
if tag=='a':
for href,link in attr:
if href.lower()=="href":
self.tag='a'
self.content=link
def handle_data(self,data):
if self.tag=='a' and len(data.strip()):
self.d[data.strip()] =self.content
# 遇到 </a ,设置self.tag =None
def handle_endtag(self,tag):
if tag=='a':
self.tag=None
if __name__ == "__main__":
html_code='''
<a href="www.google.com"> goolge.com </a>
<AB href="www.sohu.com.cn"> sohu.com </a>
<A Href="www.pythonclub.org">PythonClub </a>
<A HREF='www.sina.com.cn'> sina </a>
'''
m = myhp()
m.feed(html_code)
print m.d
m.close()
import HTMLParser
class myhp(HTMLParser.HTMLParser):
def __init__(self):
HTMLParser.HTMLParser.__init__(self)
self.d={}
self.tag=None
self.content=None
def handle_starttag(self,tag,attr):
#注意:tag不区分大小写,此时也可以解析 <A 标签
if tag=='a':
for href,link in attr:
if href.lower()=="href":
self.tag='a'
self.content=link
def handle_data(self,data):
if self.tag=='a' and len(data.strip()):
self.d[data.strip()] =self.content
# 遇到 </a ,设置self.tag =None
def handle_endtag(self,tag):
if tag=='a':
self.tag=None
if __name__ == "__main__":
html_code='''
<a href="www.google.com"> goolge.com </a>
<AB href="www.sohu.com.cn"> sohu.com </a>
<A Href="www.pythonclub.org">PythonClub </a>
<A HREF='www.sina.com.cn'> sina </a>
'''
m = myhp()
m.feed(html_code)
print m.d
m.close()
- #小练习 使用字典保存HTMLParser解析的数据
- #小练习 解析HTML文件并使用字典保存链接
- #小练习 HTMLParser
- #小练习 使用HTMLParser获取data时注意事项
- 使用Python的HTMLParser解析HTML文本
- 使用HtmlParser解析HTML
- 使用HtmlParser解析HTML
- 使用HtmlParser解析HTML
- 使用HtmlParser解析HTML
- HTMLParser使用--只是为了保存
- python字典的练习使用
- Python字典小练习
- HTML 解析 -- htmlparser 基本使用
- 使用HtmlParser 解析链接节点
- 关于Python中HTMLParser使用的一些小疑问
- 使用了类和字典来保存数据 查询数据
- python使用HTMLParser保存网页图片
- HtmlParser的使用
- 机房收费系统——组合查询
- hdu 1565 方格取数(1) 最大点权独立集 网络流
- 中断子系统3_中断入口处理
- Adroid调用WebService 讲解
- Android 蓝牙连接实现
- #小练习 使用字典保存HTMLParser解析的数据
- 子类方法重写父类方法的原则
- 一个进程能用的最大内存(堆区)空间大小为1G
- 机器学习&数据挖掘笔记_15(关于凸优化的一些简单概念)
- Cocos2d-x 3.0 开发(十)使用CocoStudio场景编辑器关联组件
- 三角形内切圆的半径
- Linux下Debug模式启动Tomcat进行远程调试
- Python:No module named mime.text or mime.multipart or mime.base
- videolectures 100个最受欢迎的机器学习视频