BeautifulSoup中解决乱码问题
来源:互联网 发布:低碳钢拉伸试验数据 编辑:程序博客网 时间:2024/05/21 09:05
由于初步学习Python爬取网页文本内容,在存储文本时出现乱码问题
我的代码如下:
import urllib
from bs4 import BeautifulSoup
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
fp = file("test.txt","wb+")
page=urllib.urlopen('http://tech.qq.com/a/20150518/031741.htm').read()
soup = BeautifulSoup(page)
div = soup.find_all('div',id="Cnt-Main-Article-QQ")
pp = div[0].find_all('p')
for p in pp:
fp.write(p.get_text())
print "Write Over!!!"
fp.flush()
fp.close()
但打开文本时内容为乱码,上网搜索了好多资料,找到一篇文章,非常简洁的而又完美的解决乱码问题
方法如下:
将soup = BeautifulSoup(page)改成soup=BeautifulSoup(page,from_encoding"gb18030")
当你再次打开文本时会惊奇的发现不会乱码了
0 0
- BeautifulSoup中解决乱码问题
- python BeautifulSoup中文乱码问题
- 解决jsp中乱码问题
- jsp中解决乱码问题
- 解决eclipse中乱码问题
- ServletJsp中解决乱码问题
- javaWeb中解决乱码问题
- 解决Servlet中乱码问题
- 解决MySQL中乱码问题
- BeautifulSoup 解析中文网页乱码问题
- BeautifulSoup使用find_all方法乱码问题
- Eclipse中jsp乱码问题之解决
- 解决tomcat中url乱码问题
- AppFuse中DisplayTag乱码问题的解决
- servlet中中文乱码问题的解决
- 解决JSP中使用request乱码问题
- JSP中日文乱码问题的解决
- 解决JSP中使用request乱码问题
- hdu1548
- NetworkOnMainThreadException异常
- call_user_func
- Leetcode Letter Combinations of a Phone Number
- php运行模式
- BeautifulSoup中解决乱码问题
- Android 不规则图像填充 小玩着色游戏
- http 和 tcp
- ORACLE和SYBASE数据库中实现数据查询条数限制的SQL语句实现
- 2015.5.9安卓笔记之sd卡和settings应用
- mysqldump导出sql中insert语句的问题
- HDU 4046 Panda(线段树单点更新)
- MySql二进制和源码安装介质的选择
- 游戏的衰落,更迭的结果