python去除script标签及里面的内容
来源:互联网 发布:centos 6.5 bond配置 编辑:程序博客网 时间:2024/06/09 21:13
soup = BeautifulSoup(content.content,'lxml')text = soup.find('div',{'class':'content'}).get_text().strip()print text
var ent_common_pic_1 = { "data": { "item": [ { "title": "《快乐大本营》杨紫", "img_url": "http://n.sinaimg.cn/ent/transform/20170527/Le4r-fyfrfvv4614357.jpg", "thumb_url": "http://n.sinaimg.cn/ent/transform/20170527/Le4r-fyfrfvv4614357_h60.jpg"......('entSdPic_1', ent_common_pic_1); entSlide_1.init(); } }); 新浪娱乐讯 本周六晚,湖南卫视《快乐大本营》二十周年特别篇持续播出。此次,杨紫[微博]将以二十周年特.
添加一下几行代码,就可以删除掉了:
soup = BeautifulSoup(content.content,'lxml')for script in soup(["script", "style"]): script.extract()text = soup.find('div',{'class':'content'}).get_text().strip()lines = (line.strip() for line in text.splitlines())chunks = (phrase.strip() for line in lines for phrase in line.split(" "))text = '\n'.join(chunk for chunk in chunks if chunk)print text
新浪娱乐讯 本周六晚,湖南卫视《快乐大本营》二十周年特别篇持续播出。此次,杨紫[微博]将以
阅读全文
0 2
- python去除script标签及里面的内容
- 去除html代码里面的script正则
- 去除html字符串里面的标签
- js 过滤script标签之间的内容
- python去除所有html标签的方法
- js获取外层标签(排除标签里面的内容)
- python去除html标签
- Python 实现替换文件里面的内容
- python爬虫去除网页中的script结构
- vivi的ld script的内容及分析
- BeautifulSoup 提取某个tag标签里面的内容
- jquery怎么获取lable标签里面的内容?
- HTML <select>标签如何获取里面的内容
- Script标签的识别
- JavaScript的<script> 标签
- Script标签的属性
- <script>标签的问题
- html的script标签
- windows下搭建Spark1.6源码调试阅读环境
- linux下用eclipse编译c++的pthread多线程配置
- NSOJ A Mathematical Curiosity
- java多线程学习——初识多线程
- Android APK反编译
- python去除script标签及里面的内容
- Android应用版本命名规范
- HTTP协议详解
- mysql免安装使用说明
- Hbuilder 使用chrome调试问题
- android adb常用指令
- springmvc GET POST请求乱码解决
- 1017. A除以B (20)
- 在亚马逊买东西的购物体验