【详解】Python脚本planM记录
来源:互联网 发布:怎样找网络推手 编辑:程序博客网 时间:2024/05/17 06:15
1. 【类型排重】
这个脚本我们要做的事情是,查询电影票价,类型与价格对应。
因为爬到的数据是一个列表,显示场次和价格。我们只需要知道每个类型是多少钱就可以了。
所以需要排重。所以对Python的排重方法做了研究。现作简单阐述。。。
最终解决代码如下:
def printPriceMessage(type,price): '''打印最终信息''' message=[] for i in range(len(type)): typei=delN(str(type[i])) pricei=delN(str(price[i])) final=transferEncoding(typei+': '+pricei) message.append(final) message=list(set(message))message是我们抓到的所有场次的类型与价钱对应的列表。
关键代码在最后一句
message=list(set(message))将列表message中的信息进行排重,只需要list(set(列表))就可以了
2. 【链接的简化】
我们之前做爬虫模拟登录的时候,分析登录所提交的参数。
某些参数因为是固定的就可以不定义不提交,也能够达到一样的效果。
同样的,基于get方式的url也可以随意去掉一些固定或者没有的参数,同样能够访问到我们想去的地方。
这一点,在写爬虫,分析URL的时候很有用。
3.【删除制表符与换行符】
我们还遇到一个问题。打印电影类型的时候打印出来的字符串占了很大的空间。
我们后来发现,这个字符串里有很多格式符。主要就是制表符\t和换行符\n。需要删除这些符号,才方便我们打印信息。
最后我们的解决办法是,定义了一个删除这俩字符串的方法。
def delN(str): '''删除换行符与制表符''' str=str.replace('\n','') str=str.replace('\t','') return str
0 0
- 【详解】Python脚本planM记录
- python 脚本学习记录(1)
- 【详解】Python抓取数据脚本
- 【详解】Python脚本转可执行文件
- 【详解】Python CH爬虫脚本
- python 脚本学习记录(2)
- python pexpect模块详解附常用脚本
- 【详解】Python写爬虫脚本的教程
- 【详解】Python爬虫脚本M9优化
- 【详解】Python脚本转可执行文件进阶版
- 很有用的shell / python 脚本片段(记录)
- Python 数据库备份脚本(邮件通知+日志记录)
- 用python库telnetlib脚本控制交换机详解
- python脚本
- Python脚本
- python 脚本
- python脚本
- python脚本
- APNS
- MFC自绘菜单
- python + Sqlite
- iOS 随笔
- MFC打印
- 【详解】Python脚本planM记录
- C#实现高精度定时器
- MFC映射
- AT89命名规则
- lua学习贴
- 正则表达式
- IOS NSLocking协议,NSLock,NSConditionLock,NSRecursiveLock,NSCondition
- 嵌入式audio基础(三)总线
- Linux内核中监听网线是否插入是否工作函数