【详解】Python脚本planM记录

来源:互联网 发布:怎样找网络推手 编辑:程序博客网 时间:2024/05/17 06:15

1. 【类型排重】

这个脚本我们要做的事情是,查询电影票价,类型与价格对应。

因为爬到的数据是一个列表,显示场次和价格。我们只需要知道每个类型是多少钱就可以了。

所以需要排重。所以对Python的排重方法做了研究。现作简单阐述。。。

最终解决代码如下:

def printPriceMessage(type,price):    '''打印最终信息'''    message=[]    for i in range(len(type)):        typei=delN(str(type[i]))        pricei=delN(str(price[i]))        final=transferEncoding(typei+': '+pricei)        message.append(final)    message=list(set(message))
message是我们抓到的所有场次的类型与价钱对应的列表。

关键代码在最后一句

 message=list(set(message))
将列表message中的信息进行排重,只需要list(set(列表))就可以了


2. 【链接的简化】

我们之前做爬虫模拟登录的时候,分析登录所提交的参数。

某些参数因为是固定的就可以不定义不提交,也能够达到一样的效果。

同样的,基于get方式的url也可以随意去掉一些固定或者没有的参数,同样能够访问到我们想去的地方。

这一点,在写爬虫,分析URL的时候很有用。


3.【删除制表符与换行符】

我们还遇到一个问题。打印电影类型的时候打印出来的字符串占了很大的空间。

我们后来发现,这个字符串里有很多格式符。主要就是制表符\t和换行符\n。需要删除这些符号,才方便我们打印信息。

最后我们的解决办法是,定义了一个删除这俩字符串的方法。

def delN(str):    '''删除换行符与制表符'''    str=str.replace('\n','')    str=str.replace('\t','')    return str

0 0
原创粉丝点击