爬虫

来源:互联网 发布:java写一个数据库 编辑:程序博客网 时间:2024/04/30 00:30
1 request = urllib2.Request(url)
2 request = urllib2.Request(url,data)
3 request = urllib2.Request(url,header)
response= urllib2.urlopen(req).read()
find_all() 方法将返回文档中符合条件的所有tag,结果是包含标签节点元素的列表。
find() 方法直接返回结果。
find().string.strip():返回标签节点的字符串值,并删除字符串前后的空格。
split():拆分字符串。通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)。string.join(sep):string是分隔符;把join里面的所有字符串通过分隔符连接成一个新的字符串。
例如:
1 a='abcd'
2 print '.'.join(a)   
3 print '|'.join(['a','b','c'])  #可以把['a','b','c']看做是 a='abcd';下面同理
4 print '.'.join({'a':1,'b':2,'c':3,'d':4})
   
输出为:
a.b.c.d
a|b|c
a.c.b.d
列表[负数]:列表里面负数索引从列表的尾部开始计数,最尾端的元素索引表示为-1,然后依次往前是-2,-3....以此类推。
0 0
原创粉丝点击