python爬虫实例备忘

来源:互联网 发布:java过滤所有html标签 编辑:程序博客网 时间:2024/05/21 23:00

从视频中学习到的爬虫爬取中国大学排名的步骤。




代码框架:


提取数据:

将所有的td标签查询出来(find_all简写方法),并且存储成一个列表类型tds.


最后将它格式化输出即可:


视频中还对中英文混排的输出进行了优化。

没有对齐的主要原因是程序默认用英文字符填充,我们需要改成用中文空格填充即可。


原创粉丝点击