什么样的题目可以上推荐页面?
来源:互联网 发布:stm32跑linux 编辑:程序博客网 时间:2024/04/28 01:16
今天发现CSDN上一个页面有热门推荐文章,而里面的文章大多浏览量不到50,于是猜测,这个是根据题目来推荐的,CSDN可能会最近搜索,设置几个关键词,从而寻找包含这些关键词的文章,推荐给读者。所以,我先用脚本爬取了前50页所有被推荐的题目,然后制作词云,作为日后起题目的参考。网页
先上脚本代码:
import requestsfrom lxml import etreemyag = {"User-Agent": "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) " "Chrome/54.0.2840.87 Safari/537.36"}text = ''page_num=50for j in range(1, page_num): url = "http://blog.csdn.net/other/hotarticle.html"+'?&page='+str(j) html = requests.get(url, headers=myag).text selector = etree.HTML(html) for i in range(1, 31): title = selector.xpath('//*[@id="listBot"]/dl['+str(i)+']/dd/h3/a/text()')[0] num = selector.xpath('//*[@id="listBot"]/dl['+str(i)+']/dd/div[2]/div[2]/span/em/text()')[0] text = title+text;print(text)file_object = open('thefile.txt','w',encoding='utf-8')file_object.write(text)file_object.close()
保存到文件中也是为了做词云方便,
我们可以看到呢,学习果然是稳赚不赔的投资。
所以最容易被推荐的题目就是《学习安装使用linux》
2 0
- 什么样的题目可以上推荐页面?
- 什么样的站点可以入侵
- 什么样的产品可以成功?
- 什么样的人,才可以办大事?
- 什么样的人可以担任项目经理?
- 什么样的男人可以叫老公
- 什么样的计算机程序可以申请发明专利?
- 达到什么样的积分可以不用审核
- 什么样的项目一定可以拿到投资
- 什么样的人可以带团队?
- 什么样的手机可以击败iPhone
- 【推荐】C和C++语言学习总结(可以应对面试的题目)
- 可以在WinCE上实现的asp页面定时刷新
- 什么样的人才可能当上领导?
- 什么样的类可以作为map的键值
- 知道可以做什么样的人,是成长的基础。
- 什么样的类型可以作为python字典的key
- IIS6.0 ,网站上的html可以正常访问,asp页面提示找不到页面404 错误
- 算法题-n-1的位数
- ES集群理解和安装
- 响铃:留给云计算服务企业的时间不多了,生态战成为终极一战
- 图像分割(三)——分水岭算法/边缘检测/直方图法
- SPI总线之CPOL CPHA
- 什么样的题目可以上推荐页面?
- bookstrap3常用组件
- 散户必须看懂主力洗盘手段,扭亏为盈的机会
- 《Training:Supporting Different Screens》
- 函数指针实现通用的数组元素排序
- WinEdt初次接触
- (jquery)input输入一个日期得到前后几天的日期
- 常用正则表达式
- windos 下 安装 pip