php实现的简单的csdn博客文章抓取(续:添加用户名搜索提示)

来源:互联网 发布:天下3鬼墨捏脸数据 编辑:程序博客网 时间:2024/05/19 17:51

上篇blog文章实现了根据指定的csdn用户名列出其所有的blog文章的功能,不过这个其实没多大实际用处,我们必须得精确知道感兴趣用户的用户名才能列出他的blog文章,所以闲来想弄一个类似于google suggest的输入提示功能。


要实现搜索提示,当然手头得有csdn用户列表可供使用,毫无疑问这个用户列表要靠自己去crawl,于是写了个极其简单的爬取php脚本,如下:

 

 

 

crawl的过程比较慢,截止到发帖时间已经爬取了3、4小时的时间,爬取到的用户总数已经达到2w多,已经分析的url数目仅1000多条,待分析和爬取的url目前为止是6w条左右,这个数目还会继续增加,当然爬取得到的用户数目和待爬取的url数目越往后关系越不大。

 

crawl得到所需的csdn用户列表后,剩下的工作就是怎样实现搜索提示的功能,这部分的实现参考了别人的代码,在此就不作介绍,只给出相关代码和效果图

 

 

////////index.htm

 

 

 

 

/////////bloginputhint.php

 

 

 

 

效果图: