php实现的简单的csdn博客文章抓取(续:添加用户名搜索提示)
来源:互联网 发布:天下3鬼墨捏脸数据 编辑:程序博客网 时间:2024/05/19 17:51
上篇blog文章实现了根据指定的csdn用户名列出其所有的blog文章的功能,不过这个其实没多大实际用处,我们必须得精确知道感兴趣用户的用户名才能列出他的blog文章,所以闲来想弄一个类似于google suggest的输入提示功能。
要实现搜索提示,当然手头得有csdn用户列表可供使用,毫无疑问这个用户列表要靠自己去crawl,于是写了个极其简单的爬取php脚本,如下:
crawl的过程比较慢,截止到发帖时间已经爬取了3、4小时的时间,爬取到的用户总数已经达到2w多,已经分析的url数目仅1000多条,待分析和爬取的url目前为止是6w条左右,这个数目还会继续增加,当然爬取得到的用户数目和待爬取的url数目越往后关系越不大。
crawl得到所需的csdn用户列表后,剩下的工作就是怎样实现搜索提示的功能,这部分的实现参考了别人的代码,在此就不作介绍,只给出相关代码和效果图
////////index.htm
/////////bloginputhint.php
效果图:
- php实现的简单的csdn博客文章抓取(续:添加用户名搜索提示)
- php实现的简单的csdn博客文章抓取
- 抓取csdn博客的所有文章url
- Hello Python!用python写一个抓取CSDN博客文章的简单爬虫
- codes51竟然抓取CSDN博客中作者的文章篡改
- 使用Jsoup 抓取本人CSDN博客文章列表的数据
- php+linux的crontab实现定时抓取csdn文章到mysql数据库
- CSDN 博客 修改文章搜索为 bing 搜索,且只搜索自己的博客的方法
- 如何在csdn网站搜索自己写的博客文章
- Python实现抓取CSDN博客首页文章列表
- CSDN的博客搜索功能太弱,教你怎么搜索自己博客的文章
- CSDN的博客搜索功能太弱,教你怎么搜索自己博客的文章
- CSDN的博客搜索功能太弱,教你怎么搜索自己博客的文章
- CSDN的博客搜索功能太弱,教你怎么搜索自己博客的文章
- [转]CSDN的博客搜索功能太弱,教你怎么搜索自己博客的文章
- CSDN的博客搜索功能太弱,教你怎么搜索自己博客的文章
- CSDN的博客搜索功能太弱,教你怎么搜索自己博客的文章
- CSDN的博客搜索功能太弱,教你怎么搜索自己博客的文章
- Gtalk基本功能完成
- Linux 源码编译软件几点排错
- 孙鑫mfc 4.简单绘图
- Berkeley DB示例程序详解(3.2)
- 成就DBA职业生涯
- php实现的简单的csdn博客文章抓取(续:添加用户名搜索提示)
- 指针和引用的区别[转帖]
- 上网
- 谈谈怎样解决JSP数据插入MySql乱码的问题。
- VB.NET / SQL Server
- asm source code note 1.7_switch case分支的实现
- C++集成设计环境——Code::Blocks安装过程
- 获取时间
- C++ 地址连续的多维数组实现