使用Java爬虫当数据后台的资源网站搭建

来源:互联网 发布:淘宝旺旺号名字大全 编辑:程序博客网 时间:2024/06/10 09:47

                          *以下为计划和记录*
//记录
11月18日,突如其来的骚想法––写个爬虫,做个资源网站

11月18-19日,实现对两个磁力网站磁力的抓取,但还是没法全资源的获取,只能通过关键词搜索得到该关键词的相关磁力,所以接下来就必须再写个类对比较热门的词抓取,再交给磁力爬虫类抓取

11月20-21日,对个动漫资料库写了个抓取类,但在入库时出了问题(不是日文字符乱码,就是链接被回收.......问题一大堆,辣鸡数据库,毁我青春=.=)

//计划
11月22-25日,将爬虫程序完善(远程控制类,日志类等等),数据库能解决就解决,不能就放着

11月26-31日,搭建或购买服务器(阿里云云翼计划),将程序放上去测试运行,调试和完善

12月1-10日,编写网站,实现简单的资源搜索

12月11-17日,测试和完善(实际上拿来预防前面时间不够的>_<)

12月18日,将网站放上服务器
原创粉丝点击