使用Java爬虫当数据后台的资源网站搭建

来源：互联网发布：淘宝旺旺号名字大全编辑：程序博客网时间：2024/06/10 09:47

*以下为计划和记录*
//记录
11月18日，突如其来的骚想法––写个爬虫，做个资源网站

11月18-19日，实现对两个磁力网站磁力的抓取，但还是没法全资源的获取，只能通过关键词搜索得到该关键词的相关磁力，所以接下来就必须再写个类对比较热门的词抓取，再交给磁力爬虫类抓取

11月20-21日，对个动漫资料库写了个抓取类，但在入库时出了问题(不是日文字符乱码，就是链接被回收.......问题一大堆，辣鸡数据库，毁我青春=.=)

//计划
11月22-25日，将爬虫程序完善(远程控制类，日志类等等)，数据库能解决就解决，不能就放着

11月26-31日，搭建或购买服务器(阿里云云翼计划)，将程序放上去测试运行，调试和完善

12月1-10日，编写网站，实现简单的资源搜索

12月11-17日，测试和完善(实际上拿来预防前面时间不够的>_<)

12月18日，将网站放上服务器

阅读全文

0 0