使用Java爬虫当数据后台的资源网站搭建
来源:互联网 发布:淘宝旺旺号名字大全 编辑:程序博客网 时间:2024/06/10 09:47
*以下为计划和记录*
//记录
11月18日,突如其来的骚想法––写个爬虫,做个资源网站
11月18-19日,实现对两个磁力网站磁力的抓取,但还是没法全资源的获取,只能通过关键词搜索得到该关键词的相关磁力,所以接下来就必须再写个类对比较热门的词抓取,再交给磁力爬虫类抓取
11月20-21日,对个动漫资料库写了个抓取类,但在入库时出了问题(不是日文字符乱码,就是链接被回收.......问题一大堆,辣鸡数据库,毁我青春=.=)
//计划
11月22-25日,将爬虫程序完善(远程控制类,日志类等等),数据库能解决就解决,不能就放着
11月26-31日,搭建或购买服务器(阿里云云翼计划),将程序放上去测试运行,调试和完善
12月1-10日,编写网站,实现简单的资源搜索
12月11-17日,测试和完善(实际上拿来预防前面时间不够的>_<)
12月18日,将网站放上服务器
//记录
11月18日,突如其来的骚想法––写个爬虫,做个资源网站
11月18-19日,实现对两个磁力网站磁力的抓取,但还是没法全资源的获取,只能通过关键词搜索得到该关键词的相关磁力,所以接下来就必须再写个类对比较热门的词抓取,再交给磁力爬虫类抓取
11月20-21日,对个动漫资料库写了个抓取类,但在入库时出了问题(不是日文字符乱码,就是链接被回收.......问题一大堆,辣鸡数据库,毁我青春=.=)
//计划
11月22-25日,将爬虫程序完善(远程控制类,日志类等等),数据库能解决就解决,不能就放着
11月26-31日,搭建或购买服务器(阿里云云翼计划),将程序放上去测试运行,调试和完善
12月1-10日,编写网站,实现简单的资源搜索
12月11-17日,测试和完善(实际上拿来预防前面时间不够的>_<)
12月18日,将网站放上服务器
阅读全文
0 0
- 使用Java爬虫当数据后台的资源网站搭建
- 当爬虫没抓到数据的时候(漫画)
- 爬虫有用的数据网站
- 使用java 爬虫 抓取youtube,youku,facebook 等视频网站的视频数据(请求规则的分析)
- 使用爬虫抓取网站异步加载数据
- java实现网络爬虫--抓取网站数据
- 数据挖掘的资源网站
- 8-使用爬虫登录后台系统并爬取数据
- JAVA使用爬虫抓取网站网页内容
- python爬取防爬虫网站的数据
- python小爬虫—抓取pixabay网站的图片资源
- 爬虫数据来源网站
- java的学习资源网站
- 使用python爬虫爬取百度手机助手网站中app的数据
- [记录]Java网络爬虫基础和抓取网站数据的两个小实例
- Java网络爬虫基础和抓取网站数据的两个小实例
- 当使用ajax 由前台像后台post 数组类型数据的一些问题(基于springboot)
- 使用golang的标准库搭建网站--4.关于静态资源处理的问题
- 陈国君java第五版第四章课后习题第五题
- JAVA如何使用Redis
- 详解HashMap和HashTable
- 9BRunning Student
- js调用百度GPS定位
- 使用Java爬虫当数据后台的资源网站搭建
- HTTP协议
- Precision-Recall
- JAVA GUI 简记
- 【剑指offer】栈的压入、弹出序列
- Boost1.62.0 + VS2015 配置
- Spring(二)装配Bean(注入)
- thinkphp控制器数据赋值给模板js
- c语言:有1、2、3、4个数字,能组成多少个互不相同且无重复数字的三位数