Java 爬取信息存入数据库
来源:互联网 发布:sql中left join的用法 编辑:程序博客网 时间:2024/06/05 18:46
本人在学习 Spring 的时候学习搭建一个后台,我这里拿来练手的是一个新闻的后台,主要的功能包括抓取新闻信息,保存在数据库中,并根据请求返回相应数据。
这里我选取的新闻来源是一点资讯(主要是他的API比较容易获取),抓取和解析选取Jsoup+Gson.运行采取Schedul 定时运行爬虫脚本。
首先利用浏览器F12获取到要闻栏目的请求API:
http://www.yidianzixun.com/home/q/news_list_for_channel?channel_id=hot&cstart=9&cend=19&infinite=true&refresh=1&multi=5&appid=web_yidian&=1495540870731
通过分析可以知道其中关于分页的主要参数是 cstart , cend , 参数 _ ,cstart表示起始下表,cend 表示结束下标,_不清楚意义,但是每次请求+1,那么改变这几个参数我们就能进行不停的请求数据了。当然不要忘记了取出浏览器中得Head和 Cookie 参数。
首先是爬虫爬取数据,并将其转换成 Bean 对象:
发现一次爬取成功,那么,我们就可以通过定时任务来定时执行,修改翻页参数,爬取数据:
编译运行,打印信息发现按照我们的预期执行了:
接下来再看下数据库,发现里面也有数据了:
项目上传在GitHub上 : GitHub地址
阅读全文
0 0
- Java 爬取信息存入数据库
- 爬虫爬取信息存入数据库
- java 使用webmagic 爬虫框架爬取博客园数据存入数据库
- Python爬虫小实践:寻找失踪人口,爬取失踪儿童信息并写成csv文件,方便存入数据库
- Python爬虫小实践:寻找失踪人口,爬取失踪儿童信息并写成csv文件,方便存入数据库
- nodejs 爬取热点明星存入mysql数据库
- python爬取的小说存入mysql数据库
- Log4net自定义信息存入数据库
- Log4net自定义信息存入数据库
- JAVA爬取is老师信息并存到数据库
- Log4net 自定义信息(字段)存入数据库
- 新信息存入数据库的更新过程
- 通过socket接收报警信息,存入数据库
- Log4net 自定义信息(字段)存入数据库
- java将图片存入数据库
- 爬取信息到数据库入门操作
- python 把爬取页面的所有地址和访问结果存入数据库
- Python3爬取网页数据存入MySQL
- jQuery DataTables添加可复用的页面跳转
- ASP MVC5.0 XML存取数据的登录程序(1) 注册部分
- Linux常见问题
- 递归+字典序法全排列(java实现)
- 第七届蓝桥杯决赛 凑平方数 【简单写法+20多行代码】
- Java 爬取信息存入数据库
- SSL2298 饥饿的牛(dp)
- Sitemesh 3 的使用及配置
- 快速幂( O(log n) )
- 布局别名
- Unity——Rigidbody实现真实的物体旋转效果/解决物体添加刚体后不随父物体移动/hingejoint
- 总体性能——渲染模块性能
- 算法导论程序13-快速排序的描述(Python)
- 【七日牧函】教会是我们的母亲