编程之路~java爬虫

来源:互联网 发布:娄烨 知乎 编辑:程序博客网 时间:2024/04/30 03:08

日本雅虎网站商品抓取:

java爬虫;jsoup;线程

根据scrab(条件)到code.js里的对应url网址抓取html代码。

根据tag与class找到对应元素抓取。(div.get(i)需做判断否则会报数组异常)。

hibernate底层set到数据库

后期与页面展示项目结合起来,通过定时器触发每24小时抓取



0 0
原创粉丝点击