java爬虫程序放到linux云服务器上执行
来源:互联网 发布:手机怎么查看淘宝等级 编辑:程序博客网 时间:2024/06/15 16:58
为了防止自己忘记,就写了下来。
首先建立了java项目文件后,将jsoup包复制到项目中,然后右键将其添加到项目中,
我们现在抓取今日头条的12377的电话号码,右键审查元素,发现举报电话使用的是class="tel",查看源码,发现tel对应的class只有一项,
这里只有一个Element,因此代码如下:
Document document = Jsoup.connect(url).get();
Element element = document.getElementsByClass("tel").first();
不能使用https,不然会异常。应使用网址:http://www.toutiao.com/
异常代码Caused by: java.security.cert.CertificateException: No subject alternative DNS name matching www.toutiao.com found.
javax.net.ssl.SSLHandshakeException: java.security.cert.CertificateException: No subject alternative DNS name matching www.toutiao.com found.
运行截图:
将改程序打包成可执行的jar文件,右键export
点击ok,这样可执行的jar包就导出来了。
使用winscp与服务器建立连接,并复制到jar到项目中
登陆腾讯云,输入账号密码后
执行java –jar Crawler.jar (最后这里默认的是在root的根目录下,如果放在root/java/Crawler.jar,则是java/Crawler.jar)
这里出现了中文乱码问题。再设置下就好
参考:linux下执行jar,
Winscp的使用:
- java爬虫程序放到linux云服务器上执行
- linux将程序放到后台执行
- linux将程序放到后台执行
- linux将程序放到后台执行
- 【服务器】服务器上设置定时任务,定时执行Java程序
- 在服务器上(ubuntu)设置scrapy爬虫程序定是执行
- 将本地Java程序部署到linux服务器并执行
- java执行linux 程序
- linux服务器上运行java程序,引用外部jar包
- 将java程序部署到Linux服务器上
- linux python 爬虫 服务器部署 crontab定时执行
- 在linux上执行java
- Windows下的程序放到linux下面不能执行的问题
- 将项目放到服务器tomcat上运行
- java 服务器上执行shell错误
- 在windows服务器上都正常,但放到一台linux服务器上session变量却不能传递
- Java程序执行Linux命令
- Linux 端执行java程序
- 【英语】May,You raise me up!
- 卡特兰数
- Treadmill: Attributing the Source of Tail Latency through Precise Load Testing and Statistical Infer
- Java--监听器Listener
- 推荐系统
- java爬虫程序放到linux云服务器上执行
- Caffe for Python 官方教程(翻译)
- 【MyBatis框架】查询缓存-二级缓存-整合ehcache
- 基于Google自带算法实时检测人脸并绘制人脸框(网络首发,附完整demo)
- Invalid bound statement (not found):
- ftp-主动模式(PORT)和被动模式(PASV)
- mysql char/varchar的区别
- 触发器,web自适应,myeclipse编码,perl,Unix,PHP大致了解
- linux sed命令详解