使用Socket抓取网页源代码
来源:互联网 发布:scilab矩阵运算 编辑:程序博客网 时间:2024/05/16 09:57
import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.io.PrintWriter;import java.net.InetAddress;import java.net.Socket;public class HttpDemo {/** * 使用Socket抓取网页源码 */public static void main(String[] args) throws IOException {//想要抓取的网页主机名//域名www.baidu.com,旗下有好多主机,例如tieba.baidu.com,map.baidu.comString host = "map.baidu.com";//根据主机名获取ip地址InetAddress ip = InetAddress.getByName(host);//建立连接Socket s = new Socket(ip,80);//向服务器端写入http协议请求PrintWriter pw = new PrintWriter(s.getOutputStream());// "/"请求根页面pw.println("GET / HTTP/1.1");pw.println("Host: "+host);pw.println("Content-Type: text/html");pw.println();pw.flush();//将获取到的页面输出在控制台BufferedReader br = new BufferedReader(new InputStreamReader(s.getInputStream()));String str = "";while((str=br.readLine())!=null){System.out.println(str);}br.close();pw.close();s.close();}}
0 0
- 使用Socket抓取网页源代码
- C++抓取网页源代码
- socket抓取网页
- c#信息抓取一:抓取网页源代码
- java简单抓取网页源代码
- java抓取网页源代码《转载》
- 使用Ajax抓取远程网页源代码并抓取其中图片【老司机不须再用】
- PHP抓取网页内容获得网页源代码
- PHP抓取网页内容获得网页源代码
- 使用wget抓取网页
- 使用python抓取网页
- 使用lxml抓取网页
- 使用wget抓取网页
- 抓取和分析网页的类源代码
- 抓取和分析网页的类源代码
- Nutch源代码研究 网页抓取 fetch
- Nutch源代码研究 网页抓取 下载插件
- Nutch源代码研究 网页抓取 数据结构
- 田忌赛马
- 设计模式(二)——AbstractFactory
- 每天学习一点c++之二——函数的重载与哑元
- windows搭建golang开发平台
- 创建View类
- 使用Socket抓取网页源代码
- 匈牙利算法
- 【 D3.js 进阶系列 — 2.1 】 力学图的事件 + 顶点的固定
- MFC(含功能窗口及测试主窗口)的DLL生成技巧
- 5个提供flickr高级图片搜索的网站
- GDI+ 中发生一般性错误,解决办法简单探索。
- 几种常用的动态查找树比较
- Strategic Game+hdu+树形dp
- TI的omap系列MPU 什么是OFF_MODE ?