一个简单的页面扫描程序Scan
来源:互联网 发布:mysql.sock下载 编辑:程序博客网 时间:2024/05/16 15:18
代码功能实现,输入一个简写的url地址,得到此页面上所有的超级链接。
从原理上看,把后台输入的简写url加工,转换成java.net.URL类型。使用poenStream()将资源数据转化成数据流,在网络资源和URL对象之间建立一条信道链路。从HTML角度来说,就是查该主页上包含多少个HREF标记。
package net;
import java.net.*;
import java.io.*;
class URL_PageScan
{
public static void main(String args[])
{
System.out.println("Working..");
//if(args.length!=1)
//{
System.out.println("输入一个URL地址后回车,如http://java.sun.com/index.html");
// System.exit(0);
//}
URL ul = null;
char c;
StringBuffer buf = new StringBuffer();
try
{
while((c = (char)System.in.read()) != ' ')
{
buf.append(c);
}
buf.insert(buf.length() - 1, "/index.html");
System.out.println("URL_3:" + buf.toString());
ul = new URL("http://" + buf.toString());
System.out.println("URL:" + ul);
}
catch(Exception e)
{
System.out.println("Bad URL:" + ul);
}
StringBuffer page = new StringBuffer();
try
{
InputStream in = ul.openStream();
BufferedReader reader = new BufferedReader(new InputStreamReader(in));
int data;
while((data = reader.read()) != -1)
page.append((char)data);
}
catch(IOException e)
{
e.printStackTrace();
}
//计算"HREF"出现的次数
int refCount = 0;
for(int i = 4; i < page.length(); i ++ )
{
if(page.substring(i - 4, i).equalsIgnoreCase("HREF"))
refCount ++ ;
}
System.out.println("pages referenced:" + refCount);
}
}
import java.net.*;
import java.io.*;
class URL_PageScan
{
public static void main(String args[])
{
System.out.println("Working..");
//if(args.length!=1)
//{
System.out.println("输入一个URL地址后回车,如http://java.sun.com/index.html");
// System.exit(0);
//}
URL ul = null;
char c;
StringBuffer buf = new StringBuffer();
try
{
while((c = (char)System.in.read()) != ' ')
{
buf.append(c);
}
buf.insert(buf.length() - 1, "/index.html");
System.out.println("URL_3:" + buf.toString());
ul = new URL("http://" + buf.toString());
System.out.println("URL:" + ul);
}
catch(Exception e)
{
System.out.println("Bad URL:" + ul);
}
StringBuffer page = new StringBuffer();
try
{
InputStream in = ul.openStream();
BufferedReader reader = new BufferedReader(new InputStreamReader(in));
int data;
while((data = reader.read()) != -1)
page.append((char)data);
}
catch(IOException e)
{
e.printStackTrace();
}
//计算"HREF"出现的次数
int refCount = 0;
for(int i = 4; i < page.length(); i ++ )
{
if(page.substring(i - 4, i).equalsIgnoreCase("HREF"))
refCount ++ ;
}
System.out.println("pages referenced:" + refCount);
}
}
- 一个简单的页面扫描程序Scan
- 一个简单的扫描目录的程序
- 一个简单的TCP扫描程序
- 一个51单片机的键盘扫描程序,算法简单有效
- 一个批处理的扫描程序
- 一个简单的下载html页面的程序
- 实战Registry和RegistryKey类,一个简单的可疑文件扫描程序
- 简单的扫描枪模拟程序
- 一个程后台扫描的程序
- 简单的一个程序
- 一个简单的程序
- 一个简单的程序
- 一个简单的WAP页面
- 一个简单的struts页面
- 一个简单的JSP页面
- 一个简单的注册页面
- 一个简单的html页面
- 一个简单的登录页面
- 在Win32命令行启动SWT程序
- js: 清空文件输入框的值
- Excel:做个单词默写本
- 数据结构——简单Hash Table实现
- 2007年做个什么样的网站赚钱呢?
- 一个简单的页面扫描程序Scan
- 广州之行
- N多的红烧茄子做法!
- Shift键—轻松把Excel表格转换为图片
- 如何正规的快速建立赚钱的网站
- 给初学者:VB如何操作WEB页的浏览提交———三:学会拨号和断开,内容想发就发,别拿IP限制我!
- 老黄历用语解释
- 黄历择日宜忌事项细说
- 解读老黄历--月日时令