正则表达式例子

来源:互联网 发布:尽心知性知天 编辑:程序博客网 时间:2024/04/26 04:46


HTTP参考
Java Web — 作者 freeatom @ 21:45
HTTP参考
一、HTTP码应码
响应码由三位十进制数字组成,它们出现在由HTTP服务器发送的响应的第一行。

响应码分五种类型,由它们的第一位数字表示:
1.1xx:信息,请求收到,继续处理
2.2xx:成功,行为被成功地接受、理解和采纳
3.3xx:重定向,为了完成请求,必须进一步执行的动作
4.4xx:客户端错误,请求包含语法错误或者请求无法实现
5.5xx:服务器错误,服务器不能实现一种明显无效的请求

下表显示每个响应码及其含义:
100 继续
101 分组交换协
200 OK
201 被创建
202 被采纳
203 非授权信息
204 无内容
205 重置内容
206 部分内容
300 多选项
301 永久地传送
302 找到
303 参见其他
304 未改动
305 使用代理
307 暂时重定向
400 错误请求
401 未授权
402 要求付费
403 禁止
404 未找到
405 不允许的方法
406 不被采纳
407 要求代理授权
408 请求超时
409 冲突
410 过期的
411 要求的长度
412 前提不成立
413 请求实例太大
414 请求URI太大
415 不支持的媒体类型
416 无法满足的请求范围
417 失败的预期
500 内部服务器错误
501 未被使用
502 网关错误
503 不可用的服务
504 网关超时
505 HTTP版本未被支持

二、HTTP头标
头标由主键/值对组成。它们描述客户端或者服务器的属性、被传输的资源以及应该实现连接。

四种不同类型的头标:
1.通用头标:即可用于请求,也可用于响应,是作为一个整体而不是特定资源与事务相关联。
2.请求头标:允许客户端传递关于自身的信息和希望的响应形式。
3.响应头标:服务器和于传递自身信息的响应。
4.实体头标:定义被传送资源的信息。即可用于请求,也可用于响应。

头标格式:<name>:<value><CRLF>

下表描述在HTTP/1.1中用到的头标
Accept 定义客户端可以处理的媒体类型,按优先级排序;
在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept: image/jpeg,image/png,*/*
Accept-Charset 定义客户端可以处理的字符集,按优先级排序;
在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept-Charset: iso-8859-1,*,utf-8
Accept-Encoding 定义客户端可以理解的编码机制。例如:Accept-Encoding:gzip,compress
Accept-Language 定义客户端乐于接受的自然语言列表。例如:Accept-Language: en,de
Accept-Ranges 一个响应头标,它允许服务器指明:将在给定的偏移和长度处,为资源组成部分的接受请求。
该头标的值被理解为请求范围的度量单位。例如Accept-Ranges: bytes或Accept-Ranges: none
Age 允许服务器规定自服务器生成该响应以来所经过的时间长度,以秒为单位。
该头标主要用于缓存响应。例如:Age: 30
Allow 一个响应头标,它定义一个由位于请求URI中的次源所支持的HTTP方法列表。例如:Allow: GET,PUT
aUTHORIZATION 一个响应头标,用于定义访问一种资源所必需的授权(域和被编码的用户ID与口令)。
例如:Authorization: Basic YXV0aG9yOnBoaWw=
Cache-Control 一个用于定义缓存指令的通用头标。例如:Cache-Control: max-age=30
Connection 一个用于表明是否保存socket连接为开放的通用头标。例如:Connection: close或Connection: keep-alive
Content-Base 一种定义基本URI的实体头标,为了在实体范围内解析相对URLs。
如果没有定义Content-Base头标解析相对URLs,使用Content-Location URI(存在且绝对)或使用URI请求。
例如:Content-Base: Http://www.myweb.com
Content-Encoding 一种介质类型修饰符,标明一个实体是如何编码的。例如:Content-Encoding: zip
Content-Language 用于指定在输入流中数据的自然语言类型。例如:Content-Language: en
Content-Length 指定包含于请求或响应中数据的字节长度。例如:Content-Length:382
Content-Location 指定包含于请求或响应中的资源定位(URI)。
如果是一绝。对URL它也作为被解析实体的相对URL的出发点。
例如:Content-Location: http://www.myweb.com/news
Content-MD5 实体的一种MD5摘要,用作校验和。
发送方和接受方都计算MD5摘要,接受方将其计算的值与此头标中传递的值进行比较。
例如:Content-MD5: <base64 of 128 MD5 digest>
Content-Range 随部分实体一同发送;标明被插入字节的低位与高位字节偏移,也标明此实体的总长度。
例如:Content-Range: 1001-2000/5000
Contern-Type 标明发送或者接收的实体的MIME类型。例如:Content-Type: text/html
Date 发送HTTP消息的日期。例如:Date: Mon,10PR 18:42:51 GMT
ETag 一种实体头标,它向被发送的资源分派一个唯一的标识符。
对于可以使用多种URL请求的资源,ETag可以用于确定实际被发送的资源是否为同一资源。
例如:ETag: "208f-419e-30f8dc99"
Expires 指定实体的有效期。例如:Expires: Mon,05 Dec 2008 12:00:00 GMT
Form 一种请求头标,给定控制用户代理的人工用户的电子邮件地址。例如:From: webmaster@myweb.com
Host 被请求资源的主机名。对于使用HTTP/1.1的请求而言,此域是强制性的。例如:Host: www.myweb.com
If-Modified-Since 如果包含了GET请求,导致该请求条件性地依赖于资源上次修改日期。
如果出现了此头标,并且自指定日期以来,此资源已被修改,应该反回一个304响应代码。
例如:If-Modified-Since: Mon,10PR 18:42:51 GMT
If-Match 如果包含于一个请求,指定一个或者多个实体标记。只发送其ETag与列表中标记区配的资源。
例如:If-Match: "208f-419e-308dc99"
If-None-Match 如果包含一个请求,指定一个或者多个实体标记。资源的ETag不与列表中的任何一个条件匹配,操作才执行。
例如:If-None-Match: "208f-419e-308dc99"
If-Range 指定资源的一个实体标记,客户端已经拥有此资源的一个拷贝。必须与Range头标一同使用。
如果此实体自上次被客户端检索以来,还不曾修改过,那么服务器只发送指定的范围,否则它将发送整个资源。
例如:Range: byte=0-499<CRLF>If-Range:"208f-419e-30f8dc99"
If-Unmodified-Since 只有自指定的日期以来,被请求的实体还不曾被修改过,才会返回此实体。
例如:If-Unmodified-Since:Mon,10PR 18:42:51 GMT
Last-Modified 指定被请求资源上次被修改的日期和时间。例如:Last-Modified: Mon,10PR 18:42:51 GMT
Location 对于一个已经移动的资源,用于重定向请求者至另一个位置。
与状态编码302(暂时移动)或者301(永久性移动)配合使用。
例如:Location: http://www2.myweb.com/index.jsp
Max-Forwards 一个用于TRACE方法的请求头标,以指定代理或网关的最大数目,该请求通过网关才得以路由。
在通过请求传递之前,代理或网关应该减少此数目。例如:Max-Forwards: 3
Pragma 一个通用头标,它发送实现相关的信息。例如:Pragma: no-cache
Proxy-Authenticate 类似于WWW-Authenticate,便是有意请求只来自请求链(代理)的下一个服务器的认证。
例如:Proxy-Authenticate: Basic realm-admin
Proxy-Proxy-Authorization 类似于授权,但并非有意传递任何比在即时服务器链中更进一步的内容。
例如:Proxy-Proxy-Authorization: Basic YXV0aG9yOnBoaWw=
Public 列表显示服务器所支持的方法集。例如:Public: OPTIONS,MGET,MHEAD,GET,HEAD
Range 指定一种度量单位和一个部分被请求资源的偏移范围。例如:Range: bytes=206-5513
Refener 一种请求头标域,标明产生请求的初始资源。对于HTML表单,它包含此表单的Web页面的地址。
例如:Refener: http://www.myweb.com/news/search.html
Retry-After 一种响应头标域,由服务器与状态编码503(无法提供服务)配合发送,以标明再次请求之前应该等待多长时间。
此时间即可以是一种日期,也可以是一种秒单位。例如:Retry-After: 18
Server 一种标明Web服务器软件及其版本号的头标。例如:Server: Apache/2.0.46(Win32)
Transfer-Encoding 一种通用头标,标明对应被接受方反向的消息体实施变换的类型。例如:Transfer-Encoding: chunked
Upgrade 允许服务器指定一种新的协议或者新的协议版本,与响应编码101(切换协议)配合使用。
例如:Upgrade: HTTP/2.0
User-Agent 定义用于产生请求的软件类型(典型的如Web浏览器)。
例如:User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT; DigExt)
Vary 一个响应头标,用于表示使用服务器驱动的协商从可用的响应表示中选择响应实体。例如:Vary: *
Via 一个包含所有中间主机和协议的通用头标,用于满足请求。例如:Via: 1.0 fred.com, 1.1 wilma.com
Warning 用于提供关于响应状态补充信息的响应头标。例如:Warning: 99 www.myweb.com Piano needs tuning
www-Authenticate 一个提示用户代理提供用户名和口令的响应头标,与状态编码401(未授权)配合使用。响应一个授权头标。
例如:www-Authenticate: Basic realm=zxm.mgmt
Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=663161

 

评论 | 0 引用
Debug servlet
Java Web — 作者 freeatom @ 10:11
昨天编写一个servlet,功能很简单,但是死活就是出不来,报错

HTTP Status 500 -

type Exception report
message
description
The server encountered an internal error () that prevented it from fulfilling this request.
exception
javax.servlet.ServletException: Error instantiating servlet class
ConfigTestServlet
.......
.......

root cause
java.lang.IllegalAccessException: Class
org.apache.catalina.core.StandardWrapper can not access a member of
class ConfigTestServlet with modifiers ""
.......
.......

痛苦了一晚上,最后早上在很偶然的情况下,发现了servlet的域为默认,改成public后,直接pass。

 


评论 | 0 引用
张孝祥java精英培训班的入学测试题
J2SE — 作者 freeatom @ 22:45
java试题1:
请在一个类中编写一个方法,这个方法搜索一个字符数组中是否存在某个字符,如果存在,则返回这个字符在字符数组中第一次出现的位置(序号从0开始计算),否则,返回-1。要搜索的字符数组和字符都以参数形式传递传递给该方法,如果传入的数组为null,应抛出IllegalArgumentException异常。在类的main方法中以各种可能出现的情况测试验证该方法编写得是否正确,例如,字符不存在,字符存在,传入的数组为null等。
java试题2:
编写一个程序,这个程序把一个整数数组中的每个元素用逗号连接成一个字符串,例如,根据内容为[1][2][3]的数组形成内容为"1,2,3"的字符串。
java试题3:
编写一个程序,它先将键盘上输入的一个字符串转换成十进制整数,然后打印出这个十进制整数对应的二进制形式。十进制数转二进制数的方式是用这个数除以2,余数就是二进制数的最低位,接着再用得到的商作为被除数去除以2,这次得到的余数就是次低位,如此循环,直到被除数为0为止。其实,只要明白了打印出一个十进制数的每一位的方式(不断除以10,得到的余数就分别是个位,十位,百位),就很容易理解十进制数转二进制数的这种方式。这个程序要考虑输入的字符串不能转换成一个十进制整数的情况,并对转换失败的原因要区分出是数字太大,还是其中包含有非数字字符的情况。
java试题4:
请用移位的方式打印出一个十进制整数的十六进制形式。提示:按每4个二进制位对整数进行移位和去高位处理,得到的结果就是十六进制数的一位,然后按下面三种方式之一(作为作业,要求每种方式都用到)计算出一个十六进制数值对应的十六进制形式:
1)0-9之间的数值直接加上字符'0',9以上的数值减去10以后再加上字符'A'
2)定义一个数组,其中包含0-F这些字符,然后用要计算的数值作为数组的索引号,即可获得其对应的十六进制数据。
3)Character.forDigit静态方法可以将一个十六进制的数字转变成其对应的字符表示形式,例如,根据数值15返回字符'F'。
java试题5:
请结合我们的《javascript网页开发》一书中介绍的正则表达式与String.split方法,从"http://www.it315.org/get.jsp?user=zxx&pass=123"这样的URL地址中提取出每个参数的名称和值。这里要注意在正则表达式中要对?进行转义处理.
java试题6:
编写一个程序,用于实现文件的备份,程序运行时的命令语法为:
java MyCopy
java试题7:
请编写一个字符输入流的包装类,通过这个包装类对底层字符输入流进行包装,让程序通过这个包装类读取某个文本文件(例如,一个java源文件)时,能够在读取的每行前面都加上有行号和冒号。
java试题8:
在javascript视频的第七讲的第一个片断,也就是网站上提供的免费片断《正
则表达式的应用》中,讲到了将一个保存有ip地址与地区对照关系的文本文件
导入到数据库时,应该将其中的某些空格替换成逗号(,),即对于如下格式的
文本文件内容:
起始IP 结束IP 地区
---------------------------------------------------------------
61.54.231.245 61.54.231.245 河南省安阳市 新世纪网吧
61.54.231.246 61.54.231.246 河南省安阳市 未知地区
61.54.231.9 61.54.231.247 河南省安阳市 红日网吧
61.54.231.248 61.54.231.248 河南省安阳市 安阳师范学院
61.54.231.249 61.54.231.249 河南省安阳市 黑蜘蛛网吧(师范
学院附近)
应转换成下面的这种格式:
61.54.231.245,61.54.231.245,河南省安阳市 新世纪网吧
61.54.231.246,61.54.231.246,河南省安阳市 未知地区
61.54.231.247,61.54.231.247,河南省安阳市 红日网吧
61.54.231.248,61.54.231.248,河南省安阳市 安阳师范学院
61.54.231.249,61.54.231.249,河南省安阳市 黑蜘蛛网吧(师范学院
附近)
在视频教程中,讲解了使用UltraEdit的正则表达式替换功能来完成上面的转
换。从jdk1.4开始,java语言中提供用于处理正则表达式的相关API类和方法,
在jdk帮助文档中,查看String类的replaceAll方法,可以看到该方法就支持
类似UltraEdit的正则表达式替换功能。
任务:
阅读String.replaceAll方法的帮助,以及它提供的相关超链接,了解该方法的
用法后,编写一个java程序来自动实现上面的正则表达式替换,将a.txt替换
后的结果保存到b.txt文件中。另外,我们在实现IT315网站的ip地区查询系
统时,使用的是类似如下的sql语法:
select 地区 from ip表 where 用户ip>起始IP and 用户ip<结束ip
通过这条sql语句就可以查询出用户ip所对应的地区结果。由于用户ip与起始
ip和结束ip的比较属于字符串比较,如果用户ip为9.1.1.1,那么它与
61.54.231.245比较的结果就是前者大于后者,因为用户ip的第一个字符“9”
大于61.54.231.245中的第一个字符“6”。
现在请你想出一种解决办法,让上面的sql语句能够返回正确结果。提示:将
9.1.1.1变化成009.001.001.001后与061.054.231.245进行比较就可以了。
请按这种思路在你的程序中增加进行这种改变的正则表达式替换。注意,起始
IP和结束IP的四个字段都有可能是1位、2位或3位数字,例如,61.5.23.1。
在源程序中,要对程序代码的功能进行注释说明,提交你编写的程序给我们时,
请附带该程序的使用说明。

这套题,挺有意思的,比一般的培训机构的题都要难,我当时本想去培训的,就都做完了,题目中涉及到的一些东西可能大家有用到的时候,我把我的答案公布下:
第1题:
import java.io.*;
public class Search
{
static char ch;
private static int sh(char ch,char[] l)
{
if (l==null)
throw new IllegalArgumentException();
int result = -1;
for(int i=0;i<l.length;i++)
{
if(ch==l[i])
{
result=i;
break;
}
}
return result;
}

public static void main(String[] args) throws Exception
{
String str="";//用来存储原数组中的元素
//char[] charstr={'g','a','d'};
char[] charstr=null;
if (charstr!=null)
{
for (int i = 0; i < charstr.length; i++)
{
str = str + charstr[i];
}
}
System.out.println("The Source Text is:n"+str);
System.out.print("Please input a word to Search:");
InputStreamReader isr=new InputStreamReader(System.in);
BufferedReader br=new BufferedReader(isr);
ch=(char)br.read();
br.close();
System.out.println(sh(ch,charstr));
}
}
第2题:
public class Comma
{
private static String change(int[] group)
{
String result = "";
char buf=',';
try
{
for(int i=0;i<group.length;i++)
{
result=result+group[i];
if (i<group.length-1)
{
result = result + buf;
}
}
}
catch (RuntimeException e)
{
System.out.println("原始数组不能为null");
}
return result;
}

public static void main(String[] args)
{
//int[] group={1,2,3,4,5,6};
int[] group=null;
String result=change(group);
System.out.println(result);
}
}
第3题:
import java.io.*;
public class Dicemal
{
public static void main(String[] args) throws Exception
{
int shang=0,yu;
boolean flag=false;
System.out.println("请输入一个数字(最大值为<"+Integer.MAX_VALUE+"):");
InputStream is = System.in;
InputStreamReader isr=new InputStreamReader(is);
BufferedReader br=new BufferedReader(isr);
String str=br.readLine();
char[] ch=new char[str.length()];
str.getChars(0, str.length(), ch, 0);
for(int a=0;a<str.length();a++)
{
if(!Character.isDigit(ch[a]))
{
System.out.println("有非数字字符");
System.exit(0);
}
}
try
{
shang=Integer.parseInt(str);
flag=true;
}
catch(Exception e)
{
System.out.println("数字过大");
}
str="";
if (flag)
{
while (shang != 0)
{
yu = shang % 2;
shang = shang / 2;
str = yu + str;
}
}
System.out.println(str);
}
}
第4题:
public class Hex
{
public static void main(String[] args)
{
int s=777777777;
int h=0x0000000f;
int m=0;
int[] buf=new int[8];
System.out.println(s);
for(int i=0;i<8;i++)
{
m=s&h;
s=s>>4;
buf[i]=m;
}
System.out.println("1st:"+first(buf));
System.out.println("2nd:"+second(buf));
System.out.println("3rd:"+third(buf));
}

private static String first(int[] buf)
{
String f="";
char c=0;
char a=0;
for(int i=0;i<8;i++)
{
if(buf[i]<=9)
{
a=(char) ('0'+buf[i]);
f=a+f;
}
else
{
c=(char) ((buf[i]-10)+'A');
f=c+f;
}
}
return f;
}

private static String second(int[] buf)
{
String s="";
char[] ch={'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
for(int i=0;i<8;i++)
{
s=ch[buf[i]]+s;
}
return s;
}

private static String third(int[] buf)
{
String t="";
for(int i=0;i<8;i++)
{
t=Character.forDigit(buf[i], 16)+t;
}
return t;
}
}
第5题:
package regex;
public class Regex
{
public static void main(String[] args)
{
String strMar="http://www.it315.org/get.jsp?user=zxx&pass=123";
String[] str0,str1,str2;
str0=strMar.split("?");
System.out.println(str0[1]);
str1=str0[1].split("=");
str2=str1[1].split("&");
System.out.println("name1="+str1[0]+'n'+"value1="+str2[0]+'n'+"name2="+str2[1]+'n'+"value2="+str1[2]);
}
}
第6题:
import java.io.*;
public class Copy
{
public static void main(String[] args)
{
if(args.length<2)
{
System.out.println("请按java MyCopy <sourcefile> <destfile> 格式输入。");
System.exit(0);
}
File Source=new File(args[0]);
File Dest=new File(args[1]);
fileIO(Source,Dest);
}

private static void fileIO(File Source,File Dest)
{
byte[] buf=null;
try
{
FileInputStream fis=new FileInputStream(Source);
BufferedInputStream bis=new BufferedInputStream(fis);
FileOutputStream fos=new FileOutputStream(Dest);
BufferedOutputStream bos=new BufferedOutputStream(fos);
buf=new byte[1024];
int len=0;
while((len=bis.read(buf))!=-1)
{
bos.write(buf,0,len);
}
bis.close();
bos.close();
}
catch (Exception e)
{
System.out.println("文件复制失败,请检查。");
System.exit(0);
}
}
}
第7题:
package stream;
import java.io.*;
public class FileReader
{
public FileReader(File f)
{
try
{
FileInputStream fis=new FileInputStream(f);
InputStreamReader isr=new InputStreamReader(fis);
BufferedReader br=new BufferedReader(isr);
String strLine = "";
int i=0;
while((strLine=br.readLine())!=null)
{
i++;
strLine=i+":"+strLine;
System.out.println(strLine);
}
br.close();
}
catch (Exception e)
{
e.printStackTrace();
}
}
}

package stream;
import java.io.File;
class Test
{
public static void main(String[] args)
{
File f=new File("1.txt");
new FileReader(f);
}
}
第8题:
package ip;
import java.io.*;
import java.util.regex.*;
public class Ip
{
private static void fileIO(File f)
{
String strLine;
@SuppressWarnings("unused")
String line=System.getProperty("line.separator");//换行符
try
{
FileInputStream fis=new FileInputStream(f);
InputStreamReader isr=new InputStreamReader(fis);
BufferedReader br=new BufferedReader(isr);
FileOutputStream fos=new FileOutputStream("c://b.txt");
OutputStreamWriter osw=new OutputStreamWriter(fos);
BufferedWriter bw=new BufferedWriter(osw);
Pattern p = Pattern.compile("((2[0-4]d|25[0-5]|[01]?dd?).){3}(2[0-4]d|25[0-5]|[01]?dd?)");
//正则表达式匹配分别是(200-249|250-255|001-199)
Matcher m;
while((strLine=br.readLine())!=null)
{
strLine=strLine.replaceAll("(?<=d)s+",",");//加逗号
m=p.matcher(strLine);//加载第一行
while(m.find())
{
String buf=m.group();
strLine=m.replaceAll(change(buf));//以"."分割成数字,然后分别补零,再合并
System.out.println(strLine);
bw.write(strLine);//输入一行,不包括换行符
bw.write(line);//输入行分割符
}

}
br.close();
bw.close();
}
catch (FileNotFoundException e)
{
System.out.println("原始文件未找到");
}
catch (IOException e)
{
e.printStackTrace();
}

}

private static String fill(String str)
{
while(str.length()<3)//不足的数字补零
{
str='0'+str;
}
return str;
}

private static String change(String buf)
{
String temp = "";
String ret = "";
String[] str=buf.split(".");//以"."分割,存入数组
ret = fill(str[0]);//第一个不需要在前面加"."
for(int i=1;i<str.length;i++)
{
temp = fill(str[i]);//补零
ret = ret + "." + temp;//合并
}
return ret;
}
public static void main(String[] args)
{
File f=new File("c://a.txt");//读原始文件
fileIO(f);
}
}