ASP.NET 清除 HTML 标记函数
来源:互联网 发布:管家婆211端口 编辑:程序博客网 时间:2024/05/18 00:25
Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase); 这个是正则替换函数,是一个静态方法并且是一个重载方法,需要四个参数: Regex.Replace(待替换的输入字符串,替换的正则表达式,替换后的文本,正则选项); 第四个参数是:RegexOptions.IgnoreCase,意思是忽略大小写。 对于上面的每一行我就说说是去除字符串中的什么文本的,你的一行对应我的一行: @"<script[^>]*?>.*?</script>"——去除字符串中的脚本,包含内嵌和引用外部的。 @"<(.[^>]*)>"——去除字符串中的html所有标签,如<a>,<div>,</p>等 @"([/r/n])[/s]+"——去除字符串中的所有换行、空格、非打印字符。 @"-->"——去除字符串中的所有注视的结束本分 @"<!--.*"——去除字符串中的所有注视的开始本分及注视 @"&(quot|#34);"——将所有html表示的反斜杠替换为 "/" @"&(amp|#38);"—— 将所有html表示的与符号替换为"&" @"&(lt|#60);",——将所有html表示的小于符号替换为"<" @"&(gt|#62);"—— 将所有html表示的大于符号替换为">" @"&(nbsp|#160);"——将所有html表示的空格符号替换为" " @"&(iexcl|#161);"——将所有html表示的¡符号替换为"/xa1" @"&(cent|#162);"——将所有html表示的¢符号替换为"/xa2" @"&(pound|#163);"—— 将所有html表示的£符号替换为"/xa3" @"&(copy|#169);"—— 将所有html表示的©符号替换为"/xa9" @"&#(/d+);"——去出其他所有不常见的html转移字符 Htmlstring.Replace("<", "");——去出其他所有<字符 Htmlstring.Replace(">", "");——去出其他所有>字符 Htmlstring.Replace("/r/n", "");——去出字符串中的换行。
以下是引用片段:
//清除HTML函数
public static string NoHTML(string Htmlstring)
{
//删除脚本
Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);
//删除HTML
Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "", RegexOptions.IgnoreCase);
Htmlstring.Replace("<", "");
Htmlstring.Replace(">", "");
Htmlstring.Replace("\r\n", "");
Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();
return Htmlstring;
}
- ASP.NET 清除 HTML 标记函数
- ASP.NET 清除 HTML 标记函数
- ASP.NET 清除 HTML 标记函数
- ASP.NET 清除所有HTML标记和JS标记
- 清除 HTML 标记函数
- ASP.NET 去除HTML标记 函数
- asp.net 清除HTML代码函数[转帖]
- ASP.net中写HTML标记符的函数
- asp.net去掉HTML标记
- 清除Html标记的一个封装函数
- 清除html标签 asp.net
- asp 清除html的函数
- JavaScript清除HTML标记
- asp.net如何去掉HTML标记
- ASP.NET 去除所有HTML标记
- asp.net如何去掉HTML标记
- asp.net如何去掉HTML标记
- ASP.net中去除HTML标记
- POJ 1664 放苹果(DFS)
- CC2530定时器使用
- Java中日期和时间的处理原理解析
- IOS创建静态库
- 【flash】抽奖程序资源
- ASP.NET 清除 HTML 标记函数
- Fileupload使用方法
- 各种内部排序方法简述以及优越性比较和选取
- Servlet 工作原理解析
- VDSO机制详细分析
- ie6.7设置display:none时仍占位
- Cocos2sd-x学习笔记(6)
- webstorm8 +node.js +express4.x 环境搭建 写一个hello world
- 2014程序化购买元年-芒果移动广告-王江