使用C#将HTML文本转换为普通文本,去掉所有的Html标记
来源:互联网 发布:防止微信屏蔽分享域名 编辑:程序博客网 时间:2024/05/01 00:37
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Text.RegularExpressions;namespace WindowsFormsApplication1{ public class Class1 { /// <summary> /// 将html文本转化为 文本内容方法NoHTML /// </summary> /// <param name="Htmlstring">HTML文本值</param> /// <returns></returns> public string NoHTML(string Htmlstring) { //删除脚本 Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase); //删除HTML Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"([/r/n])[/s]+", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "/", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "/xa1", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "/xa2", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "/xa3", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "/xa9", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&#(/d+);", "", RegexOptions.IgnoreCase); //替换掉 < 和 > 标记 Htmlstring.Replace("<", ""); Htmlstring.Replace(">", ""); Htmlstring.Replace("/r/n", ""); //返回去掉html标记的字符串 return Htmlstring; } }}
0 0
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- C#将HTML文本转换为普通文本,去掉所有的Html标记
- 去掉表格HTML标记后的文本
- 将 文本格式标记 转化为 html格式标记
- 使用正则表达式将Html转换为纯文本
- 使用正则表达式将Html转换为纯文本
- 使用正则表达式将Html转换为纯文本
- js将html转换为纯文本
- C#实现将HTML转换成纯文本的方法
- 将文本格式的文章转换为html/xml格式文本的功能封装到Javabean
- C#将内容附带的html标签去掉转成纯文本方法
- HTML文本标记--2
- HTML之文本标记
- 将Unicode转换为普通文本
- 如何将HTML转换为纯文本格式Text
- 数据库管理平台
- 学习记录——网络层(4)
- Effective java读书笔记
- 一种更通用的编译期反射
- 笔记,执行mybatis自动映射的语句
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- codevs 1638_洛谷 1111_修复公路_并查集
- 网站美化常见CSS
- delphi 用别名的方式访问excel写入数据,实现非标格式报表输出
- 浅谈CSS3新特性——动画animation
- 支付
- handler的使用
- c++类 class
- TP 框架使用时的盲点