C#去除HTML标签

来源:互联网 发布:社会工程学数据库 编辑:程序博客网 时间:2024/05/22 17:29

C#去除HTML标签

在做网站的时候,用到了去除html标签的问题,用正则匹配到html标签,然后replace即可。

public static string ReplaceHtmlTag(string html, int length = 0){    string strText = System.Text.RegularExpressions.Regex.Replace(html, "<[^>]+>", "");    strText = System.Text.RegularExpressions.Regex.Replace(strText, "&[^;]+;", "");    if (length > 0  && strText.Length > length)        return strText.Substring(0, length);    return strText;}

这个方法可以实现去除html标签的功能。

Length参数可以根据传入值取固定长度的值。用于生成文章摘要比较方便。

原文地址:http://www.cnblogs.com/youring2/archive/2013/04/03/2997826.html