如何使用正则表达式删除html语言中的html标记

来源:互联网 发布:techrules 知乎 编辑:程序博客网 时间:2024/06/03 19:11
System.Text.RegularExpressions.Regex.Replace(TempContent,"<\/?[^>]+>","")搜索
贪婪匹配,
因为所有的HTML标签都是由<>组成的,所以我的方法是找所有具有"<"和">"的组合,
<\/?[^>]+>的思想是先找到"<",然后再匹配是否有"/"符号,并且用\

做转义,而?的作用是匹配前面的字符0次或一次,也就是说有“/”这个符号或者是没有这个符号都算匹配成功,继续,[^>] 的意思是不为">"的字符,然后[^>]+中的“+”是匹配一次或者多次,也就是一直匹配到不为">"字符,然后呢,再把">"字符加上,就是最终的匹配结果了。呵呵


补充:Regex.Replace(TempContent,"<[^>]*>","")

原创粉丝点击