JAVA 清除 html标签

来源:互联网 发布:淘宝新店扶持政策 编辑:程序博客网 时间:2024/05/17 04:18
import java.util.regex.Matcher;
import java.util.regex.Pattern;

publicclassHTMLSpirit{

privatestaticfinalString regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>";// 定义script的正则表达式
privatestaticfinalString regEx_style="<style[^>]*?>[\\s\\S]*?<\\/style>";// 定义style的正则表达式
privatestaticfinalString regEx_html="<[^>]+>";// 定义HTML标签的正则表达式

publicstaticString delHTMLTag(String htmlStr){
Pattern p_script =Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
Matcher m_script = p_script.matcher(htmlStr);
htmlStr= m_script.replaceAll("");// 过滤script标签

Pattern p_style =Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
Matcher m_style = p_style.matcher(htmlStr);
htmlStr= m_style.replaceAll("");// 过滤style标签

Pattern p_html =Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
Matcher m_html = p_html.matcher(htmlStr);
htmlStr= m_html.replaceAll("");// 过滤html标签

return htmlStr.trim();// 返回文本字符串
}

}
0 0
原创粉丝点击