文本标签过滤
来源:互联网 发布:百度大数据合作 编辑:程序博客网 时间:2024/05/22 14:44
<pre name="code" class="java">public class HtmlCleaner { private static Pattern p_script; private static java.util.regex.Matcher m_script; private static Pattern p_style; private static java.util.regex.Matcher m_style; private static Pattern p_html; private static java.util.regex.Matcher m_html; private static Pattern p_a; private static java.util.regex.Matcher m_a; private static String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>"; // 定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script> // } private static String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>"; // 定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style> // } private static String regEx_a = "<\\s*a\\s+([^>]*)\\s*>"; //过滤a的正则表达式 private static String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式 /** * Html2Text is used to clean the HTML tags in a String which is very useful * in the article component and so on * * @param inputString * the String which is needed to clean * @return String,the result of cleaning operation */ public static String filterHtmlToA(String inputString){ String htmlStr = inputString; // 含html标签的字符串 String textStr = ""; try { p_a = Pattern.compile(regEx_a,Pattern.CASE_INSENSITIVE); m_a = p_a.matcher(htmlStr); htmlStr = m_a.replaceAll(""); //过滤a标签 textStr = htmlStr; }catch (Exception e) { System.err.println("Html2Text: " + e.getMessage());} return textStr;// 返回文本字符串 } public static String filterHtmlTag(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textStr = ""; try { p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE); m_script = p_script.matcher(htmlStr); htmlStr = m_script.replaceAll(""); // 过滤script标签 p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE); m_style = p_style.matcher(htmlStr); htmlStr = m_style.replaceAll(""); // 过滤style标签 p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE); m_html = p_html.matcher(htmlStr); htmlStr = m_html.replaceAll(""); // 过滤html标签 textStr = htmlStr; } catch (Exception e) { System.err.println("Html2Text: " + e.getMessage()); } return textStr;// 返回文本字符串 }
0 0
- 文本过滤标签
- 文本标签过滤
- java 中过滤文本的HTML标签
- python 过滤文本中的HTML标签
- Java过滤HTML标签,获取纯文本
- python 正则表达式过滤文本中的html标签 源代码解析
- JAVA 过滤标签将html内容转换为文本
- JAVA 过滤标签将html内容转换为文本
- java过滤html标签获取纯文本信息
- 文本过滤
- 文本过滤
- 文本标签
- 文本标签
- 文本标签
- 解决FCKeditor在线文本编辑器自动过滤HTML标签的方法
- 摇滚21 选择标签至文本域效果,可多选/可过滤重复/可限制个数(已封装)
- Java过滤任意(script,html,style)标签符,返回纯文本--封装类
- Java过滤任意(script,html,style)标签符,返回纯文本--封装类
- jquery easyui combobox加载数量过多引起渲染页面缓慢问题
- Quartz定时调度CronTrigger时间配置格式说明与实例
- ValueError: setting an array element with a sequence.
- Stockbroker Grapevine(floyd+暴力枚举)
- 排序算法之快速排序
- 文本标签过滤
- android 记录一下自己的微信支付
- Java并发编程:线程池的使用
- JSP文件保存的编码与页面中的pageEncoding和contentType之间的关系
- mysql琐碎知识点
- 正则表达式之掌握grep的用法
- Android ActionBar总结二
- 简单错误记录(华为16年研发试题)
- 开始Spring Cloud Config