取出文本中的html代码,利用正则表达式
来源:互联网 发布:建立网络英文怎么写 编辑:程序博客网 时间:2024/05/17 02:01
//这是获取纯文本的功能 String htmlStr = model.getContent(); //含html标签的字符串,model.getContent()是输入的文本 java.util.regex.Pattern p_script; java.util.regex.Matcher m_script; java.util.regex.Pattern p_style; java.util.regex.Matcher m_style; java.util.regex.Pattern p_html; java.util.regex.Matcher m_html; try{ String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>"; //定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script> } String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>"; //定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style> } String regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式 p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE); m_script = p_script.matcher(htmlStr); htmlStr = m_script.replaceAll(""); //过滤script标签 p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE); m_style = p_style.matcher(htmlStr); htmlStr = m_style.replaceAll(""); //过滤style标签 p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE); m_html = p_html.matcher(htmlStr); htmlStr = m_html.replaceAll(""); //过滤html标签 htmlStr=htmlStr.replace(" "," ");//这是过滤空格的标签,把原来的空格换成空格键 article.setTextStr(htmlStr); }catch(Exception e){ }
1 0
- 取出文本中的html代码,利用正则表达式
- java如何利用正则表达式去掉文本中的HTML标签
- [原创代码]用正则表达式剔除文本中的HTML标记
- 【.net】利用正则表达式过滤字符串中的HTML代码
- 利用正则表达式NSRegularExpression取出字符串中的Url
- 利用正则表达式去掉html代码
- 利用正则表达式去掉html代码
- 利用正则表达式去掉html代码
- 利用正则表达式除去html得到纯文本
- 取出webBrowser中的html代码?
- 用正则表达式剔除文本中的HTML标记
- python 正则表达式过滤文本中的html标签 源代码解析
- 正则表达式提取HTML文本中的图片图片
- 取出字符串中的数字----正则表达式
- 利用正则表达式过滤html代码(PHP)
- 利用正则表达式实现去除所有HTML标签代码
- C#中利用正则表达式去除HTML中的格式
- C#中利用正则表达式去除HTML中的格式
- 小计UIWindow
- jsp页面获取java生成的图片验证码
- 文章标题
- cocos-lua 延时执行 和 scheduler
- POJ2386-Lake Counting
- 取出文本中的html代码,利用正则表达式
- 导航栏是“返回”而不是“back”
- VS2013发布网站,IIS网站发布
- SGD中的Momentum
- inline之__attribute__((always_inline))
- Protocol Buffer与iOS的交互
- Delphi 静态局部变量的替换方法
- webview打开图库并获取安卓文件图片
- Android开发入门书籍强烈推荐