正则取嵌套标签内容
来源:互联网 发布:淘宝店铺发布宝贝品牌 编辑:程序博客网 时间:2024/05/29 08:10
最近在写新闻发布系统,博客都好久没有更新了,感觉有点惭愧。
今天正好写到获取编辑器编辑后存放在数据库的文字,想了快一天了,才把获取内容弄成功。
例如这样一个标签:
<p style="margin-bottom: 5px;"> asd15:44:08 <a href="http://aaa" target="_self">哈哈哈哈123</a> asdasd <b>这asdasdasfasd里是b标签</b></p>这是用编辑器(也就是写这篇博客的编辑器写完后存储的格式)随便弄了点内容,想要获取里面的内容
asd15:44:08哈哈哈哈123asdasd这asdasdasfasd里是b标签 这就是内容。
刚开始在网上找了找,写出来的是这样的:
Pattern p=Pattern.compile("<p*?>(.*?)</p>");
但是这种方式并不能嵌套,只能输出p标签以内的。
public void setNews_abstract(String news_abstract) {//System.out.println("原数据"+news_abstract);if (news_abstract==null || news_abstract.trim().isEmpty()) {StringBuilder sBuilder = new StringBuilder();//.*具有贪婪的性质,首先匹配到不能匹配为止,根据后面的正则表达式,会进行回溯。//.*?则相反,一个匹配以后,就往下进行,所以不会进行回溯,具有最小匹配的性质。// Pattern p=Pattern.compile("<span .*?>(.*?)</span>");// Pattern p=Pattern.compile("<p.*?>(.*?)</p>");// Pattern p=Pattern.compile("<p.*?>(.*?[^<.*?></.*?>]+)</p>");// Pattern p=Pattern.compile("<.*?>(.*?)</.*?>"); Pattern p=Pattern.compile(".*?>(.*?)<.*?");// Pattern p=Pattern.compile(">(.*?)<"); Matcher m=p.matcher(this.body); while(m.find()){ sBuilder.append(m.group(1)); } if (sBuilder.length()>20) { System.out.println(sBuilder);// System.out.println(sBuilder.length()+":长度---"); System.out.println(sBuilder.substring(0,20));this.news_abstract = sBuilder.substring(0,20);//当没有用户没输入摘要时,自动截取内容前20字。//System.out.println("现数据。。。"+this.news_abstract);//System.out.println("body :"+body.substring(0, 4));//System.out.println("body :"+Arrays.toString(body.split("><")));//System.out.println("现数据---"+news_abstract);}}}做的是一个获取摘要如果大于20个字就截取,用在新闻网页所以20字就足够了。
Pattern p=Pattern.compile(".*?>(.*?)<.*?"); 这样就是获取 左右两遍随便什么内容>这里面的内容<左右两遍随便什么内容
由于是刚刚做出来就给大家分享了下成功的喜悦,如果有什么不足和缺陷请联系我!
0 0
- 正则取嵌套标签内容
- 正则取a标签的内容
- 正则取出某class或id的嵌套标签内容
- 知道标签html中的标签,我的取包括标签的标签内的内容使用的正则表达式()
- 关于正则表达式 PHP正则表达式匹配嵌套HTML标签的方法和技巧 不定期更新关于正则内容
- 正则表达式匹配嵌套标签
- 如何匹配嵌套Html标签(正则表达式)
- 使用正则表达式匹配嵌套Html标签
- 使用正则表达式匹配嵌套Html标签
- 使用正则表达式匹配嵌套Html标签
- 使用正则表达式匹配嵌套Html标签
- 嵌套标签以及标签内容垂直水平居中
- 易语言正则表达式取数据内容
- 正则表达式的贪婪模式和非贪婪模式,如何取div ,li 标签的循环内容,采集别人网站的内容
- java list嵌套list数据 s标签取值
- 如何用正则获取span标签内容????????
- 正则获取<a></a>标签内容
- 正则表达式 提取 html 标签的内容
- 10、黑马程序员——反射+正则
- iOS开发NSTimer闪烁问题
- 个兼容库很容易和之前的 Android Support Library 22.1混淆,都是兼容库,
- 数据查询及分组的有关的知识点
- 数据库压缩备份|还原
- 正则取嵌套标签内容
- BZOJ 2301 - 莫比乌斯反演 + 前缀和 + 分块计算
- Pentaho 5.4.0 安装及mysql配置
- BZOJ1996: [Hnoi2010]chorus 合唱队|动态规划
- 为何要学编程?如何学编程?用什么语言最好?有什么好书?
- OC—dictionary
- mysql 查看锁表解锁
- cvCvtPixToPlane & cvCvtPlanetoPix
- git 终端命令