获取网页中匹配代码的正则 (获得字符串中开始和结束字符串中间得值)
来源:互联网 发布:软件授权销售协议 编辑:程序博客网 时间:2024/06/16 10:10
来自:http://www.cnblogs.com/Fooo/archive/2010/10/22/1858121.html
如:
<div>1div</div>
<a>1a</a>
<p>1p</p>
<p>2p</p>
<div>2div</div>
<a>2a</a>
<p>3p</p>
<p>4p</p>
<a>3a</a>
<p>5p</p>
<div>3div</div>
<a>4a</a>
<p>6p</p>
<span>1span</span>
现在的问题是:有N多DIV,N多p,N多A标签以及最多1个span,想只获取所有p里的内容以及最后一个span里的内容(其中获取P的内容有一个条件,那就是只有前面有一个A标签的P的内容才会被获取),span或许有或许没有,如果有就获取,如果没有就不获取求:
<div>1div</div>
<a>1a</a>
<p>1p</p>
<p>2p</p>
<div>2div</div>
<a>2a</a>
<p>3p</p>
<p>4p</p>
<a>3a</a>
<p>5p</p>
<div>3div</div>
<a>4a</a>
<p>6p</p>
<span>1span</span>
现在的问题是:有N多DIV,N多p,N多A标签以及最多1个span,想只获取所有p里的内容以及最后一个span里的内容(其中获取P的内容有一个条件,那就是只有前面有一个A标签的P的内容才会被获取),span或许有或许没有,如果有就获取,如果没有就不获取求:
C#的正则表达式
using System.Text.RegularExpressions;
或是用
或是>>>>>>获得字符串中开始和结束字符串中间得值
//正则抽取单个Table , 可根据table内的某个标识字符, good !
如果仅仅是以“会员资料”这样的做为参考标识,用我上面写的稍稍改造就可以了,问题的复杂在于,如果以“00”或者“444”做为参考标识,就要考虑到<table>标签嵌套的问题,既要保证取包含参考标识的最内层<table>,又要保证<table>和</table>配对匹配
输入的参考标识中如果有正则中有特殊意义的字符,需要对其进行预处理,另外需要在程序中进行异常处理,这个自己处理下吧
如果源字符串中同时多处出现输入的参考标识,这里取第一个出现的参考标识所在的<table>
//正则抽取单个Table中 , 解析tb中的内容.........
- 获取网页中匹配代码的正则 (获得字符串中开始和结束字符串中间得值)
- 获得字符串中开始和结束字符串中间得值
- .Net 获得字符串中开始和结束字符串中间得值
- 指定开始字符串和结束字符串,截取中间的字符
- js方法中获取开始标签和结束标签中间插入内容的方式(innerHTML/html())
- php正则表达式 获取开始字符串和结束字符串中的部分内容
- JS正则表达式获取字符串中得特定字符
- 消除字符串开始和结束处的空格,并合并中间多余的空格
- ruby 取字符串中与正则表达式匹配的值
- java正则匹配替换字符串中ip格式的字符串
- 查找所字符串中开始字符和结束字符之间的所有字符
- 删除字符串开始和结束的空格。
- 在一个字符串中匹配出两个字节中间的字符串
- PHP和javascript中使用正则表达式匹配中文字符串
- 正则表达式匹配以某字符串开始和结尾的字符串
- 获得两个字符串中间的字符串
- Java正则表达式获得字符串中数字
- Java正则表达式获得字符串中数字
- 榨干 PHP,不得不转的一篇PHP使用技巧!
- 毫秒级百万数据分页存储过程[转载]
- libusb设置环境变量
- MSDN一篇很好的WCF入门教程
- ActiveX开发
- 获取网页中匹配代码的正则 (获得字符串中开始和结束字符串中间得值)
- ActiveX开发
- 关于WinCE5.0 IP地址固定的问题
- JavaScript中的Math.cell() 、Math.round() 、Math.floor()
- 2008R2Win7管理一创建域和加入域
- 翻页程序——每个合格程序员的必会程序
- 英语中100最常拼错的单词
- w3c标准&语义化&模块化
- MongoDB的应用:动态消息的设计实现