关于HtmlParser提取标签不完整的问题(HtmlParser扩展)
来源:互联网 发布:js 定时执行一次 编辑:程序博客网 时间:2024/05/22 07:45
HtmlParser可用来解析html,但它并不认识所有标签,如font,strong和自定义标签...而遇到它不认识的标签时提取出来的内容只会是这个标签的开始标签.
例如有段Html是<strong>加粗字体</strong> ,如果用NodeList nodeList = parser.parser(new TagNameFilter("strong"));提取的话结果就是<strong> .如果想让提取结果是完整的<strong>加粗字体</strong>,则要扩展HtmlParser,让它认识这个标签,方法是自定义一个类继承自HtmlParser,然后利用PrototypicalNodeFactory在静态代码块中注册新的标签.当然,新的标签类是事先写好的,代码如下:
扩展的新标签类如下:
在需要创建HtmlParser对象时只需创建MyParser对象即可.
另附
htmlparser.jar: http://download.csdn.net/source/3099671
htmllexer.jar:http://download.csdn.net/source/3099676
- 关于HtmlParser提取标签不完整的问题(HtmlParser扩展)
- 关于扩展HTMLParser,解决自定义tag的问题
- htmlparser 自定义标签的扩展 注册
- HTMLParser使用详解(5)- 扩展 HTMLParser 对自定义标签的处理能力
- HTMLParser使用详解(5)- 扩展 HTMLParser 对自定义标签的处理能力
- 扩展 HTMLParser 对自定义标签的处理能力
- 扩展HTMLParser 对自定义标签的处理能力
- 扩展 HTMLParser 对自定义标签的处理能力
- 扩展 HTMLParser 对自定义标签的处理能力
- 扩展 HTMLParser 对自定义标签的处理能力
- 扩展HTMLParser对自定义标签的处理能力
- 自定义HTMLParser的复合标签
- HTMLParser
- HTMLParser
- htmlparser
- htmlparser
- htmlparser
- HTMLParser
- tomcat安装后访问不了(404)
- 谭谭成都纯红太阳
- 文本框限制字符数的方案
- Lazarus中TrayIcon的图标运用(Windows)
- java读取配置文件
- 关于HtmlParser提取标签不完整的问题(HtmlParser扩展)
- Qt 嵌入式底下解决绿背景色
- EXECUTE IMMEDIATE的用法
- PMP知识点总结—合同类型
- Android 判断屏幕滑动
- SELECT INTO 和 INSERT INTO SELECT 两种表复制语句
- Oracle 非系统表空间'noncrit ' 无法使用系统回退段
- vc中error LNK2001:unresolved external symbol _WinMain@16的解决方法
- VC中的PPT编程