从xml中提取所有的文本
来源:互联网 发布:电驴连不上kad网络 编辑:程序博客网 时间:2024/05/16 07:16
今天遇到一个需求:从xml中提取所有的文本(或者说是 xml去标签)。 写了一会儿,觉得可能别个兄弟也会遇到,就拿出来,看这样妥不妥~
(用dom4j进行解析的)
/** * 提取分散在xml串中的文本 * @param xml 如:"<a>这<span>是<span>我</span><span>的</span>标题</span>!</a>!!" => 这是我的标题!!! * @return */private String getTextFromXml(String xml) {Document doc;try {//保证有一个根节点 所以加了一个warp节点doc = DocumentHelper.parseText("<warp>"+xml+"</warp>");Element root = doc.getRootElement();clearElement(root);return root.getTextTrim();} catch (DocumentException e) {e.printStackTrace();}return null;}/** * 把 所有子节点 删除掉,但保留节点下面的所有内容 * @param ele * @return */private Text clearElement(Element ele) {List elepar = ele.content();Object tempObj;for (int i = 0; i < elepar.size(); i++) {tempObj = elepar.get(i);if (tempObj instanceof Element) {elepar.set(i, clearElement((Element) tempObj));}}return elepar.size() > 0 ? DocumentHelper.createText(ele.getTextTrim()) : DocumentHelper.createText("") ;}
- 从xml中提取所有的文本
- 从文本中提取所有的单词
- 从图片中提取文本
- set应用:提取文本中所有不同的单词
- [原创]从RTF格式 的文件中提取文本。
- 利用sed从文本中提取字符串的方法
- 提取xml中所有节点的text数据
- 从指定文本中提取图片
- 从 Android 程序中提取文本资源
- 从文本中提取特定信息
- JAVA从html中提取纯文本
- cut-从文本流中提取文本列
- 从html富文本中提取纯文本
- Java实现从Html文本中提取纯文本
- 获得Xml中所有属性及文本
- 从文本中取出所有ip
- 从XML文件中获取格式化的文本信息
- 使用java正则表达式提取文本中所有邮箱地址
- c++ string 转化大小写
- jetty配置
- 开源 免费 java CMS - FreeCMS1.3 标签 channelPath
- SGU 261 Discrete Roots (经典K次剩余)
- 无法解决 equal to 操作中的 **** 和 *******排序规则冲突
- 从xml中提取所有的文本
- 遍历Map
- Validate Binary Search Tree
- JSP九大内置对象
- Android仿QQ微信开场导航以及登陆界面
- 版本规则(收费版-C店)
- IE、FF、Safari、OP不同浏览器兼容报告
- 一道面试题分析
- JavaScript trim函数