Java使用HtmlParse提取标签中的值
来源:互联网 发布:淘宝商城妈妈装 编辑:程序博客网 时间:2024/05/17 04:15
Java使用HtmlParse提取标签中的值
☆代码示例:
代码块语法遵循标准markdown代码,例如:
package cas;import org.htmlparser.Node;import org.htmlparser.NodeFilter;import org.htmlparser.Parser;import org.htmlparser.filters.StringFilter;import org.htmlparser.filters.TagNameFilter;import org.htmlparser.tags.ImageTag;import org.htmlparser.util.NodeList;/** * Html 中的body体中提取出Img标签中的src值 * * @author XY * */public class CASHtmlImgConvert { public static void main(String[] args) {//演示 String[] oldSrcPath=changeImgSrc("<img alt=\"\" src=\"http://www.czb8688.com/attached/image/20160116/20160116141455_775.jpg\" />"); if(oldSrcPath!=null){ for(String str:oldSrcPath){ System.out.println(str); } } } public static boolean isEmpty(String str){ if(str!=null&&(!str.equals(""))) return false; else return true; } /** * * @param htmlPath 本地的html路径 或者body */ private static String[] changeImgSrc(String htmlPath) { StringBuilder oldSrcPath = new StringBuilder(); try { Parser parser = new Parser(htmlPath); //标签名过滤器 NodeFilter filter = new TagNameFilter ("img"); NodeList nodes = parser.extractAllNodesThatMatch(filter); Node eachNode = null; ImageTag imageTag = null; if (nodes != null) { // 遍历所有的img节点 for (int i = 0; i < nodes.size(); i++) { eachNode = (Node)nodes.elementAt(i); if (eachNode instanceof ImageTag) { imageTag = (ImageTag)eachNode; // 获得html文本的原来的src属性 String path=imageTag.getAttribute("src"); if(path.startsWith("")) path="http://www.czb8688.com"+path; oldSrcPath .append(path+","); } } } } catch (Exception e) { e.printStackTrace(); } String str=oldSrcPath.toString(); //返回图片数组 return str.substring(0,str.length()-1).split(","); } }
0 0
- Java使用HtmlParse提取标签中的值
- JAVA中使用Htmlparse解析HTML文档,使用htmlparse遍历出HTML文档的所有超链接(标记)
- 如何使用java的正则表达式提取html标签?
- JAVA中利用Htmlparse解析HTM…
- java:使用正则提取字符串中的数字(例如提取短信中的验证码)
- java使用正则提取字符串中的数字(例如提取短信中的验证码)(未测试)
- Textrank权值提取文本标签提取
- <PY>提取kindle中的标签和笔记
- python使用正则表达式提取html标签
- Java提取字符串中的汉字
- Java提取字符串中的手机号
- java 提取引号中的内容
- java提取字符串中的汉字
- java提取字符串中的中文
- java提取字符串中的数值
- HTMLParse class
- JAVA 中 提取 JSON 字符串中的 KEY 和 VALUE 值
- 使用java提取pdf内容
- 做一个自己的MVC框架[php]
- NUMA架构的CPU
- 输入一个数插入有序数组中
- 微信分享 解决留在微信时没有回调结果的问题(不保证所有的都成功)
- php 字符串大小写转换
- Java使用HtmlParse提取标签中的值
- 小米5的的开发环境配置
- 兔子产子问题
- 欢迎使用CSDN-markdown编辑器
- codeforces 734 (思维 暴力)
- Path进阶
- 打包的时候 nsobjcruntime.h 报错
- UVA - 11604 General Sultan
- 在Windows下直接安装Tensorflow的Windows版本