Android提取HTML代码内的所有文字内容
来源:互联网 发布:淘宝拍摄基地 编辑:程序博客网 时间:2024/06/03 15:39
需求是:TextView只显示HTML里的纯文字内容,去掉CSS样式、超链接、图片等等。
解决方法:
- 查找Java或者Android有没有提供API直接操作HTML字符串的。暂时未发现有,懒得深入去找了。。。
- 用正则表达式匹配并清除掉各种HTML标签。嗯,就这样干。
具体实现:
1. 匹配HTML代码中的缩进、换行等格式,正则表达式如下:
String regFormat = "\\s*|\t|\r|\n";
2. 匹配所有的标签,正则表达式如下:
String regTag = "<[^>]*>";
3. 执行上面两条匹配规则,将匹配到的内容replace为空字符串,也就一行代码:
String text = htmlStr.replaceAll(regFormat,"").replaceAll(regTag,"");
大功告成。
阅读全文
0 0
- Android提取HTML代码内的所有文字内容
- Android中如何提取HTML源码内的所有文字内容
- php中去除文字内容中所有html代码
- 从HTML代码中提取文字,去掉HTML的标记
- 提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- [转]提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- 提取HTML代码中的文字的ASP实现
- 提取HTML代码中文字的C#函数
- 提取HTML代码中文字的C#函数
- 提取Html内容中的所有图片信息
- NFS文件共享服务器的搭建
- 网页内容抓取之确定网页是否gzip压缩
- Socket编程-QHZ
- css 中的小技巧和存在的坑
- rabbitmq常见运维命令和问题总结
- Android提取HTML代码内的所有文字内容
- jsp判断用户是否登录
- 测试理论基础
- 1217: 二进制计算
- 第一次课安卓
- MatConvNet 网络模型结构可视化的方法
- Swift在同一条语句中传递方法结果到方法参数情况的处理
- duilib——WindowImplBase的使用
- cglib动态代理介绍