(转)获取HTML页面内容后格式化显示的办法
来源:互联网 发布:王通seo教程 编辑:程序博客网 时间:2024/05/18 22:17
获取html页面内容的方法有很多了,一般都是连接上以后取得页面的内容,然后进行分析。一般用JDK里面提供的 URL和URLConnection 类,就可以实现;当然,也可以用其他工具来实现,比如 httpunit(用这个有时候会有问题,如果页面里面有反盗链的设置或者其他一些有问题的代码,很可能就连接不上了)。 如果单纯只是想得到页面的内容,用JDK里面提供的类就足够。
得到了页面内容以后,怎么显示在我们自己的页面上面呢?特别是要显示在TEXTAREA这样的区域里面就会有点点麻烦。
因为我们获得的内容里面有html标记和javascript标记,或者css标记。
如果直接把这些内容打印出来,或者直接放到TEXTAREA里面,就会报错。。怎么来解决?
一般大家都会想到用字符串来替换,比如 把"<"替换成"[" 等等,或者用正则表达式,来过滤这些标记。
其实有一直很简单方法,就是把得到的页面内容放在<div></div>中间,例如:
<div id="content" style="display:none;">
.........
</div>
然后用javascript来取content,
function show()
{
form1.content.value = document.getElementById("content").innerText;
}
这样就自动过滤了那些烦人的标记了哦!!
- (转)获取HTML页面内容后格式化显示的办法
- (转)获取HTML页面内容后格式化显示的办法
- edittext显示html格式化的内容,修改内容后 获取带html格式的内容并上传到服务器
- 获取html页面内容
- 数据库的html内容显示到页面
- 获取html页面内容的方法
- 2014.12.1 格式化后页面不能正常显示的bug
- jQuery在异步请求数据返回后,调用$("selector").html(data.content);之后因为一些特殊字符或者',"不能显示内容的问题解决办法
- 在HTML页面上竖着显示内容的方法
- 浏览器加载显示html页面内容的顺序分析
- 浏览器加载显示html页面内容的顺序
- 浏览器加载显示html内容页面的顺序
- 从html页面获取纯文本文件替换其中的内容
- Android ios获取html页面的标签内容
- 安装SSL证书后,解决混合内容造成页面错误提示的处理办法
- 安装SSL证书后,解决混合内容造成页面错误提示的处理办法
- js解析xml后显示html页面的兼容性问题
- html上传图片后,在页面显示上传的图片
- 在XML配置文件中输出&符号
- 状态模式
- 项目管理"九要"与"八不要"
- 软件工程心理学之---让客户知错,但不能向你发怒
- php.ini中几个参数的设置
- (转)获取HTML页面内容后格式化显示的办法
- mysql 优化心得
- PHP拾遗2
- php拾遗1
- form的自动提交
- struts 2 结合json
- ruby rails 笔记1
- 卸载ruby on rails
- java里的验证码