使用js实现基于可视布局信息的网页噪音去除的测试方法
来源:互联网 发布:美工刀片尺寸 编辑:程序博客网 时间:2024/05/02 00:03
可视布局信息的网页噪音去除方法很早就从网上看到,但是苦于没有java中没有简单的方法能够得到网页元素位于屏幕中的实际位置,所以一直没做过,前一段时间学js,突然发现js能很容易得到每个网页元素位于屏幕中的实际位置。所以就写了这个简单函数测试了一下,好像效果还不错,不过个人认为基于可视布局信息的网页噪音去除最好和其他的方法结合使用,单独使用准确率还不是很好。
<script language="JavaScript">
function getElementTagName(){
var h1 = 200;
var h2 = document.body.scrollHeight - 160;
var w1 = document.body.scrollWidth * 0.3;
var w2 = document.body.scrollWidth * 0.7;
//alert("width:" + document.body.scrollWidth + "height:" + document.body.scrollHeight);
var ele = document.getElementsByTagName("table");
alert("元素为table的个数:" + ele.length);
for (i = 0; i < ele.length; ++i) {
var temp = "";
var e = ele(i);
var x,y,w,h;
oRect = e.getBoundingClientRect();
x=oRect.left;
y=oRect.top;
w = e.offsetWidth;
h = e.offsetHeight;
temp = "table" + i;
if ((y + h) < h1)
alert(temp + "/r/nHEADER:/r/n/r/n" + e.innerText);
if (y >= h2)
alert(temp + "/r/nFOOTER:/r/n/r/n" + e.innerText);
if ((x + w) < w1)
alert(temp + "/r/nLM:/r/n/r/n" + e.innerText);
if (x >= w2)
alert(temp + "/r/nRM:/r/n/r/n" + e.innerText);
if ((y < h2) && ((y + h) >= h1) && (x < w2) && ((x + w) >= w1))
alert(temp + "/r/nCENTER:/r/n/r/n" + e.innerText);
//alert(temp);
//temp += "left:" + x;
//alert(temp);
//temp += "top:" + y;
//alert(temp);
//temp += "width:" + e.offsetWidth;
//alert(temp);
//temp += "height:" + e.offsetHeight;
//alert(temp + "/r/n/r/n" + e.innerText);
}
}
</script>
<script language="JavaScript">
function getElementTagName(){
var h1 = 200;
var h2 = document.body.scrollHeight - 160;
var w1 = document.body.scrollWidth * 0.3;
var w2 = document.body.scrollWidth * 0.7;
//alert("width:" + document.body.scrollWidth + "height:" + document.body.scrollHeight);
var ele = document.getElementsByTagName("table");
alert("元素为table的个数:" + ele.length);
for (i = 0; i < ele.length; ++i) {
var temp = "";
var e = ele(i);
var x,y,w,h;
oRect = e.getBoundingClientRect();
x=oRect.left;
y=oRect.top;
w = e.offsetWidth;
h = e.offsetHeight;
temp = "table" + i;
if ((y + h) < h1)
alert(temp + "/r/nHEADER:/r/n/r/n" + e.innerText);
if (y >= h2)
alert(temp + "/r/nFOOTER:/r/n/r/n" + e.innerText);
if ((x + w) < w1)
alert(temp + "/r/nLM:/r/n/r/n" + e.innerText);
if (x >= w2)
alert(temp + "/r/nRM:/r/n/r/n" + e.innerText);
if ((y < h2) && ((y + h) >= h1) && (x < w2) && ((x + w) >= w1))
alert(temp + "/r/nCENTER:/r/n/r/n" + e.innerText);
//alert(temp);
//temp += "left:" + x;
//alert(temp);
//temp += "top:" + y;
//alert(temp);
//temp += "width:" + e.offsetWidth;
//alert(temp);
//temp += "height:" + e.offsetHeight;
//alert(temp + "/r/n/r/n" + e.innerText);
}
}
</script>
- 使用js实现基于可视布局信息的网页噪音去除的测试方法
- 去除辦公室的噪音(非技術文章)
- 基于js的网页计算器实现
- 基于记录登陆信息的防止网页暴力破解方法
- js获取浏览器的可视区域尺寸的实现代码
- js获取浏览器的可视区域尺寸的实现代码
- js获取浏览器的可视区域尺寸的实现代码
- JS实现select去除option的使用注意事项
- 表格布局网页的方法
- CSS垂直居中网页布局实现的5种方法
- CSS垂直居中网页布局实现的5种方法
- 实现网页布局的自适应
- 网页可视区的兼容性写法
- MP3 使用IPP库的噪音问题
- 基于nodejs实现本地网页服务器-实现手机测试电脑开发的移动端网页
- 使用CSS布局的网页
- 网页布局-float的使用
- 基于网站风格树SST的网页噪声去除
- DELPHI中简单把汉字转换成ASCII码的方法
- 第三章 Struts配置(第二节 Actin配置)
- 第三章 Struts配置(第三~七节其他配置)
- 附录一 Maven2 安装
- 附录二 使用Maven2 原型(Archetype) 建立Struts程序框架
- 使用js实现基于可视布局信息的网页噪音去除的测试方法
- Linux进程间通信: FIFO(1)
- 感悟人生
- 优化Windows CE程序
- 整理MSDN中的SqlConnection.ConnectionString 属性
- 整治javascript--面向对象编程
- 推荐一下,ictclas4j很好的java分词系统
- Asterisk-Java
- 带外网管