<<Combating Web Spam with TrustRank>>的实验
来源:互联网 发布:国外即时通讯软件排名 编辑:程序博客网 时间:2024/05/17 03:34
这篇论文是我这几天看到写得最好的一篇论文。
以下是按照论文做的若干实验,和编码,方便自己和看这篇论文的人对照。
做rank的代码,我做了简化,看这篇论文的人应该能理解,这种转化是等价的。不多做解释。
//1)Select Seeds 代码,结果和论文一致,比较精确解如下:
0.079247
0.135888
0.079247
0.095042
0.086494
0.055128
0.021429
因此选择page 2,4,5作为种子,这是一种很好的选择种子的方法,即按照outlink的质量来评价,和Pagerank按照inlink质量评价刚好相反,因此用了Inverse transition matrix,同时注意inverse transition matrix 不等价于 transistion matrix的转置。代码如下:
#include "stdio.h"
int main(void)
{
double matrix[7][7]={
{0, 0.5, 0, 0, 0, 0, 0},
{0, 0, 0.5, 1, 0, 0, 0},
{0, 0.5, 0, 0, 0, 0, 0},
{0, 0, 0, 0, 1, 0, 0},
{0, 0, 0, 0, 0, 1, 1},
{0, 0, 0.5, 0, 0, 0, 0},
{0, 0, 0, 0, 0, 0, 0},
};
double r[7][2]={
{1.0/7,0},
{1.0/7,0},
{1.0/7,0},
{1.0/7,0},
{1.0/7,0},
{1.0/7,0},
{1.0/7,0},
};
for(int i= 0; i<20; ++i)
{
int j = i%2;
int k = (i+1)%2;
for(int m = 0; m<7;++m)
{
r[m][k] = 0.0;
for(int n = 0; n<7;++n)
{
r[m][k] += 0.85*matrix[m][n]*r[n][j];
}
r[m][k] += 0.15/7;
}
for(int l = 0;l<7;++l)
{
printf("%f,%f\n",r[l][0],r[l][1]);
}
printf("\n");
}
return 0;
}
计算TrushRank的代码,计算结果与论文一致,精确解,代码如下:
0.000000
0.179752
0.123260
0.151641
0.128762
0.054913
0.054913
#include "stdio.h"
int main(void)
{
double matrix[7][7]={
{0, 0, 0, 0, 0, 0, 0},
{1, 0, 1, 0, 0, 0, 0},
{0, 0.5, 0, 0, 0, 1, 0},
{0, 0.5, 0, 0, 0, 0, 0},
{0, 0, 0, 1, 0, 0, 0},
{0, 0, 0, 0, 0.5, 0, 0},
{0, 0, 0, 0, 0.5, 0, 0},
};
double r[7][2] = {
{0,0},
{1.0/2,0},
{0,0},
{1.0/2,0},
{0,0},
{0,0},
{0,0},
};
double d[]={0,0.5,0,0.5,0,0,0};
for(int i= 0; i<20; ++i)
{
int j = i%2;
int k = (i+1)%2;
for(int m = 0; m<7;++m)
{
r[m][k] = 0.0;
for(int n = 0; n<7;++n)
{
r[m][k] += 0.85*matrix[m][n]*r[n][j];
}
r[m][k] += 0.15*d[m];
}
for(int l = 0;l<7;++l)
{
printf("%f,%f\n",r[l][0],r[l][1]);
}
printf("\n");
}
return 0;
}
- <<Combating Web Spam with TrustRank>>的实验
- 反spam与spam间的较量 -
- 常用的SPAM是什么意思?
- spam的来源
- spam
- spam
- TrustRank算法
- Web Spam相关实验室与学者
- Python,Spam的有趣由来
- SPAM算法的学习笔记
- 科技考古: SPAM 垃圾邮件的起源
- PageRank与TrustRank
- TrustRank算法详细介绍
- 搜索引擎web spam类型及防治策略(version 0.9)
- Combating Spyware in the Enterprise
- Combating Spyware in the Enterprise
- 反垃圾邮件-Spam Locker的配置与安装
- 关于4. 3 DESIGN: SPAM 审核问题的解决方法
- define的用法小结
- jpa与hibernate的关系
- 手机短信的PDU编码和解码
- pdu的编码格式
- 截屏 ClipScreen
- <<Combating Web Spam with TrustRank>>的实验
- 各种电影
- 用SQL语句添加删除修改字段
- 高性能IO设计的Reactor和Proactor模式
- linux编程的一些教训
- Java基础加强总结(2)
- yum install qt
- 心跳
- 软件工程中的图情结