程序博客网 > java中offset什么意思

第九篇论文读后总结-相似森林

来源：互联网发布：java中offset什么意思编辑：程序博客网时间：2024/05/29 10:00

Similarity Forests

相似森林

Saket Sathe IBM T. J. Watson Research Center YorktownHeights, NY 10598

Charu C. Aggarwal IBM T. J. Watson Research Center Yorktown Heights, NY 10598

KDD’17, August 13–17,2017, Halifax, NS, Canada

本文讲了什么问题？

随机森林因其精确性和效率性，已经成为数据挖掘中最成功的分类算法之一；但是它的运用主要局限于多维数据中。本文提出了一种扩展随机森林的方法---随机森林，只要数据对象之间有相似之处就可以在数据对象之间进行计算。例如在很多应用数据中，像时间系列数据、离散序列或图中，高维表达也许是不存在的；但相似函数计算的问题已经得到很好的研究，并且有可能计算数据对象之间的相似性。但在很多领域中，计算相似性耗费耗时；因此本文也提出了将对象之间的距离转化为相似性的想法。

解决问题方法

SIMFOREST算法

假设对象 O1 . ..On 可以嵌入一些多维空间作为点X(—)1 . . .X(—)n.，SimForest方法在数据对象中随机找到一对来确定一个方向，再把其他数据对象映射到这个方向上，通过方向上的相似分割点划分数据对象。如下图所示：

1.如上图所示，选择了X(—)i,X(—)j来确定一个方向，而其他点在这个方向上的投影如下计算：例如数据对象O_k在方向上的投影：

或

S代表相似度

2.分割点a的选择标准是它最小化子节点的加权基尼指数：

一个节点N的基尼指数为：

当N被分为两个子节点N1和N2，那么加权基尼指数为：

数据对象O_k归于决策树中的哪条路径要看是否：

阅读全文

0 0

java中offset什么意思

java中offset什么意思

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子够级单机版多乐够级打鱼技巧 qq够级手机版下载山东够级规则单机够级手机版进贡勾级够级玩法够级单机版下载够级规则玩法单机够级欢乐够级单机够级手机版下载够级比赛同城游六副够级手机够级下载打够级的技巧够级开点够级英雄传够级进贡够级怎么开点够级大纲够级宣点够级憋三真人版够级什么是够级牌在线够级够级同城同城够级怎么秒退够级教学免费够级下载够级烧牌够级英雄下载手机玩够级 gouji 勾鸡枣庄同城游六副够级浪人算牌器之qq够级够花app 海尔金融够花借一万到手多少海尔够花一般多少额度够花app下载