spss clementine Twostep Cluster(两步聚类 二阶聚类)
来源:互联网 发布:莱汀rei 知乎 编辑:程序博客网 时间:2024/05/16 11:32
一 、前提条件:
1.变量之间不存在多重共线性;
2.变量服从正态分布;
二、原理:
第一步,预聚类、准聚类过程:
构建聚类特征树(CFT),分成很多子类。
开始时,把某个观测量放在树的根节点处,它记录有该观测量的变量信息,然后根据指定的距离测度作为相似性依据,使每个后续观测量根据它与已有节点的相似性,放到最相似的节点中,如果没有找到某个相似性的节点,就为它形成一个新的节点。
第二步,正式聚类:
将以第一步完成的预聚类作为输入,对之使用分层聚类的方法进行再聚类(对数似然函数)。
每一个阶段,利用施瓦兹贝叶斯信息准则(BIC)评价现有分类是否适合现有数据,
并在最后给出符合准则的分类方案。
三、优点:
1.海量数据处理;
2.自动标准化数据;
3.能够处理分类变量和连续变量的混合数据;
4.可自动丢弃异常值或者将异常值归入最近的类。
5.可自动确定或者根据业务需要人工指定分类数目;
转载自http://blog.sina.com.cn/racoon 比较不错的博客
- spss clementine Twostep Cluster(两步聚类 二阶聚类)
- TwoStep Cluster
- Clementine和SPSS
- spss clementine安装
- SPSS Clementine 数据挖掘入门
- SPSS-clementine 简单的操作体验
- 使用SPSS Clementine进行社交网络分析
- 数据挖掘SPSS Clementine 12.0.3
- SPSS Clementine 数据挖掘入门<转>
- spss modeler(clementine)连接oracle数据库
- 数据挖掘工具初探之SPSS Clementine篇
- SPSS Clementine 12支持的功能或算法
- 数据挖掘软件SPSS Clementine 12安装教程
- 数据挖掘SPSS Clementine 12.0.3 多国语言(含中文)破解版
- 数据分析预处理的方法——SPSS、Clementine如何处理缺失值、离群值、极值?
- 数据挖掘SPSS Clementine 12.0.3 多国语言(含中文)破解版
- 如何用SPSS和Clementine处理缺失值、离群值、极值
- 数据挖掘SPSS Clementine 12.0.3 多国语言(含中文)破解版
- 生活随笔:人心难测,伤心地离开
- Linux Filesystem Hierarchy(/boot)
- 关于oracle 多表共用一个序列 还是多表多序列 小总结
- printf使用%s直接输出string类型,Program received signal SIGILL, Illegal instruction
- RTP协议分析
- spss clementine Twostep Cluster(两步聚类 二阶聚类)
- 关于URL请求传递中文参数乱码
- 一些函数的头文件
- 顶楼的房子可不可以买?
- linux定时器的使用
- 数据挖掘标准流程——CRISP-DM
- Oracle数据库中ITL详解
- Some characters cannot be mapped using "Cp1252" character encoding 解决方法
- getting control with subversion and xcode