数据挖掘算法

来源:互联网 发布:淘宝买家秀兼职骗局 编辑:程序博客网 时间:2024/04/30 17:14
绝大多数数据挖掘算法大致可以分为“监督学习(supervised learning)”和“无监督学习(unsupervised learning)”两种数据挖掘技术。监督学习需要先由数据分析师确定一个目标属性或因变量(例如,购买某种特定产品的客户),然后通过监督学习技术筛分数据,尽量找出其他属性和目标属性之间的规律和关系(例如,能够表明很可能会购买特定产品的预期客户的特点)。Oracle数据挖掘工具提供的监督学习算法包括朴素贝叶斯算法(Naïve Bayes)、决策树算法(Decision Tree)、广义线性模型(General Linear Models)和支持向量机算法(Support Vector Machines)。而无监督学习技术用于缺少目标属性的分析情况,该算法在不依赖任何预设商业目标的前提下发掘数据的关联和聚类。这些算法包括增强的k-Means聚类法(Enhanced k-Means Clustering)、正交分区聚类法(Orthogonal Partitioning Clustering)、关联规则算法(Association Rules,即购物篮分析)和非负矩阵分解法(Nonnegative Matrix Factorization)。