数据挖掘算法

来源：互联网发布：淘宝买家秀兼职骗局编辑：程序博客网时间：2024/04/30 17:14

绝大多数数据挖掘算法大致可以分为“监督学习(supervised learning)”和“无监督学习(unsupervised learning)”两种数据挖掘技术。监督学习需要先由数据分析师确定一个目标属性或因变量(例如，购买某种特定产品的客户)，然后通过监督学习技术筛分数据，尽量找出其他属性和目标属性之间的规律和关系(例如，能够表明很可能会购买特定产品的预期客户的特点)。Oracle数据挖掘工具提供的监督学习算法包括朴素贝叶斯算法(Naïve Bayes)、决策树算法(Decision Tree)、广义线性模型(General Linear Models)和支持向量机算法(Support Vector Machines)。而无监督学习技术用于缺少目标属性的分析情况，该算法在不依赖任何预设商业目标的前提下发掘数据的关联和聚类。这些算法包括增强的k-Means聚类法(Enhanced k-Means Clustering)、正交分区聚类法(Orthogonal Partitioning Clustering)、关联规则算法(Association Rules，即购物篮分析)和非负矩阵分解法(Nonnegative Matrix Factorization)。