分类与回归

来源:互联网 发布:淘宝汽车装饰用品 编辑:程序博客网 时间:2024/05/22 12:46

分类:将数据映射到预先定义好的类

回归:用属性的历史数据预测未来趋势

二者的主要区别:分类模式采用离散预测值(如类标号),回归模式采用连续的预测值。

基本思路:首先将数据分成训练集和测试集,通过对历史训练集的训练,生成一个或多个分类器,将这些分类器应用到测试集中,就可以对分类器的性能和准确性做出评判。如果效果不佳,则或者重新选择训练集,或者调整训练模式,直到分类器的性能和准确性达到要求为止。最后将选出的分类器应用到未经分类的新数据中,就可以对新数据的类别做出预测了。

简要说明:不同的算法做成的分类器在不同的数据集上也会有不同的表现

算法:

1、K最近邻算法

算法核心思想:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特征

2、决策树

if-tnen

3、神经网络

算法思想:神经网络是通过对人脑的基本单元--神经元的建模和联接,探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。

4、支持向量机(SVM)

算法思想:尽量把样本的从更高的维度看起来在一起的样本合在一起,其目的是找到一个最优超平面,使得分类间隔最大。

 5、判定归纳树算法

6、贝叶斯分类

7、后向传播分类

8、k-最临近分类

9、遗传算法

常见的应用:

1、将信用卡申请人分为低、中、高风险群

2、如何预测银行可以安全地贷给贷款人的贷款量

3、预测客户半年会申请/取消哪些服务


0 0
原创粉丝点击