Python机器学习笔记——概述

来源:互联网 发布:php程序员的工作常态 编辑:程序博客网 时间:2024/06/05 05:02

无监督学习典型任务:聚类、降维

 

聚类:根据数据相似性将数据分类。

  • sklearn.cluster模块:K-Means,近邻传播算法,DBSCAN

 

标准数据输入格式:[样本个数,特征个数]定义的矩阵形式。

相似性矩阵输入格式:[样本个数]定义的矩阵形式,元素为样本相似度。

 

降维:保证数据特征或分布前提下,将高维数据转化为低维数据。

  • sklearn.decomposition模块:PCA,FastICA,NMF,LDA

 

 

监督学习的典型任务:分类、回归

 

利用一组带有标签的数据,学习从输入到输出的映射,然后将这种映射关系应用到未知数据上,达到分类或回归的目的。

 

分类输出是离散的

  • sklearn.neighbors 模块:KNeighborsClassifier

 

训练集/测试集的划分方法:根据已有标注数据,随机选出一部分数据(70%)数据作为训练数据,余下的作为测试数据,此外还有交叉验证法,自助法用来评估分类模型。

 

 

  • 精确率 = 正例且预测为正 / 预测为正
  • 召回率 = 正例且预测为正 / 正例
  • 准确率 = 预测正确 / 所有样本

 

常用算法:

  • k近邻(knn)
  • 朴素贝叶斯(naivebayes)
  • 支持向量机(svm)
  • 决策树 (decision tree)
  • 神经网络模型(Neural networks)

 

回归:输出是连续的

 

了解两个或多个变数间是否相关研究其相关方向与强度 。

 

  • sklearn.linear_model 模块:线性回归函数

普通线性回归函数( LinearRegression)岭回归(Ridge)Lasso

 

  • sklearn.preprocessing 模块:非线性回归函数

多项式回归(PolynomialFeatures)

 

 

强化学习:试错学习

强化学习是程序或智能体(agent)通过与环境不断地进行交互,学习一个从环境到动作的映射,学习的目标就是使累计回报最大化。

 

在各种环境下尽量尝试所有可选动作,通过环境反馈(即奖励)判断动作优劣,从而获得环境和最优动作的映射关系(即策略)。

 

  • 马尔可夫决策过程(Markov Decision Process)
  • 蒙特卡洛强化学习
  • Q-learning
  • 深度强化学习(DRL) 如:Deep Q Network(DQN)
原创粉丝点击