程序博客网 > php程序员的工作常态

Python机器学习笔记——概述

来源：互联网发布：php程序员的工作常态编辑：程序博客网时间：2024/06/05 05:02

无监督学习典型任务：聚类、降维

聚类：根据数据相似性将数据分类。

sklearn.cluster模块：K-Means，近邻传播算法，DBSCAN

标准数据输入格式：[样本个数，特征个数]定义的矩阵形式。

相似性矩阵输入格式：[样本个数]定义的矩阵形式，元素为样本相似度。

降维：保证数据特征或分布前提下，将高维数据转化为低维数据。

sklearn.decomposition模块：PCA，FastICA，NMF，LDA

监督学习的典型任务：分类、回归

利用一组带有标签的数据，学习从输入到输出的映射，然后将这种映射关系应用到未知数据上，达到分类或回归的目的。

分类：输出是离散的

sklearn.neighbors 模块：KNeighborsClassifier

训练集/测试集的划分方法：根据已有标注数据，随机选出一部分数据（70%）数据作为训练数据，余下的作为测试数据，此外还有交叉验证法，自助法用来评估分类模型。

精确率 = 正例且预测为正 / 预测为正
召回率 = 正例且预测为正 / 正例
准确率 = 预测正确 / 所有样本

常用算法：

k近邻（knn）
朴素贝叶斯（naivebayes）
支持向量机（svm）
决策树（decision tree）
神经网络模型（Neural networks）

回归：输出是连续的

了解两个或多个变数间是否相关，研究其相关方向与强度。

sklearn.linear_model 模块：线性回归函数

普通线性回归函数（ LinearRegression）、岭回归（Ridge）、Lasso

sklearn.preprocessing 模块：非线性回归函数

多项式回归（PolynomialFeatures）

强化学习：试错学习

强化学习是程序或智能体（agent）通过与环境不断地进行交互，学习一个从环境到动作的映射，学习的目标就是使累计回报最大化。

在各种环境下尽量尝试所有可选动作，通过环境反馈（即奖励）判断动作优劣，从而获得环境和最优动作的映射关系（即策略）。

马尔可夫决策过程（Markov Decision Process）
蒙特卡洛强化学习
Q-learning
深度强化学习（DRL）如：Deep Q Network（DQN）

阅读全文

0 0

php程序员的工作常态

php程序员的工作常态

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子东白山露营攻略东白山在哪里东白山海拔东白山风景区万科白石湖东东新翡翠松湖诸暨东白湖东皇录东皇村东皇钟东皇钟隐藏任务天之痕东皇钟东皇镇东皋怎么读音是什么如皋东皋府河南东盈机械设备有限公司东盈商业广场东盟网站东盟网东盟土特产网东直门中医院东直门派出所东直门医院北京东直门医院北京东直门中医院北京东直门东直门墙体倒塌东直门到北京西站东直门中医医院东直门外房价东直门医院皮肤科东直门地铁站东直门中医院地址东直门站东直门附近美食东直门中医研究院东直门中学东直门外东直门医院怎么样厚道酒店东直门店东直门医院推拿科