Scikit-Learn知识框架

来源:互联网 发布:淘宝dw手表600是真的吗 编辑:程序博客网 时间:2024/06/07 01:18

scikit-learn六大板块:分类,回归,聚类,数据降维,模型选择,数据预处理

数据降维:降低数据的随机变量个数,也称特征选择

模型选择:不同模型,不同参数,同样的训练集,验证集,主要包括格点搜索,交叉验证

模数据预处理:指数据的特征提取和归一化,

重点:注意特征提取和特征选择的区别,特征提取是指将文本,图像等数据转换为可被机器学习的数字变量,特征选择是指去除不重要,重复的特征,特征提取在前,特征选择在后。





0 0