数据挖掘工具及流程(一)
来源:互联网 发布:电脑软件怎么恢复 编辑:程序博客网 时间:2024/06/14 22:16
数据挖掘主要“分类”
监督学习(supervised learning)
- 回归
- 决策树
- 随机森林
- KNN
- 逻辑回归
- 朴素贝叶斯
- SVM
- …
非监督学习(unsupervised learning)
- k-means
- 关联
- 隐马尔科夫模型
- PAM
- …
解决问题流程
- 了解问题背景及最终结果
- 了解评估原则
- 数据预处理及可视化(如果可以可视化)
- 特征工程
- 模型选择
- 超参数调整
- 模型融合
数据预处理及可视化
数据清洗
- 填充缺失值,缺失值较多则丢弃
- 保证样本均衡(不能出现目标lable偏差极大)
- 可视化在低维情况下可是很好的认识数据
需要用到的常用包:pandas
、matplotlib
、seaborn
等。
sklearn_preprocessing
特征工程
单个特征:归一化、离散化、指数变换
多个特征:PCA、LDA降维
特征选择:相关系数、信息增益、特征子集、正则化
、虚拟变量
sklearn.feature extraction
0 0
- 数据挖掘工具及流程(一)
- 转:数据挖掘流程及主流工具
- 一分钟了解互联网数据挖掘流程
- 一分钟了解互联网数据挖掘流程
- 1.2数据挖掘流程分析及应用软件
- 数据挖掘步骤(流程)
- 数据挖掘笔记(一)
- 数据挖掘笔记(一)
- 数据挖掘导论 (一)
- 数据挖掘整理(一)
- 数据挖掘笔记(一)
- 数据挖掘学习(一)
- 数据挖掘的流程
- 数据挖掘流程
- 数据挖掘的流程
- 数据挖掘流程
- 数据挖掘标准流程
- 数据挖掘流程
- 进程间通讯(五)--共享内存(文件映射)
- 欢迎使用CSDN-markdown编辑器
- Invalid author specified. Please use the form: A U Thor <author@example.com>的解决方案
- 我的第一篇博客
- 机器学习实践系列之6 - OpenCV实战光流
- 数据挖掘工具及流程(一)
- 基于tcp的socket通信(单个客户端与服务端)
- 巴什博奕
- MacPro终端命令
- vue.js开发环境搭建
- PHP错误Notice : Use of undefined constant 的完美解决方法
- 新年新开始
- 对字符串做单词逆序
- TCP、UDP、HTTP、Socket、HttpUrlConnection、HttpClient、Volley、OkHttp之间关系