数据挖掘-数据预处理-数据清洗

来源:互联网 发布:c#获取数组的长度 编辑:程序博客网 时间:2024/04/30 06:20

Data Preprocessing(数据预处理)

核心问题:

1.数据是杂乱无章?

2.数据不能直接来进行分析?

3.打好地基?

主要点:

1.Data Cleaning

2.Data Transformation

3.Data Description

4.Feature Selection

5.Feature Extraction

数据从哪里来?

金融数据,信息数据,GPS,手环等等,格式不仅相同。

为什么要进行数据预处理?

1.数据不完整?(Incomplete)

2.Noisy

3.Inconsistent

4.Redundant

5.Different Type

6.Not Applicable(N/A)

7.Data not provided



0 0
原创粉丝点击