机器学习之k近邻算法——4、特征值归一化

来源:互联网 发布:python wordcloud安装 编辑:程序博客网 时间:2024/05/18 12:30

为什么需要做特征值归一化:


对于特征是年龄、身高、年薪,标签是择偶观的样本数据而言,显然利用特征的差值来估算择偶观来看,年薪这一特征值对于计算结果的影响最大。因此,我们需要对样本数据做归一化处理。

对于每一行样本数据来说,归一化处理公式如下:

normDataSet=(data-min)/(max-min)

就上图对于(年龄、身高、年薪)=(20、178、20000)的这行数据来说,归一化之后,这行数据会更改为:

年龄=(20-20)/(30-20)=0

身高=(178-160)/(178-160)=1

年薪=(20000-20000)/(40000-20000)=0

所以,特征值归一化后,变为(0,1,0)


特征值归一化的代码:

1、样本数据(只包含特征值,不包含标签):



2、执行代码:



3、测试结果:






0 0
原创粉丝点击