优达机器学习:特征缩放
来源:互联网 发布:足球数据直播 编辑:程序博客网 时间:2024/06/17 20:23
练习:最小值/最大值重缩放器编码
import numpy as npdef featureScaling(arr): arr = np.array(arr) max = np.max(arr) min = np.min(arr) res = [] for item in arr: data = float(item-min)/(max-min) res.append(data) return res# tests of your feature scaler--line below is input datadata = [115, 140, 175]print featureScaling(data)
练习:需要重缩放的算法练习
- 使用 RBF 核函数的 SVN
- K-均值聚类
练习:缩放类型
- MinMaxScaler
练习:计算重缩放特征
- salary : 0.17962406631
- stock : 0.0290205889347
import numpy as npstocklist = []for item in data_dict: stock = data_dict[item]['exercised_stock_options'] if stock != 'NaN': stocklist.append( stock )stocklist = np.array(stocklist)print (1000000.0 - np.min(stocklist)) / (np.max(stocklist) - np.min(stocklist))salarylist = []for item in data_dict: salary = data_dict[item]['salary'] if salary != 'NaN': salarylist.append( salary )print (200000.0 - np.min(salarylist)) / (np.max(salarylist) - np.min(salarylist))
很奇怪的是,使用sklearn里面的MinMaxScaler的缩放率计算有误差,代码如下
import numpy as npstocklist = []for item in data_dict: stock = data_dict[item]['exercised_stock_options'] if stock != 'NaN': stocklist.append( stock )stocklist = np.array(stocklist)from sklearn import preprocessingmin_max_scaler = preprocessing.MinMaxScaler()min_max_scaler.fit_transform(stocklist)print 1000000 * min_max_scaler.scale_salarylist = []for item in data_dict: salary = data_dict[item]['salary'] if salary != 'NaN': salarylist.append( salary )salarylist = np.array(salarylist)min_max_scaler.fit_transform(salarylist)print 200000 * min_max_scaler.scale_print np.max(salarylist)print np.min(salarylist)
练习:何时部署特征缩放
- 重要
阅读全文
0 0
- 优达机器学习:特征缩放
- 【机器学习】特征缩放
- 机器学习笔记之特征缩放
- 机器学习--特征缩放/均值归一化
- Udacity-机器学习入门-特征缩放
- Stanford机器学习---第二周.特征缩放、正规方程
- 浅谈机器学习中的特征缩放(feature scaling)
- 机器学习04-多变量梯度下降与特征缩放
- 浅谈机器学习中的特征缩放(feature scaling)
- 机器学习-梯度下降V(特征缩放)
- 机器学习中的特征缩放(feature scaling)浅谈
- 机器学习-梯度下降算法-特征缩放和学习速率选取
- 机器学习入门系列二(关键词:多变量(非)线性回归,批处理,特征缩放,正规方程
- 斯坦福机器学习公开课4-3 4-4 特征缩放和验证梯度下降算法
- 特征提取+机器学习
- 机器学习--特征选择
- 机器学习--Haar特征
- 机器学习:特征工程
- 周中记录--2017.1.30
- orm查询1
- ico图标提取器
- java随机数
- Python学习---第十天
- 优达机器学习:特征缩放
- [模板]
- C++时间戳time_t和时间结构体tm
- 大整数乘积:算法思想
- Swift Source Code
- 至今为止最易懂的BM算法精讲
- 最小堆的插入、删除和创建的C语言实现
- [模板]
- Hibernate 5.2.12 二级缓存配置及案例