fit_transform和transform的区别
来源:互联网 发布:求最小公倍数的vb算法 编辑:程序博客网 时间:2024/06/05 13:31
经常看到数据读入——>对没用数据删除处理——>split分割数据分别作为训练,测试——>标准化数据...之后总会看到
ss=StandarScaler()X_train=ss.fit_transform(X_train)X_test=ss.transform(X_test)
我们使用sklearn进行文本特征提取/预处理数据。可以看到除训练,预测和评估以外,处理其他工作的类都实现了3个方法:fit、transform和fit_transform。从命名中可以看到,fit_transform方法是先调用fit然后调用transform,我们只需要关注fit方法和transform方法即可。
transform方法主要用来对特征进行转换。从可利用信息的角度来说,转换分为无信息转换和有信息转换。无信息转换是指不利用任何其他信息进行转换,比如指数、对数函数转换等。有信息转换从是否利用目标值向量又可分为无监督转换和有监督转换。无监督转换指只利用特征的统计信息的转换,统计信息包括均值、标准差、边界等等,比如标准化、PCA法降维等。有监督转换指既利用了特征信息又利用了目标值信息的转换,比如通过模型选择特征、LDA法降维等。通过总结常用的转换类,我们得到下表:
不难看到,只有有信息的转换类(训练数据)的fit方法才实际有用,显然fit方法的主要工作是获取特征信息和目标值信息,在这点上,fit方法和模型训练时的fit方法就能够联系在一起了:都是通过分析特征和目标值,提取有价值的信息,对于转换类来说是某些统计量,对于模型来说可能是特征的权值系数等。另外,只有有监督的转换类的fit和transform方法才需要特征和目标值两个参数。。
0 0
- fit_transform和transform的区别
- 通俗地讲清楚fit_transform()和transform()的区别
- 数据预处理sklearn.preprocessing中,fit_transform()和transform()的区别?
- 【机器学习 数据预处理】fit_transform()和transform()的区别
- Python: sklearn库中数据预处理函数fit_transform()和transform()的区别
- Python: sklearn库中数据预处理函数fit_transform()和transform()的区别
- scikit-learn数据预处理fit_transform()与transform()的区别
- scikit-learn数据预处理fit_transform()与transform()的区别(转)
- fit_transform,transform
- GameObject和Transform的区别
- transition、transform和animation的区别?
- transition和transform属性的区别
- css left top和transform的区别
- fit_transform的一点小姿势
- Unity中关于transform.root和transform.parent的区别和联系?
- 图解unity下gameobject和transform的区别和关联
- CSS3中translate、transform和translation的区别和联系
- CSS3中translate、transform和translation的区别和联系
- 【HDU 5950】【构造矩阵+矩阵幂】 Recursive sequence——2016ACM/ICPC亚洲区沈阳站(重现赛)
- 文章标题 POJ 2586 : Y2K Accounting Bug(贪心)
- java高并发-并行模式(下).md
- java成员变量和局部变量的区别
- Win10-64位Python2.7 Django开发与应用(三) 通过URL传参数
- fit_transform和transform的区别
- 剖析自己
- Shiro身份验证Realm
- 五步整理你的css文件
- 从一张图片截取JButton多种状态的Icon
- java基础10(Javaoo5)——多态与抽象
- java试题库1
- 循环链表
- java随机生成邀请码(数字+字母)