pandas 下的 one hot encoder 及 pd.get_dummies() 与 sklearn.preprocessing 下的 OneHotEncoder 的区别
来源:互联网 发布:网络营销策划方案例文 编辑:程序博客网 时间:2024/06/10 16:16
- sklearn.preprocessing 下除了提供 OneHotEncoder 还提供 LabelEncoder(简单地将 categorical labels 转换为不同的数字);
1. 简单区别
Panda’s get_dummies vs. Sklearn’s OneHotEncoder() :: What is more efficient?
sklearn.preprocessing 下的 OneHotEncoder 不可以直接处理 string,如果数据集中的某些特征是 string 类型的话,需要首先将其转换为 integers 类型;
- 在新版本中 sklearn 中,OneHotEncoder 实例的 fit 方法将不再接收 1 维数组,而必须是显式的二维形式;
encoder = OneHotEncoder()encoder.fit([[1, 2], [2, 1]])
pd.get_dummies(),则恰将 string 转换为 integers 类型:
>> pd.get_dummies(['A', 'B', 'A']) A B0 1 01 0 12 1 0
2. sklearn.feature_extraction 下的 DictVectorizer
How can i vectorize list using sklearn DictVectorizer
将字典类型表示的属性,转换为向量类型:
>> measurements = [ {'city=Dubai': True, 'city=London': True, 'temperature': 33.}, {'city=London': True, 'city=San Fransisco': True, 'temperature': 12.}, {'city': 'San Fransisco', 'temperature': 18.},]>> vec.feature_names['city=Dubai', 'city=London', 'city=San Fransisco', 'temperature']>> vec.fit_transform(measurements).toarray()array([[ 1., 1., 0., 33.], [ 0., 1., 1., 12.], [ 0., 0., 1., 18.]])
阅读全文
0 0
- pandas 下的 one hot encoder 及 pd.get_dummies() 与 sklearn.preprocessing 下的 OneHotEncoder 的区别
- 【机器学习】Sklearn独热编码one hot 编码preprocessing.OneHotEncoder()使用
- 【python】pd.get_dummies进行one-hot编码
- pandas get_dummies的使用方法
- pandas使用get_dummies进行one-hot编码
- pandas使用get_dummies进行one-hot编码
- pandas使用get_dummies进行one-hot编码
- sklearn.preprocessing中 LabelEncoder 和 OneHotEncoder区别
- 基于sklearn 的one hot encoding
- 基于sklearn 的one hot encoding
- 基于sklearn 的one hot encoding
- #######基于sklearn 的one hot encoding原理######
- sklearn.preprocessing.OneHotEncoder
- 基于sklearn的序列处理 : LabelEncoder 与 OneHotEncoder
- sklearn.preprocessing的部分用法
- sklearn.preprocessing的部分用法
- pandas 的 pd.caoncat()
- sklearn.preprocessing.LabelEncoder和onehotencoder
- 检验两个线段是否相交
- BZOJ 1033: [ZJOI2008]杀蚂蚁antbuster
- 实验吧CTF逆向题1000writeup
- 使用Servlet Filter实现系统登录权限校验
- Kotlin基础教程-访问修饰符
- pandas 下的 one hot encoder 及 pd.get_dummies() 与 sklearn.preprocessing 下的 OneHotEncoder 的区别
- Synchronized关键字的使用
- android利用servlet获取服务器数据库数据进行登录
- new String和调用intern() 的关系
- js 获取多选框CheckBox选中及选中值
- 1222: 排序
- [JavaEE] 使用Apache Common Lang包中的 EqualsBuilder和HashCodeBuilder
- Mybatis id自增,插入数据后返回id
- 物资调度