pandas将类别属性转化为数值属性的方法
来源:互联网 发布:手机网络助手下载 编辑:程序博客网 时间:2024/05/20 01:39
原文地址
离散特征的编码分为两种情况:
1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码
2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}
使用pandas可以很方便的对离散型特征进行one-hot编码
import pandas as pddf = pd.DataFrame([ ['green', 'M', 10.1, 'class1'], ['red', 'L', 13.5, 'class2'], ['blue', 'XL', 15.3, 'class1']])df.columns = ['color', 'size', 'prize', 'class label']size_mapping = { 'XL': 3, 'L': 2, 'M': 1}df['size'] = df['size'].map(size_mapping)class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}df['class label'] = df['class label'].map(class_mapping)
说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL’:3,’L’:2,’M’:1 }
Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot
编码
pd.get_dummies(df)
阅读全文
0 0
- pandas将类别属性转化为数值属性的方法
- iOS为类别添加属性的方法(RunTime)
- python数据预处理之将类别数据转换为数值的方法
- 将数值转化为字符串的函数
- 将数值转化为字符串的函数
- python pandas将值转换为属性/特征
- 将数值转化为字符
- C# 将文本Text属性转换为数值形式
- 将数值转化为对应的excel列
- java 将数值转化为固定长度的字符串
- java 将数值转化为固定长度的字符串
- python数据处理:对类别Category进行编码(转化为数值)
- 重构一之将属性转化为值对象
- javaweb实现自动将前端的属性值(HttpServletRequest)转化为后台对应的实体类
- pandas/numpy常用方法/属性
- 将问题转化为数值计算
- 将文件转化为字符串的方法
- 读取BMP文件中关于位图属性的信息,将一个数值矩阵封装为一个BMP格式的文件
- 构造方法
- 算法之冒泡算法(golang)
- 怎样去了解软件系统周边影响因素
- thinkphp框架中jquery $.post()用法详解
- iOS __block和__weak的区别
- pandas将类别属性转化为数值属性的方法
- kaggle Code :House Prices: Advanced Regression Techniques 回归
- C#与C++代码互相调用
- 二叉搜索树
- 再读SIFT理论及源码
- HDU 1847(Good Luck in CET-4 Everybody!) 巴什博弈 Java
- 单调队列入门
- 查找——线性索引查找
- unix 02