Python-Pandas 如何shuffle(打乱)数据?
来源:互联网 发布:印尼网络制式 编辑:程序博客网 时间:2024/05/19 01:12
在Python里面,使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法,本文介绍两种比较常用而且简单的方法。
应用情景:
我们有下面以个DataFrame
我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变,即如下效果:
实现方法:
最简单的方法就是采用pandas中自带的 sample这个方法。
假设df是这个DataFrame
- df.sample(frac=1)
有时候,我们可能需要打混后数据集的index(索引)还是按照正常的排序。我们只需要这样操作
- df.sample(frac=1).reset_index(drop=True)
其实,sklearn(机器学习的库)中也有shuffle的方法。
- from sklearn.utils import shuffle
- df = shuffle(df)
另外,numpy库中也有进行shuffle的方法(不建议)
- df.iloc[np.random.permutation(len(df))]
阅读全文
0 0
- Python-Pandas 如何shuffle(打乱)数据?
- Python-Pandas 如何shuffle(打乱)数据?
- 简化SQL计算之打乱数据列次序(Shuffle)
- Python/Keras如何将给定的数据集打乱
- Python/Keras如何将给定的数据集打乱
- 384. Shuffle an Array(打乱数组)
- python random.shuffle(随机打乱列表等) 和 random.random
- excel如何随机打乱数据
- javascript shuffle 打乱数组
- Python机器学习——如何shuffle一个数据集(ndarray类型)
- Python机器学习——如何shuffle一个数据集(ndarray类型)
- python数据分析之(3)pandas
- python基础数据分析--pandas(一)
- python数据分析(pandas入门)
- python数据分析---Pandas
- Python 数据分析 pandas
- python-Pandas学习 如何对数据集随机抽样?
- python pandas 如何去掉/保留数据集中的重复行?
- python __name__ == '__main__'
- 死锁(python 版)
- 数字验证码
- 2017互联网+智慧中国年会 众多嘉宾震撼来袭
- fragment 模型
- Python-Pandas 如何shuffle(打乱)数据?
- 在AndroidStudio上搭建 Kotlin 开发环境
- MySQL开发标准规范
- 反射main方法
- windows上添加自动监控apache服务
- JSON.parse()和JSON.stringify()
- VMware安装Ubuntu 16.04
- 解决react-native的Navigator跳转不刷新页面的问题
- spring-控制反转,依赖注入解释