Python-Pandas 如何shuffle(打乱)数据?
来源:互联网 发布:mac无法识别优盘 编辑:程序博客网 时间:2024/05/19 01:07
在Python里面,使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法,本文介绍两种比较常用而且简单的方法。
应用情景:
我们有下面以个DataFrame
我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变,即如下效果:
实现方法:
最简单的方法就是采用pandas中自带的 sample这个方法。
假设df是这个DataFrame
df.sample(frac=1)这样对可以对df进行shuffle。其中参数frac是要返回的比例,比如df中有10行数据,我只想返回其中的30%,那么frac=0.3。
有时候,我们可能需要打混后数据集的index(索引)还是按照正常的排序。我们只需要这样操作
df.sample(frac=1).reset_index(drop=True)
其实,sklearn(机器学习的库)中也有shuffle的方法。
from sklearn.utils import shuffledf = shuffle(df)
另外,numpy库中也有进行shuffle的方法(不建议)
df.iloc[np.random.permutation(len(df))]
1 0
- Python-Pandas 如何shuffle(打乱)数据?
- Python-Pandas 如何shuffle(打乱)数据?
- 简化SQL计算之打乱数据列次序(Shuffle)
- Python/Keras如何将给定的数据集打乱
- Python/Keras如何将给定的数据集打乱
- 384. Shuffle an Array(打乱数组)
- python random.shuffle(随机打乱列表等) 和 random.random
- excel如何随机打乱数据
- javascript shuffle 打乱数组
- Python机器学习——如何shuffle一个数据集(ndarray类型)
- Python机器学习——如何shuffle一个数据集(ndarray类型)
- python数据分析之(3)pandas
- python基础数据分析--pandas(一)
- python数据分析(pandas入门)
- python数据分析---Pandas
- Python 数据分析 pandas
- python-Pandas学习 如何对数据集随机抽样?
- python pandas 如何去掉/保留数据集中的重复行?
- iOS UIButton setImageEdgeInsets||setTitleEdgeInsets属性
- jQuery框架
- JMS&MQ,从入门到精通(六)
- 使用redis解决一些并发访问的问题
- SVN提交代码强制注释
- Python-Pandas 如何shuffle(打乱)数据?
- 设计模式—代理模式
- AngularJS-控制器篇(controller)
- .React Native新版本中没有了PullToRefreshViewAndroid
- 在原mysql服务器上安装mariadb-10.1.22
- 高并发Java 七 并发设计模式
- 新建API
- __I、 __O 、__IO volatile是什么?怎么用?(作者写的太棒了,给赞) .
- NFS服务器----Network File System