Python Dataframe ——指定多列去重、求差集
来源:互联网 发布:unity3d 安卓sdk下载 编辑:程序博客网 时间:2024/06/03 10:08
1)去重
指定多列去重,这是在dataframe没有独一无二的字段作为PK(主键)时,需要指定多个字段一起作为该行的PK,在这种情况下对整体数据进行去重。
Attention:主要用到了drop_duplicates方法,并设置参数subset为多个字段名构成的数组。
具体代码如下:
2)求差集
假设有两个dataframe为a和b,a和b可以是相互包含的关系,现在想要将a中和b重复的内容去掉,也就是求差集,步骤如下:
(1)需要对两个dataframe进行去重。
(2)利用append方法,a=a.append(b)
(3)再次利用append方法,a=a.append(b)
(4)去重,利用drop_duplicates方法,a=a.drop_duplicates(),以及设置参数keep=False,意思就是只要有重复,重复的记录都去掉。(keep默认='first',也就是保留第一条记录)
具体代码如下:
阅读全文
0 0
- Python Dataframe ——指定多列去重、求差集
- python—DataFrame的存储
- python 把几个DataFrame合并成一个DataFrame——merge,append,join,conca
- Python: Pandas的DataFrame如何按指定list排序
- python——dataframe向下向上填充,fillna和ffill
- python—pandas中DataFrame类型数据操作函数
- python—pandas中DataFrame类型数据操作函数
- python—pandas中DataFrame类型数据操作函数
- python—pandas中DataFrame类型数据操作函数
- pandas—DataFrame创建
- python脚本实践——python批量读取txt文件为DataFrame
- pandas入门——DataFrame
- Python方法总结(1)——删除pandas DataFrame的某一/几列
- python——修改Dataframe列名的两种方法
- Python dataframe to array
- python中dataframe合并
- python dataframe基础入门
- python dataframe unionall
- 布隆过滤器原理
- 打赏博主
- Sketch文件转成PSD格式 手把手教程
- 文章标题
- PHP入门-面向对象
- Python Dataframe ——指定多列去重、求差集
- c++入门笔记(6)变量
- C# 委托
- Pytorch v0.3.0版本发布--pytorch性能优化提速,支持ONNX,高阶梯度以及SparseAdam优化器
- Codeforces Round #450 (Div. 2)B
- 简记Android源码设计模式——第二篇
- 汉诺塔递归
- 1001. 害死人不偿命的(3n+1)猜想 (15)
- java简单工厂设计模式