pandas移除重复项

来源:互联网 发布:mac抹掉磁盘 编辑:程序博客网 时间:2024/05/29 18:03

import pandas as pd
from pandas import *
import numpy as np
data = DataFrame({‘k1’:[‘one’]*3+[‘two’]*4,’k2’:[1,1,2,3,3,4,4]})
print(data)
print(data.drop_duplicates())

如果希望对指定的列进行重复值删除则

import pandas as pd
from pandas import *
import numpy as np
data = DataFrame({‘k1’:[‘one’]*3+[‘two’]*4,’k2’:[1,1,2,3,3,4,4]})
print(data)
print(data.drop_duplicates(‘k1’))

加一个列名参数就可以了

原创粉丝点击