Python数据分析之利用pandas查询数据

来源:互联网 发布:java json转换 编辑:程序博客网 时间:2024/06/05 23:48

这里的查询数据相当于R语言里的subset功能,可以通过布尔索引有针对的选取原数据的子集、指定行、指定列等。我们先导入一个student数据集:

student = pd.io.parsers.read_csv('C:\\Users\\admin\\Desktop\\student.csv')

查询数据的前5行或末尾5行:

student.head()student.tail()

查询指定的行:

student.ix[[0,2,4,5,7]] #这里的ix索引标签函数必须是中括号[]

查询指定的列:

student[['Name','Height','Weight']].head() #如果多个列的话,必须使用双重中括号

也可以通过ix索引标签查询指定的列:

student.ix[:,['Name','Height','Weight']].head()

查询指定的行和列:

student.ix[[0,2,4,5,7],['Name','Height','Weight']].head()

查询所有女生的信息:

student[student['Sex']=='F']

查询出所有12岁以上的女生信息:

student[(student['Sex']=='F') & (student['Age']>12)]

查询出所有12岁以上的女生姓名、身高和体重:

student[(student['Sex']=='F') & (student['Age']>12)][['Name','Height','Weight']]

上面的查询逻辑其实非常的简单,需要注意的是,如果是多个条件的查询,必须在&(且)或者|(或)的两端条件用括号括起来。

原创粉丝点击