python模块学习pandas(-)

来源:互联网 发布:数据库查询怎么保存 编辑:程序博客网 时间:2024/06/10 07:00

1.query()方法

当需要根据一定的条件对行进行过滤时,通常可以先创建一个布尔数组,使用该数组获取True对应的行,例如下面的程序获得时间大于等于20131101,小于20131102的行。由于Python中无法自定义not 、 and和or等关键字的行为,因此与改用~、&、|等位运算符。然而这些运算符的优先级比比较运算符高,因此需要用括号将比较运算括起来。自己刚刚的例子,可以进行文本读取,写入,保存,尤其对时间系列求均值,这部分可以替代excel按条件查询:

for tt in ['11']:    data = pd.read_csv('./observe_aod/hour/2013' + tt + '.txt')    file = open('./observe_aod/hour/2013day' + tt + '.txt', 'w')    file.write('date,aod,pblh'+'\n')    for i in range(1,31):        s0="%02d" % i        s1 = "%02d" % (i+1)        golobal =data.query('date >=201311'+s0+'00 and date < 201311'+s1+'00')        file.write('201311'+s0+ ',' + str(golobal['aod'].mean()) + ',' + str(golobal['pblh'].mean()) + '\n')
out:
D:\Python27\python.exe E:/python_netcdf/边界层高度提取.py          date       aod         pblh0   2013110100  0.280415  1216.6666671   2013110101  0.100409  1169.117647


原创粉丝点击