numpy 函数里面的axis参数的含义

来源:互联网 发布:linux网络运维 编辑:程序博客网 时间:2024/06/07 20:42

前言

numpy支持对矩阵和数组进行运算,因此很多numpy的很多运算都需要指定操作的维数参数axis(当然这些axis都有带默认值的),本博客以numpy.sum求和函数为例,具体分析axis参数不同取值下的含义。

先说结论

设 numpy.sum的输入矩阵为a. numpy.sum的返回矩阵为rst.
则矩阵a的形状为:sp=numpy.shape(a),例如sp=[m,n,p,q···]
rst的形状为将sp的第axis个元素设为1,即:
sp’=sp
sp’[axis]=1
numpy.shape(rst)==sp’ 为真.
例如:axis=2,
如果a是矩阵则:
rst的形状应该为:[m,n,1,q···]
对于rst的元素rst[m’,n’,1,q’···]计算方法为:
【注意第axis轴】下标只能取1.
numpy.sum(a,axis=2)的内部计算其实为:

for i in range(sp[axis]):    rst[m'][n'][1][q'][···]+=a[m'][n'][i][q'][···]

结果上发现是第axis维变成1,计算过程其实是对第axis轴进行了遍历,让sp[axis]个元素合并成一个元素。

而如果a是一个array则:
rst的形状应该为:[m,n,q,···]
注意第axis维直接不见了
numpy.sum(a,axis=2)的内部计算

for i in range(sp[axis]):    rst[m'][n'][q'][···]+=a[m'][n'][i][q'][···]

结果上发现是第axis维变没了,计算过程其实是对第axis轴进行了遍历,让sp[axis]个元素合并成一个元素。

举例说明

简单点的

import numpy as npa=np.mat([[1,2,3],[4,5,6]])

a的shape:

print (np.shape(a))

输出:(2, 3)

计算:np.sum(a,axis=0)

>>> s0=np.sum(a,axis=0)>>> s0matrix([[5, 7, 9]])

按照【先说结论】的方法:
axis=0
a的形状:(2,3)
所以rst的形状为:(1,3)
对于rst的每个元素p,q:
rst[p][q] 的 计算方法为(其中p只能等于0,q=0,1,2):

for i in range(np.shape(a)[axis]):     rst[0][q]+=a[i][q]

所以:
rst[0][0]=a[0][0]+a[1][0]=1+4=5
rst[0][1]=a[0][1]+a[1][1]=2+5=7
rst[0][2]=a[0][2]+a[1][2]=3+6=9
所以rst就是[[5,7,9]]

计算 numpy.sum(a,axis=1)
a=[[1,2,3],[4,5,6]

>>> s1=np.sum(a,axis=1)>>> s1matrix([[ 6],        [15]])>>> np.shape(s1)(2, 1)>>> 

一样的分析方法:

按照【先说结论】的方法:
axis=1
a的形状:(2,3)
所以rst的形状为:(2,1)
对于rst的每个元素p,q:
rst[p][q] 的 计算方法为(其中p=0,1 ,而q只能为0):

for i in range(np.shape(a)[axis]):     rst[p][0]+=a[p][i]

所以:
rst[0][0]=a[0][0]+a[0][1]+a[0][2]=1+2+3=6
rst[1][0]=a[1][1]+a[1][1]+a[1][2]=4+5+6=15

所以rst就是[[6],[15]].

复杂点的:

>>> b=np.array([[[1,2,3],[4,5,6],[7,8,9]]])>>> barray([[[1, 2, 3],        [4, 5, 6],        [7, 8, 9]]])>>> np.shape(b)(1, 3, 3)

b是1x3x3,是一个array.
那么np.sum(b,axis=2)等于多少呢?
标准答案:

>>> print (np.sum(b,axis=2))[[ 6 15 24]]

分析结果:
返回值应该为1x3形状的array,对于元素rst[p][q].
rst[p][q]=a[p][q][0]+a[p][q][1]+a[p][q][2]
例如rst[0][1]=a[0][1][0]+a[0][1][1]+a[0][1][2]=8+5+6=15.
而np.sum(b,axis=2)的第一行第二个元素正是 15.

关于axis默认值

一般此类针对矩阵、array的函数都有一个axis参数,并且此默认为None.当axis为None使 表示运算是遍历矩阵(array)的每一个元素的,是逐元素的计算。