Python数据分析基础(二)——NumPy基础

来源:互联网 发布:左右音箱测试软件 编辑:程序博客网 时间:2024/06/03 07:57

NumPy最重要的特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器。


数组创建函数

函数说明array将输入数据(列表、元组、数组或其他序列类型)转换为ndarray。asarray将输入转换为ndarrayarange类似于内置的range,但返回的是一个ndarray而不是列表ones、ones_like根据指定的形状和dtype创建一个全1数组。zeros、zeros_like根据指定的形状和dtype创建一个全0数组。empty、empty_like创建新数组,只分配内存空间但不填充任何值eye、identity创建一个正方的N*N单位矩阵(对角线为1,其余为0)


NumPy的数据类型

类型类型代码说明int8、uint8i1、u1有符号和无符号的8位(1个字节)整型int16、uint16i2、u2有符号和无符号的16位(2个字节)整型int32、uint32i4、u4有符号和无符号的32位(4个字节)整型int64、uint64i8、u8有符号和无符号的64位(8个字节)整型float16f2半精度浮点数float32f4或f标准的单精度浮点数。与C的float兼容float64f8或d标准的双精度浮点数。与C的double和Python的float对象兼容float128f16或g扩展精度浮点数complex64、complex128、complex256c8、c16、c32分别用两个32位、64位或128位浮点数表示的复数bool?存储True或False值得布尔类型objectOPython对象类型string_S固定长度的字符串类型(每个字符1个字节)unicode_U固定长度的unicode类型(字节数由平台决定)


一元ufunc

函数说明abs、fabs计算整数、浮点数或复数的绝对值。对于非复整数,可以使用更快的fabssqrt计算各元素的平方根square计算各元素的平方exp计算各元素的指数e^xlog、log10、log2、log1p分别为自然对象(底数为e)、底数为10的log、底数为2的log、log(1+x)sign计算各元素的正负号:1(正数)、0(零)、-1(负数)ceil计算大于等于该值的最小正数floor计算小于等于该值的最大整数rint将各元素值四舍五入到最接近的整数,保留dtypemodf将数组的小数和整数部分以两个独立数组的形式返回isnan返回一个表示“哪些值是NaN”的布尔型数组isfinite、isinf分布返回一个表示“哪些元素是有穷的(非inf、非NaN)”或“哪些元素是无穷的”布尔型数组cos、cosh、sin、sinh、tan、tanh普通型和双曲型三角函数arccos、arccosh、arcsin、arcsinh、arctan、arctanh反三角函数logical_not计算各元素not x的真值。


二元ufunc

函数说明add将数组中对应的元素相加subtract从第一个数组中减去第二个数组中的元素multiply数组元素相乘divid、floor_divide除法或向下整除法(丢弃余数)power对第一个数组中的A,根据第二个数组对应得元素B,计算A^Bmaximum、fmax元素级的最大值计算,fmax将忽略NaNminimum、fmin元素级的最小值计算,fmin将忽略NaNmod元素级的求模计算(除法的余数)copysign将第二个数组中的值的符号复制给第一个数组中的值greater、greater_equal、less、less_equal、equal、not_equal执行元素级的比较运算,最终产生布尔型数组。相当于运算符>、>=、<、<=、==、!=logical_and、logical_or、logical_xor执行元素级的逻辑运算。相当于&、|、^


基本数组统计方法

方法说明sum对数组中全部或某轴向的元素求和。零长度的数组sum为0。mean算术平均数。零长度的数组mean为NaN。std、var分别为标准差和方差,自由度可调(默认为n)min、max最大值和最小值argmin、argmax分别为最大和最小元素的索引cumsum所有元素的累计和cumprod所有元素的累计积


数组的集合运算

方法说明unique(x)计算x中的唯一元素,并返回有序结果intersect1d(x,y)计算x和y中的公共元素,并返回有序结果union1d(x,y)计算x和y的并集,并返回有序结果in1d(x,y)得到一个表示“x的元素是否包含于y”的布尔型数组setdiff1d(x,y)集合的差,即元素在x中且不在y中setxor1d(x,y)集合的对称差,即存在于一个数组中但不同时存在于两个数组中的元素


常用的numpy.linalg函数

函数说明diag以一维数组的形式返回方阵的对角线(或非对角线)元素,或将一维数组转换为方阵(非对角线元素为0)dot矩阵乘法trace计算对角线元素的和det计算矩阵的行列式eig计算方阵的本征值和本征向量inv计算方阵的逆pinv计算矩阵的Moore-Penrose伪逆qr计算QR分解svd计算奇异值分解(SVD)solve解线性方程组Ax=b,其中A为一个方阵lstsq计算Ax=b的最小二乘解


部分numpy.random函数

函数说明seed确定随机数生成器的种子permutation返回一个序列的随机排列或返回一个随机排列的范围shuffle对一个序列就地随机排列rand产生均匀分布的样本值randint从给定的上下限范围内随机选取整数randn产生正态分布(均值为0,标准差为1)的样本值binomial产生二项分布的样本值normal产生正态(高斯)分布的样本值beta产生Beta分布的样本值chisquare产生卡方分布的样本值gamma产生Gamma分布的样本值uniform产生在[0,1)中均匀分布的样本值


参考文献:

利用Python进行数据分析.    Wes McKinney.    唐学韬译

阅读全文
0 0
原创粉丝点击