numpy-线性代数

来源:互联网 发布:古装淘宝 编辑:程序博客网 时间:2024/06/06 03:54

讲解Python在线性代数中的应用,包括:

回到顶部

一、矩阵创建

先导入Numpy模块,在下文中均采用np代替numpy

1 import numpy as np

矩阵创建有两种方法,一是使用np.mat函数或者np.matrix函数,二是使用数组代替矩阵,实际上官方文档建议我们使用二维数组代替矩阵来进行矩阵运算;因为二维数组用得较多,而且基本可取代矩阵。

复制代码
 1 >>> a = np.mat([[1, 2, 3], [4, 5, 6]])   #使用mat函数创建一个2X3矩阵 2 >>> a 3 matrix([[1, 2, 3], 4         [4, 5, 6]]) 5 >>> b = np.matrix([[1, 2, 3], [4, 5, 6]])#np.mat和np.matrix等价 6 >>> b 7 matrix([[1, 2, 3], 8         [4, 5, 6]]) 9 >>> a.shape     #使用shape属性可以获取矩阵的大小10 (2, 3)
复制代码
1 >>> c = np.array([[1, 2, 3], [4, 5, 6]]) #使用二维数组代替矩阵,常见的操作通用2 >>> c#注意c是array类型,而a是matrix类型3 array([[1, 2, 3],4        [4, 5, 6]])

单位阵的创建

复制代码
1 >>> I = np.eye(3)2 >>> I3 array([[ 1.,  0.,  0.],4        [ 0.,  1.,  0.],5        [ 0.,  0.,  1.]])
复制代码

矩阵元素的存取操作:

复制代码
1 >>> a[0]#获取矩阵的某一行2 matrix([[1, 2, 3]])3 >>> a[:, 0].reshape(-1, 1)#获取矩阵的某一列4 matrix([[1],5         [4]])6 >>> a[0, 1]#获取矩阵某个元素7 2
复制代码
回到顶部

二、矩阵乘法和加法

矩阵类型,在满足乘法规则的条件下可以直接相乘

复制代码
 1 >>> A = np.mat([[1, 2, 3], [3, 4, 5], [6, 7, 8]])#使用mat函数 2 >>> B = np.mat([[5, 4, 2], [1, 7, 9], [0, 4, 5]]) 3 >>> A   #注意A, B都是matrix类型,可以使用乘号,如果是array则不可以直接使用乘号 4 matrix([[1, 2, 3], 5         [3, 4, 5], 6         [6, 7, 8]]) 7 >>> B 8 matrix([[5, 4, 2], 9         [1, 7, 9],10         [0, 4, 5]])11 >>> A * B#学过线性代数的都知道:A * B != B * A12 matrix([[  7,  30,  35],13         [ 19,  60,  67],14         [ 37, 105, 115]])15 >>> B * A16 matrix([[ 29,  40,  51],17         [ 76,  93, 110],18         [ 42,  51,  60]])
复制代码

如果是使用数组代替矩阵进行运算则不可以直接使用乘号,应使用dot()函数。dot函数用于矩阵乘法,对于二维数组,它计算的是矩阵乘积,对于一维数组,它计算的是内积。

复制代码
 1 >>> C = np.array([[1, 2, 3], [3, 4, 5], [6, 7, 8]]) 2 >>> D = np.array([[5, 4, 2], [1, 7, 9], [0, 4, 5]]) 3 >>> C          #C, D都是array类型,不能直接使用乘号,应该使用dot()函数 4 array([[1, 2, 3], 5        [3, 4, 5], 6        [6, 7, 8]]) 7 >>> D 8 array([[5, 4, 2], 9        [1, 7, 9],10        [0, 4, 5]])11 #>>> C * D, Error, 注意这不是矩阵乘法!!!12 >>> np.dot(C, D)#正确的写法,得到的结果和上一段代码的第11行的结果的一样的。13 array([[  7,  30,  35],14        [ 19,  60,  67],15        [ 37, 105, 115]])
复制代码

如何理解对于一维数组,它计算的是内积???

注意:在线性代数里面讲的维数和数组的维数不同,如线代中提到的n维行向量在Python中是一维数组,而线代中的n维列向量在Python中是一个shape为(n, 1)的二维数组!

第16行,第18行:F是一维数组,G是二维数组,维数不同,个人认为相乘没有意义,但是16行没有错误,18行报错。关于dot()的乘法规则见:NumPy-快速处理数据–矩阵运算

复制代码
 1 >>> E = np.array([1, 2, 3]) 2 >>> F = np.array([4, 3, 9]) 3 >>> E.shape#E,F都是一维数组 4 (3,) 5 >>> np.dot(E, F) 6 37 7 >>> np.dot(F, E) 8 37 9 >>> G = np.array([4, 3, 9]).reshape(-1, 1)10 >>> G11 array([[4],12        [3],13        [9]])14 >>> G.shape15 (3, 1)16 >>> np.dot(F, G)#因此dot(F, G)不再是内积,而是一个只有一个元素的数组17 array([106])18 >>> np.dot(G, F)#ValueError: shapes (3,1) and (3,) not aligned: 1 (dim 1) != 3 (dim 0)19 >>> E.shape = (1, -1)#把E改为二维数组20 >>> E21 array([[1, 2, 3]])22 >>> E.shape23 (1, 3)24 >>> np.dot(G, E)#3×1的G向量乘以1×3的E向量会得到3×3的矩阵25 array([[ 4,  8, 12],26        [ 3,  6,  9],27        [ 9, 18, 27]])
复制代码

矩阵的加法运算

复制代码
1 >>> A + B#矩阵的加法对matrix类型和array类型是通用的2 matrix([[ 6,  6,  5],3         [ 4, 11, 14],4         [ 6, 11, 13]])5 >>> C + D6 array([[ 6,  6,  5],7        [ 4, 11, 14],8        [ 6, 11, 13]])
复制代码

矩阵的数乘运算

复制代码
1 >>> 2 * A#矩阵的数乘对matrix类型和array类型是通用的2 matrix([[ 2,  4,  6],3         [ 6,  8, 10],4         [12, 14, 16]])5 >>> 2 * C6 array([[ 2,  4,  6],7        [ 6,  8, 10],8        [12, 14, 16]])
复制代码
回到顶部

三、矩阵的转置

复制代码
 1 >>> A = np.array([[1, 2, 3], [3, 4, 5], [6, 7, 8]]) 2 >>> B = np.array([[5, 4, 2], [1, 7, 9], [0, 4, 5]]) 3 >>> A 4 array([[1, 2, 3], 5        [3, 4, 5], 6        [6, 7, 8]]) 7 >>> A.T  #A的转置 8 array([[1, 3, 6], 9        [2, 4, 7],10        [3, 5, 8]])11 >>> A.T.T#A的转置的转置还是A本身12 array([[1, 2, 3],13        [3, 4, 5],14        [6, 7, 8]])
复制代码

验证矩阵转置的性质:(A±B)’=A’±B’

复制代码
1 >>> (A + B).T2 array([[ 6,  4,  6],3        [ 6, 11, 11],4        [ 5, 14, 13]])5 >>> A.T + B.T6 array([[ 6,  4,  6],7        [ 6, 11, 11],8        [ 5, 14, 13]])
复制代码

验证矩阵转置的性质:(KA)’=KA’

复制代码
1 >>> 10 * (A.T)2 array([[10, 30, 60],3        [20, 40, 70],4        [30, 50, 80]])5 >>> (10 * A).T6 array([[10, 30, 60],7        [20, 40, 70],8        [30, 50, 80]])
复制代码

验证矩阵转置的性质:(A×B)’= B’×A’

复制代码
1 >>> np.dot(A, B).T2 array([[  7,  19,  37],3        [ 30,  60, 105],4        [ 35,  67, 115]])5 >>> np.dot(B.T, A.T)6 array([[  7,  19,  37],7        [ 30,  60, 105],8        [ 35,  67, 115]])
复制代码
回到顶部

四、方阵的迹

方阵的迹就是主对角元素之和,使用trace()函数获得方阵的迹:

复制代码
 1 >>> A 2 array([[1, 2, 3], 3        [3, 4, 5], 4        [6, 7, 8]]) 5 >>> B 6 array([[5, 4, 2], 7        [1, 7, 9], 8        [0, 4, 5]]) 9 >>> np.trace(A)  # A的迹等于A.T的迹10 1311 >>> np.trace(A.T)12 1313 >>> np.trace(A+B)# 和的迹 等于 迹的和14 3015 >>> np.trace(A) + np.trace(B)16 30
复制代码
回到顶部

五、计算行列式

复制代码
1 >>> A2 array([[1, 2],3        [1, 3]])4 >>> np.linalg.det(A)5 1.0
复制代码
回到顶部

六、逆矩阵/伴随矩阵

若A存在逆矩阵(满足det(A) != 0,或者A满秩),使用linalg.inv求得方阵A的逆矩阵

复制代码
 1 import numpy as np 2 >>> A = np.array([[1, -2, 1], [0, 2, -1], [1, 1, -2]]) 3 >>> A 4 array([[ 1, -2,  1], 5        [ 0,  2, -1], 6        [ 1,  1, -2]]) 7 >>> A_det = np.linalg.det(A)      #求A的行列式,不为零则存在逆矩阵 8 >>> A_det 9 -3.000000000000000410 >>> A_inverse = np.linalg.inv(A)  #求A的逆矩阵11 >>> A_inverse12 array([[ 1.        ,  1.        ,  0.        ],13        [ 0.33333333,  1.        , -0.33333333],14        [ 0.66666667,  1.        , -0.66666667]])15 >>> np.dot(A, A_inverse)          #A与其逆矩阵的乘积为单位阵16 array([[ 1.,  0.,  0.],17        [ 0.,  1.,  0.],18        [ 0.,  0.,  1.]])19 >>> A_companion = A_inverse * A_det  #求A的伴随矩阵20 >>> A_companion21 array([[-3., -3., -0.],22        [-1., -3.,  1.],23        [-2., -3.,  2.]])
复制代码
回到顶部

七、解一元线性方程

使用np.linalg.solve()解一元线性方程组,待解方程为:

 x + 2y +  z = 72x -  y + 3z = 73x +  y + 2z =18
复制代码
 1 >>> import numpy as np 2 >>> A = np.array([[1, 2, 1], [2, -1, 3], [3, 1, 2]]) 3 >>> A    #系数矩阵 4 array([[ 1,  2,  1], 5        [ 2, -1,  3], 6        [ 3,  1,  2]]) 7 >>> B = np.array([7, 7, 18]) 8 >>> B 9 array([ 7,  7, 18])10 >>> x = np.linalg.solve(A, B)11 >>> x12 array([ 7.,  1., -2.])13 >>> np.dot(A, x)#检验正确性,结果为B14 array([  7.,   7.,  18.])
复制代码

使用np.allclose()检测两个矩阵是否相同:

1 >>> np.allclose(np.dot(A, x), B)#检验正确性2 True

使用 help(np.allclose) 查看 allclose() 的用法:

复制代码
allclose(a, b, rtol=1e-05, atol=1e-08)    Parameters    ----------    a, b : array_like        Input arrays to compare.    rtol : float        The relative tolerance parameter (see Notes).    atol : float        The absolute tolerance parameter (see Notes).    Returns    -------    allclose : bool        Returns True if the two arrays are equal within the given        tolerance; False otherwise.
复制代码
回到顶部

八、计算矩阵距离

矩阵的距离,这里是的是欧几里得距离,其他距离表示方法我们以后再谈,这里说一下如何计算两个形状相同矩阵之间的距离。

复制代码
 1 >>> A = np.array([[0, 1], [1, 0]])#先创建两个矩阵 2 >>> B = np.array([[1, 1], [1, 1]]) 3 >>> C = A - B       #计算距离矩阵C 4 >>> C 5 array([[-1,  0], 6        [ 0, -1]]) 7 >>> D = np.dot(C, C)#距离矩阵的平方 8 >>> E = np.trace(D) #计算矩阵D的迹 9 >>> E10 211 >>> E ** 0.5        #将E开平方得到距离12 1.4142135623730951
复制代码

关于计算矩阵距离我也不理解。网上看的帖子,先记下来

回到顶部

九、矩阵的秩

numpy包中的linalg.matrix_rank方法计算矩阵的秩:

复制代码
 1 >>> import numpy as np 2 >>> I = np.eye(3)#先创建一个单位阵 3 >>> I 4 array([[ 1.,  0.,  0.], 5        [ 0.,  1.,  0.], 6        [ 0.,  0.,  1.]]) 7 >>> np.linalg.matrix_rank(I)# 8 3 9 >>> I[1, 1] = 0#将该元素置为010 >>> I11 array([[ 1.,  0.,  0.],12        [ 0.,  0.,  0.],13        [ 0.,  0.,  1.]])14 >>> np.linalg.matrix_rank(I)#此时秩变成215 2
复制代码
回到顶部

十、求方阵的特征值特征向量

复制代码
 1 >>> import numpy as np 2 >>> x = np.diag((1, 2, 3))#创建一个对角矩阵! 3 >>> x 4 array([[1, 0, 0], 5        [0, 2, 0], 6        [0, 0, 3]]) 7 >>> a,b = np.linalg.eig(x)#特征值保存在a中,特征向量保存在b中 8 >>> a 9 array([ 1.,  2.,  3.])10 >>> b11 array([[ 1.,  0.,  0.],12        [ 0.,  1.,  0.],13        [ 0.,  0.,  1.]])
复制代码

根据公式 Ax = λx 检验特征值与特征向量是否正确:

复制代码
 1 for i in range(3):#方法一 2     if np.allclose(np.dot(a[i], b[:, i]), x[:, i]):#np.allclose()方法在第七节提到过 3         print 'Right' 4     else: 5         print 'Error' 6  7 for i in range(3):#方法二 8     if (np.dot(a[i], b[:, i]) == x[:, i]).all(): 9         print 'Right'10     else:11         print 'Error'
复制代码

注意,如果写成 if np.dot(a[i], b[:, i]) == x[:, i]: 是错误的:(矩阵包含有多个值,应该使用a.any()或者a.all()判断)

 ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all() 

回到顶部

十一、判断正定矩阵

设M是n阶方阵,如果对任何非零向量z,都有zMz> 0,其中z 表示z的转置,就称M正定矩阵。

判定定理1:对称阵A为正定的充分必要条件是:A的特征值全为正。
判定定理2:对称阵A为正定的充分必要条件是:A的各阶顺序主子式都为正。
判定定理3:任意阵A为正定的充分必要条件是:A合同于单位阵。

下面用定理1判断对称阵是否为正定阵

复制代码
 1 >>> import numpy as np 2 >>> A = np.arange(16).reshape(4, 4) 3 >>> A 4 array([[ 0,  1,  2,  3], 5        [ 4,  5,  6,  7], 6        [ 8,  9, 10, 11], 7        [12, 13, 14, 15]]) 8 >>> A = A + A.T             #将方阵转换成对称阵 9 >>> A10 array([[ 0,  5, 10, 15],11        [ 5, 10, 15, 20],12        [10, 15, 20, 25],13        [15, 20, 25, 30]])14 >>> B = np.linalg.eigvals(A)#求B的特征值,注意:eig()是求特征值特征向量15 >>> B16 array([  6.74165739e+01 +0.00000000e+00j,17         -7.41657387e+00 +0.00000000e+00j,18          2.04219701e-15 +3.94306094e-15j,19          2.04219701e-15 -3.94306094e-15j])20 21 if np.all(B>0):             #判断是不是所有的特征值都大于0,用到了all函数,显然对称阵A不是正定的22     print 'Yes'
复制代码

创建一个对角元素都为正的对角阵,它一定是正定的:

复制代码
1 >>> A = np.diag((1, 2, 3))#创建对角阵,其特征值都为正2 >>> B = np.linalg.eigvals(A)#求特征值3 >>> B4 array([ 1.,  2.,  3.])5 >>> if np.all(B>0):#判断特征值是否都大于06     print 'Yes'
复制代码

网上查到更简便的方法是对对称阵进行cholesky分解,如果像这样没有提示出错,就说明它是正定的。如果提示出错,就说明它不是正定矩阵,你可以使用try函数捕获错误值:

复制代码
 1 # -*- coding: utf-8 -*- 2 import numpy as np 3  4 A = np.arange(16).reshape(4, 4) 5 A = A + A.T 6 print A 7 try: 8     B = np.linalg.cholesky(A) 9 except :10     print ('不是正定矩阵,不能进行cholesky分解。')
复制代码

当不能进行cholesky分解时,出现的异常是: LinAlgError: Matrix is not positive definite ,但是但是LinAlgError不是Python标准异常,因此不能使用这条语句。

1 except LinAlgError as reason:2     print ('不是正定矩阵,不能进行cholesky分解。\n出错原因是:' + str(reason))

 

原创粉丝点击