特征值与特征向量
CTF这周又被成功的出脑了,光搞数学去了。
虽然还写了一页buuctf的题,但感觉没啥价值,还得先把之前那几场比赛的题以及涉及到的知识点弄明白先
一向直性子的范大将军直言:
“诶哟,谢天谢地了,我已经说了,你像这样的比赛本身就没有打好基础,你能跟我保证在关键的比赛能赢?务实一点,我劝你先把数学这个理念先搞懂。”
还被阿根廷球迷舍友拉去看世界杯了()
昨晚凌晨进球,整栋宿舍楼在震,迷迷糊糊垂死病中惊坐起。 # 特征值与特征向量
设A为n阶方阵,如果有可逆矩阵 \(P=(\alpha_1,\alpha_2,\cdots,\alpha_n)\) ,使得 \(P^{-1}AP=diag(\lambda_1,\lambda_2,\cdots,\lambda_n)\) 为对角矩阵,则 \(AP=Pdiag(\lambda_1,\lambda_2,\cdots,\lambda_n)\) ,于是 \[ (A\alpha_1,A\alpha_2,\cdots,A\alpha_n)=(\lambda_1\alpha_1,\lambda_2\alpha_2,\cdots,\lambda_n\alpha_n) \] 即 \(A\alpha_i=\lambda_i,i=1,2,\cdots,n.\)
称 \(\alpha_1,\alpha_2,\cdots,\alpha_n\) 为方阵A的特征向量.
定义1(特征值的定义)
设A为n阶方阵.如果存在数λ和非零向量α,使得Aα=λα,则称λ为A的特征值,称α为A的属于特征值λ的特征向量(或A对应于特征值λ的特征向量)
将Aα=λα改写为(λE-A)α=0,——>对于特征值λ,齐次线性方程组(λE-A)x=0是有非零解的
若齐次线性方程组(λE-A)x=0有非零解α0,则数λ0是A的特征值,α0是属于特征值λ0的特征向量.
数λ是A的特征值当且仅当齐次线性方程组(λE-A)x=0有非零解
齐次线性方程组(λE-A)x=0有非零解的充要条件是|(λE-A)|=0
因此,数λ是A的特征值当且仅当|(λE-A)|=0
定义2(特征方程)
设A=(aij)为n阶方阵, \[ |\lambda E-A|=\begin{vmatrix}\ \lambda-a_{11} &-a_{12} &\cdots &-a_{1n}\\ -a_{21} &\lambda-a_{22} &\cdots &-a_{2n}\\ \vdots &\vdots & & \vdots\\ -a_{n1} &-a{n2} &\cdots &\lambda-a_{nn} \end{vmatrix} \] 是一个关于λ的n次多项式,称为A的特征多项式.
方程|(λE-A)|=0是一个以λ为未知量的一元n次方程,称为A的特征方程
显然,A的特征值就是A的特征方程的根(因而又将特征值称为特征根)
n阶方阵A的特征方程在复数范围有n个根(重根按重数计),所以n阶方阵A在复数范围内有n个特征值.对于A的特征值λ,A的属于特征值λ的特征向量α就是齐次线性方程组(λE-A)x=0的非零解
特征向量总是相对于特征值而言的,一个特征值所具有的特征向量不唯一
求解步骤
(1)求出特征值(根)|(λE-A)|=0
(2)求出特征向量——>求出方程组(λE-A)x=0的非零解
设λ=λi为方阵A的一个特征值,则由方程(A-λiE)x=0 可求得非零解x=pi ,
pi即是对应于特征值λi的特征向量
性质1
若α1,α2都是A的属于特征值λ0的特征向量,则对任意使 \(k_1\alpha_1+k_2\alpha_2 \neq0\) 的数k1和k2,\(\alpha=k_1\alpha_1+k_2\alpha_2\) 仍是A属于特征值λ0的特征向量
属于同一特征值的特征向量的非零线性组合仍是属于这个特征值的特征向量
每个特征值对应有无穷多个特征向量
解空间的线性封闭性
性质2
设 \(\lambda_1,\lambda_2,\cdots,\lambda_n\) 为n阶方阵A= \((a_{ij})\) 的n个特征值,则 \[ \begin{split} &(1)\lambda_1\lambda_2\cdots\lambda_n=|A|\\ &(2)\lambda_1+\lambda_2+\cdots+\lambda_n=a_{11}+a_{22}+\cdots+a_{nn}\\ &记a_{11}+a_{22}+\cdots+a_{nn}为trA,称为A的迹 \end{split} \] 证明: \[ |\lambda E-A|=\begin{vmatrix}\ \lambda-a_{11} &-a_{12} &\cdots &-a_{1n}\\ -a_{21} &\lambda-a_{22} &\cdots &-a_{2n}\\ \vdots &\vdots & & \vdots\\ -a_{n1} &-a{n2} &\cdots &\lambda-a_{nn}\ \end{vmatrix} \] 右式的展开式只有项 \((\lambda a_{11})(\lambda a_{22})\cdots(\lambda a_{nn})\) 的展开式由λ的n和n-1次项。这个行列式的展开式中其它项都含有至少一个不在对角线上的元素,设为aij,该行列式对角线上的元素aii-λ和ajj-λ都不能出现在这个项中,于是这个项的最高次数为n-2
推论1
设A为n阶方阵,则|A|=0的充要条件是是λ=0为A的特征值
由(1)可得
推论2
n阶矩阵可逆 = A的n个特征值 \(\lambda_1,\lambda_2,\cdots,\lambda_n\) 全不为零
性质3
n阶方阵A与它的转置矩阵AT有相同的特征多项式,因而有相同的特征值
但A与AT未必有相同的特征向量
性质4
若λ为A的特征值,则对任意多项式 \(f(x)=a_mx^m+a_{m-1}x^{m-1}+\cdots+a_1x+a_0\) ,\(f(\lambda)\) 为 \(f(A)\) 的特征值,其中 \(f(A)=a_mA^m+a_{m-1}A^{m-1}+\cdots+a_1A+a_0E\) 为与f(x)对应的A的矩阵多项式;当A可逆时, \(\frac{1}{\lambda}\) 是A-1的特征值
λ是方阵A的特征值,λk是Ak的特征值(数学归纳法可证), \[ \begin{split} &\varphi(\lambda)=a_0+a_1\lambda+\cdots+a_m\lambda^m\\ &\varphi(A)=a_0E+a_1A+\cdots+a_mA^m \end{split} \] A与f(x)及A-1(在可逆的前提下)有相同的特征向量α
AT=-A(反对称阵),则A+E可逆
A2=E(称A为对合矩阵),则A的特征值只能为1或-1
方阵的相似化简
定义3(相似矩阵)
设A,B为n阶方阵。如果存在某个n阶可逆矩阵P,使得B=P-1AP,则称B是A的相似矩阵,或称A与B相似,记为A~B
(1)反身性:A~A
(2)对称性:A~B,则B~A
(3)传递性:若A~B,B~C,则A~C
相似矩阵有相同的行列式
性质5
如果A~B,则A与B有相同的特征多项式,因而有相同的特征值与行列式
性质6
如果A~B,则f(A)~f(B),其中f(x)=amxm+am-1mm-1+...+a1x+a0
性质7
如果A~B,A可逆,则B可逆,且A-1~B-1
A可对角化
能找到可逆的矩阵P,使得P-1AP为对角矩阵
定理1
n阶方阵A相似于对角矩阵的充分必要条件是A有n个线性无关的特征向量.
可逆矩阵P的行(列)向量组是线性无关向量组
定理告诉我们:只需要找出A的n个线性无关的特征向量 \(p_1,p_2,\cdots,p_n\) 以它们为列向量构成 \(P=(p_1,p_2,\cdots,p_n)\) ,则 \(P^-1AP\) 为对角矩阵.这个对角矩阵称为A的相似标准形,其对角元素恰好为A的n个特征值
定义4
如果存在可逆矩阵P,使得P-1AP=Λ为对角矩阵,则称对角矩阵Λ为A的相似标准形
在求A的相似标准形Λ时,Λ的对角元可以是按任意顺序排列的.但是P的各列的排列次序与Λ中各个对角元(即A的全体特征值)的排列次序必须互相对应,P的第k列所对应的特征值就是Λ的第k个对角元素(k=1,2...,n).
定理2
设 \(\lambda_1,\lambda_2,\cdots,\lambda_m\)是方阵A的m个特征值,\(p_1,p_2,\cdots,p_m\) 依次是与之对应的特征向量.如果 \(\lambda_1,\lambda_2,\cdots,\lambda_m\) 各不相等,则 \(p_1,p_2,\cdots,p_m\) 线性无关
证明:设有常数 \(x_1,x_2,\cdots,x_m\) 使 \(x_1p_1+x_2p_2+\cdots+x_mp_m=0\)
则 \(A(x_1p_1+x_2p_2+\cdots+x_mp_m)=0\) ,即
\(x_1Ap_1+x_2Ap_2+\cdots+x_mAp_m=0\)
\(x_1\lambda_1 p_1+x_2\lambda_2p_2+\cdots+x_m\lambda_mp_m=0\)
类推之,有
\(\lambda_1^kx_1p_1+\lambda_2^kx_2p_2+\cdots+\lambda_m^kx_mp_m=0(k=1,2,\cdots,m-1)\)
把以上各式写成矩阵形式,得: \[ \begin{matrix}\left(x_1p_1,x_2p_2,\cdots,x_mp_m\right)\end{matrix} \left[ \begin{matrix} 1 &\lambda_1 &\cdots &\lambda_1^{m-1}\\ 1 &\lambda_2 &\cdots &\lambda_2^{m-1}\\ \vdots &\vdots & &\vdots\\ 1 &\lambda_m &\cdots &\lambda_m^{m-1} \end{matrix} \right] =(0,0,\cdots,0) \] 上式等号左端第二个矩阵的行列式为范德蒙行列式,当λi各不相等时该行列式不等于0,从而该矩阵可逆,于是有
\((x_1p_1,x_2p_2,\cdots,x_mp_m)=(0,0,\cdots,0)\)
即 \(x_jp_j=0(j=1,2,\cdots,m)\)
但 \(p_j\neq 0\) ,故 \(x_j=0(j=1,2,\cdots,m)\) 所以向量组 \(p_1,p_2,\cdots,p_m\) 线性无关
还可用数学归纳法证明
证明:当k=1时,定理显然成立.
假设k=m时定理成立,当k=m+1时,设 \[ a_1p_1+a_2p_2+\cdots+a_{m+1}p_{m+1}=0 \tag{1} \] 则 \[ \begin{split} &A(a_1p_1+a_2p_2+\cdots+a_{m+1}p_{m+1}=0)\\ &a_1Ap_1+a_2Ap_2+\cdots+a_{m+1}Ap_{m+1}=0\\ \end{split} \]
\[ a_1\lambda_1p_1+a_2\lambda_2p_2+\cdots+a_{m+1}\lambda_{m+1}p_{m+1}=0\tag{2} \]
将式(1)两边乘以λm+1,再与式(2)相减得: \[ a_1(\lambda_{m+1}-\lambda_1)p_1+a_2(\lambda_{m+1}-\lambda_2)p_2 +\cdots+a_m(\lambda_{m+1}-\lambda_m)p_m=0 \] 由假设归纳可得:\(p_1,p_2,\cdots,p_m\) 线性无关,所以 \[ a_1(\lambda_{m+1}-\lambda_1)p_1=0,a_2(\lambda_{m+1}-\lambda_2)p_2 =0,\cdots,a_m(\lambda_{m+1}-\lambda_m)p_m=0 \] 因为 \(\lambda_{m+1}-\lambda_i\neq0,i=1,2,\cdots,m\), 所以 \(a_1=a_2=\cdots=a_m=0\) 代入式(1)得
\(a_{m+1}p_{m+1}=0\) 因为 \(p_{m+1}\neq0\) ,故am+1=0 ,这表明 \(p_1,p_2,\cdots,p_{m+1}\) 线性无关,定理得证
推论2
如果n阶方阵A有n个两两不同得特征值,则A可对角化
推论3
设 \(\lambda_1,\lambda_2,\cdots,\lambda_m\)是方阵A的两两不同特征值,\(p_{i1},p_{i2},\cdots,p_{ir_i}\) 是A的属于λi的线性无关的特征向量 \((1\leq i\leq m)\) ,则
\(p_{11},p_{12},\cdots,p_{1r_1},p_{21},\cdots,p_{2r_2},\cdots,p_{m1},p_{m2},\cdots,p_{mr_m}\)
共 \((r_1+r_2+\cdots+r_m个向量)\) 仍线性无关
即若选取λi对应A的特征向量内部线性无关,那么多个λ对应A的特征向量仍线性无关
将属于不同特征值的线性无关的特征向量合并在一起,可以组成个数更多的线性无关的特征向量组
定理3
设λ0是n阶方阵A的重数为k的特征值,对应于λ0,A最多有m个线性无关的特征向量,则 \(m\leq k\)
例:λ1=2,λ2=3,k=1,最多有1个线性无关的特征向量
λ1=λ2=2,k=2,最多有2个线性无关的特征向量
对于n阶方阵A,最多能有n个线性无关的特征向量<——A最多能有重数为n的特征值
定理4
方阵A可对角化的充分必要条件是对应于A的任意特征值λ,A有k个线性无关的特征向量,其中k是λ作为特征值的重数
线性无关的特征向量个数=齐次线性方程组(λE-A)x=0基础解析的向量个数
对于单特征值,必有属于它的特征向量
推论4
如果n阶方阵A的n个特征值个不相等,则A与对角矩阵相似,(也称A可对角化)
定理5
若n阶方阵A与B相似,则A与B的特征多项式相同,从而A与B的特征值亦相同
推论5
若n阶方阵A与对角阵 \[ A= \left[ \begin{matrix} \lambda_1 & & & \\ & &\lambda_2 & & \\ & & &\ddots & \\ & & & &\lambda_n \end{matrix} \right] \] 相似,则 \(\lambda_!,\lambda_2,\cdots,\lambda_n\) 就是A的n个特征值