这一节我们来介绍特征值和特征向量的应用
当矩阵有 n n n 个线性无关的特征向量时,矩阵可以相似对角化,即 A = S Λ S − 1 ( 1 ) \bm{A}=\bm{S}\Lambda \bm{S}^{-1}~~~~(1) A=SΛS−1 (1)
其中 S \bm{S} S 是 n n n 个线性无关的特征向量作为列组成的矩阵. 注意,有没有 n n n 个线性无关的特征向量和矩阵可不可逆没有直接关系,因此可逆矩阵不一定可以相似对角化。
之所以叫相似对角化,是因为我们称 " A \bm{A} A 和 B \bm{B} B 相似" 如果存在 P \bm{P} P 使得 A = P B P − 1 \bm{A=PB}\bm{P}^{-1} A=PBP−1
其中 P \bm{P} P 可以是任意可逆矩阵。此时 A \bm{A} A 和 B \bm{B} B 有同样的特征值。相似矩阵有相同的特征值
Reasoning: 我们来看一下 (1) 式为什么成立. 其实只要展开 A S = A [ v 1 , v 2 , . . . , v n ] = [ λ 1 v 1 , λ 2 v 2 , . . . , λ n v n ] = [ v 1 , v 2 , . . . , v n ] Λ ( λ 1 , λ 2 , . . . , λ n ) = S Λ \bm{AS} = A [\bm{v_1,v_2,...,v_n}]=[\lambda_1\bm{v_1},\lambda_2\bm{v_2},...,\lambda_n\bm{v_n}]=[\bm{v_1,v_2,...,v_n}] \Lambda(\lambda_1,\lambda_2,...,\lambda_n)=\bm{S\Lambda} AS=A[v1,v2,...,vn]=[λ1v1,λ2v2,...,λnvn]=[v1,v2,...,vn]Λ(λ1,λ2,...,λn)=SΛ
答案就很显然了。注意,到这一步任意的 n n n 个特征向量都是成立的,但是要写成(1)的形式的一个必须条件是, S \bm{S} S 可逆,即它由 n n n 个线性无关的特征向量组成。
如果方阵 A \bm{A} A 可以相似对角化,我们可以得到 A k = ( S Λ S − 1 ) k = S Λ k S − 1 \bm{A^k}=(\bm{S}\Lambda \bm{S}^{-1})^k=\bm{S}\Lambda^k \bm{S}^{-1} Ak=(SΛS−1)k=SΛkS−1
Theorem: 如果 A \bm{A} A 的所有特征值的绝对值 ∣ λ i ∣ < 1 |\lambda_i|<1 ∣λi∣<1, 则 A k → 0 as k → ∞ \bm{A}^k\to 0~~\text{as}~~k\to \infty Ak→0 as k→∞
如下图所示,如果居镇素有的特征值都在复平面的单位圆内 (不包括边界), A k → 0 \bm{A}^k\to0 Ak→0 as k → ∞ k\to\infty k→∞.
Fact 1: 不同特征值对应的特征向量线性无关。
所以有 n n n 个不同特征值的矩阵是可相似对角化的
Problem: 解 difference equation u k + 1 = A u k \bm{u_{k+1}=Au_k} uk+1=Auk
初始条件是 u 0 \bm{u_0} u0.
Solution: 把初始条件 u 0 \bm{u_0} u0 表示为 A \bm{A} A 的特征向量的线性组合 u 0 = c 1 v 1 + c 2 v 2 + . . . + c n v n = S c \bm{u_0}=c_1\bm{v_1}+c_2\bm{v_2}+...+c_n\bm{v_n}=\bm{Sc} u0=c1v1+c2v2+...+cnvn=Sc
这里 implicitly 指明这 n n n 个特征向量线性无关,不然没法span到整个空间来表示任意的 u 0 \bm{u_0} u0.
这个思路只要有了,下面就很简单了。我们有 u k = A k u 0 = c 1 λ 1 k v 1 + c 2 λ 2 k v 2 + . . . + c n λ n k v n \bm{u}_k=\bm{A}^k\bm{u_0}=c_1\lambda_1^k\bm{v_1}+c_2\lambda_2^k\bm{v_2}+...+c_n\lambda_n^k\bm{v_n} uk=Aku0=c1λ1kv1+c2λ2kv2+...+cnλnkvn
= Λ k S c =\Lambda^k\bm{Sc} =ΛkSc
例1 求解斐波那契数列第 100 个元素: F 0 = 0 F_0=0 F0=0, F 1 = 1 F_1=1 F1=1, F 2 = 1 F_2=1 F2=1, F 3 = 2 F_3=2 F3=2, F 4 = 3 F_4=3 F4=3, … . 通项为 F k + 2 = F k + 1 + F k F_{k+2}=F_{k+1}+F_{k} Fk+2=Fk+1+Fk.
令 u k = [ F k + 1 , F k ] ⊤ u_k=[F_{k+1},F_k]^\top uk=[Fk+1,Fk]⊤, 我们有 u k + 1 = [ F k + 2 F k + 1 ] = [ 1 1 1 0 ] [ F k + 1 F k ] = [ 1 1 1 0 ] u k u_{k+1}=\begin{bmatrix} F_{k+2} \\ F_{k+1} \\ \end{bmatrix}=\begin{bmatrix} 1 & 1 \\ 1 & 0 \\ \end{bmatrix} \begin{bmatrix} F_{k+1} \\ F_{k} \\ \end{bmatrix}=\begin{bmatrix} 1 & 1 \\ 1 & 0 \\ \end{bmatrix}u_k uk+1=[Fk+2Fk+1]=[1110][Fk+1Fk]=[1110]uk
令 A = [ 1 1 1 0 ] \bm{A} = \begin{bmatrix} 1 & 1 \\ 1 & 0 \\ \end{bmatrix} A=[1110]
它的特征行列式为 λ 2 − λ − 1 = 0 \lambda^2-\lambda-1 = 0 λ2−λ−1=0, λ 1 = 1 + 5 2 , v 1 = [ λ 1 , 1 ] ⊤ \lambda_1=\frac{1+\sqrt{5}}{2},~~~~\bm{v_1}=[\lambda_1,1]^\top λ1=21+5 , v1=[λ1,1]⊤
λ 2 = 1 − 5 2 , v 2 = [ λ 2 , 1 ] ⊤ \lambda_2=\frac{1-\sqrt{5}}{2},~~~~\bm{v_2}=[\lambda_2,1]^\top λ2=21−5 , v2=[λ2,1]⊤
因为 ∣ λ 2 ∣ < 1 |\lambda_2|<1 ∣λ2∣<1, 所以最后其实我们可以得到 F 100 ≈ c 1 λ 1 k v 1 + c 2 λ 2 k v 2 ≈ c 1 λ 1 k v 1 F_{100}\approx c_1\lambda_1^k\bm{v_1}+c_2\lambda_2^k\bm{v_2} \approx c_1\lambda_1^k\bm{v_1} F100≈c1λ1kv1+c2λ2kv2≈c1λ1kv1
斐波那契数列大概是以 λ 1 \lambda_1 λ1 的速度在增长的。