@@ -8,3 +8,167 @@ author:
88name : Schur分解
99---
1010
11+ # Schur 分解
12+
13+ ## 1. 定理
14+
15+ > [ !info] Lemma 1.1
16+
17+ 设$T\in\mathbb{C}^{n\times n}$ 被划分如下,
18+
19+ $$
20+ T = \begin{bmatrix}
21+ T_{11}&T_{12}\\0&T_{22}
22+ \end{bmatrix},
23+ $$
24+
25+ 则$\lambda(T) = \lambda(T_ {11})\cup \lambda(T_ {22})$,其中 $\lambda(\cdot)$ 是指谱集,即特征值的集合。
26+
27+ *** 证明***
28+
29+ 假设存在 $x \neq 0$ 使得$Tx = \begin{bmatrix}T_ {11}&T_ {12}\\ 0&T_ {22} \end{bmatrix}\begin{bmatrix}x_1\\ x_2 \end{bmatrix} = \lambda \begin{bmatrix}x_1\\ x_2\end{bmatrix}$。
30+
31+ - 如果$x_2\neq 0$,则$T_ {22}x_2 = \lambda x_2$,这意味着$\lambda\in\lambda(T_ {22})$。
32+ - 如果$x_2 = 0$,则$T_ {11}x_1 = \lambda x_1$,这意味着$\lambda\in\lambda(T_ {11})$。
33+
34+ 因此$\lambda(T) \subset \lambda(T_ {11})\cup \lambda(T_ {22})$。$\lambda(T_ {11}) \cup \lambda(T_ {22}) \subset \lambda(T)$ 是显然的,则$\lambda(T) = \lambda(T_ {11})\cup \lambda(T_ {22})$。 $\blacksquare$
35+
36+ > [ !info] Lemma 1.2
37+
38+ 设 $A\in\mathbb{C}^{n\times n}$,$B\in\mathbb{C}^{p\times p}$ 和 $X\in\mathbb{C}^{n\times p}$ 且 $\text{rank}(X)=p$ 满足
39+
40+ $$
41+ AX = XB,
42+ $$
43+
44+ 则存在一个酉矩阵 $U\in\mathbb{C}^{n\times n}$ 使得
45+
46+ $$
47+ U^H A U = T = \begin{bmatrix}T_{11}&T_{12}\\ 0&T_{22} \end{bmatrix}
48+ $$
49+
50+ 其中 $T_ {11}\in\mathbb{C}^{p\times p}$ 和 $T_ {22}\in\mathbb{C}^{(n-p)\times (n-p)}$,且 $\lambda(T_ {11}) = \lambda(A) \cap \lambda(B)$。
51+
52+ *** 证明***
53+
54+ 设 $X = U\begin{bmatrix}R_1 \\ 0 \end{bmatrix}, U\in\mathbb{C}^{n\times n}, R_1\in\mathbb{C}^{p\times p}$ 是非奇异的。
55+
56+ 则
57+
58+ $$
59+ \begin{aligned}
60+ &AU\begin{bmatrix}
61+ R_1\\0
62+ \end{bmatrix} = U\begin{bmatrix}
63+ R_1\\0
64+ \end{bmatrix}B,\\
65+ \Longrightarrow & \begin{bmatrix}
66+ T_{11}&T_{12}\\T_{21}&T_{22}
67+ \end{bmatrix}\begin{bmatrix}
68+ R_1\\0
69+ \end{bmatrix} = \begin{bmatrix}
70+ R_1 B\\0
71+ \end{bmatrix},
72+ \end{aligned}
73+ $$
74+
75+ 其中 $T:= \begin{bmatrix}T_ {11}&T_ {12}\\ T_ {21}&T_ {22}\end{bmatrix} = U^H A U$。
76+
77+ 由于 $R_1$ 是非奇异的且 $T_ {21}R_1 = 0$,则 $T_ {21}=0$。
78+
79+ 由于 $T_ {11}R_1 = R_1 B$ 且 $R_1$ 是非奇异的,则 $\lambda(T_ {11}) = \lambda(B)$。又因为 $A = UTU^H$ 且$T_ {21}=0$,则 $\lambda(A) = \lambda(T) = \lambda(T_ {11})\cup\lambda(T_ {22})$,这意味着 $\lambda(A)\cap \lambda(B) = \lambda(T_ {11})$。 $\blacksquare$
80+
81+ > [ !info] Theorem 1.3
82+
83+ ** (Schur 分解)** 如果 $A \in \mathbb{C}^{n\times n}$,则存在一个酉矩阵 $Q\in\mathbb{C}^{n\times n}$ 使得 $Q^HAQ = T := D+N$,其中 $D = \text{diag}(\lambda_1,\cdots, \lambda_n)$ 且 $N$ 是严格上三角的。
84+
85+ *** 证明***
86+
87+ 当$n=1$ 时,结论自然成立。
88+
89+ 假设对于所有 $n-1$ 阶矩阵结论成立。如果 $Ax = \lambda x$ 且 $x\neq 0$,由 Lemma 1.2(令 $\lambda$ 为 Lemma 1.2 中的 $B\in\mathbb{C}^{1\times 1}$ ),则存在一个酉矩阵 $U$ 使得
90+
91+ $$
92+ U^H A U = \begin{bmatrix}
93+ \lambda& w^H\\ 0 & C
94+ \end{bmatrix}.
95+ $$
96+
97+ 通过归纳,存在一个酉矩阵 $\tilde{U}$ 使得 $\tilde{U}^H C \tilde{U}$ 是上三角的。
98+
99+ 因此,令 $Q = U\cdot\text{diag}(1, \tilde{U})$,则 $Q^HAQ$ 是上三角的。 $\blacksquare$
100+
101+ ---
102+
103+ 如果 $Q = [ q_1, \cdots, q_n] $,则 $q_i$ 被称为 * Schur 向量* 。由 $AQ = QT$,我们有
104+
105+ $$
106+ Aq_k = \lambda_k q_k + \sum_{i=1}^{k-1}n_{ik}q_i,\quad k=1:n.
107+ $$
108+
109+ 由此,我们可以得出子空间
110+
111+ $$
112+ S_k = \text{span}\{q_1, \cdots, q_k \}, \quad k=1:n
113+ $$
114+
115+ 对于 $A$ 是不变的(即 $\forall x\in S_k, Ax\in S_k$)。此外,如果 $Q_k = [ q_1, \cdots, q_k] $,则 $\lambda(Q_k^H AQ_k) = \{ \lambda_1, \cdots, \lambda_k\} $。
116+
117+ ## 2. 应用
118+
119+ ### 正规矩阵
120+
121+ > [ !info] Definition
122+
123+ 如果$A^HA = AA^H$,则$A$ 是正规的。
124+
125+ > [ !info] Theorem 1.4
126+
127+ $A \in\mathbb{C}^{n\times n}$ 是正规的$\Longleftrightarrow$ 存在一个酉矩阵 $Q\in\mathbb{C}^{n\times n}$ 使得 $Q^H A Q = \text{diag}(\lambda_1, \cdots, \lambda_n)$。
128+
129+ *** 证明***
130+
131+ $\Longleftarrow$:
132+
133+ 设 $D = \text{diag}(\lambda_1 ,\cdots, \lambda_n)$,则 $A^HA = Q D^H Q^H Q D Q^H = Q D^H D Q^H$ 且 $AA^H = Q D D^H Q^H$。由于 $D^H D = D D^H$,则 $A^HA = AA^H$。
134+
135+ $\Longrightarrow$:
136+
137+ 如果$A$ 是正规的,设 $T = Q^H A Q$,其中 $Q$ 是 * Schur 分解* 中的酉矩阵,则 $T^H T = T T^H$,这意味着 $T$ 是正规的。
138+
139+ 由于 $T$ 是上三角的,我们有
140+
141+ $$
142+ \begin{bmatrix}
143+ \overline{t_{11}}& &\\
144+ \vdots& \ddots&\\
145+ \overline{t_{1n}}& \cdots& \overline{t_{nn}}
146+ \end{bmatrix}\begin{bmatrix}
147+ {t_{11}}& \cdots &t_{1n} \\
148+ & \ddots& \vdots\\
149+ & & {t_{nn}}
150+ \end{bmatrix} = \begin{bmatrix}
151+ {t_{11}}& \cdots &t_{1n} \\
152+ & \ddots& \vdots\\
153+ & & {t_{nn}}
154+ \end{bmatrix}\begin{bmatrix}
155+ \overline{t_{11}}& &\\
156+ \vdots& \ddots&\\
157+ \overline{t_{1n}}
158+ & \cdots& \overline{t_{nn}}
159+ \end{bmatrix}
160+ $$
161+
162+ 对于 (1,1) 位置,我们有
163+
164+ $$
165+ \text{LHS} = |t_{11}|^2 = \sum_{k=1}^{n} |t_{1k}|^2 = \text{RHS},
166+ $$
167+
168+ 这意味着 $t_ {1k} = 0,\; k=2: n $,然后对于 (2,2) 位置,我们有
169+
170+ $$
171+ \text{LHS} = |t_{12}|^2 + |t_{22}|^2 = |t_{22}|^2 = \sum_{k=2}^{n}|t_{2k}|^2 = \text{RHS},
172+ $$
173+
174+ 这意味着 $t_ {2k}=0,\; k=3: n $。如上所述,最终我们可以得出 $T = \text{diag}(t_ {11}, \cdots, t_ {nn})$。 $\blacksquare$
0 commit comments