矩阵分析 4
这一节来记一些乱七八糟的习题
\(AA^H\)和\(A^HA\)有相同的非零特征值
我们可以考虑特征值的定义的角度来证明这一点
设\(\lambda\)是\(AA^H\)的特征向量,\(x\)是对应的特征向量,即\(AA^Hx = \lambda x\),由于\(\lambda, x \neq 0\),因此\(\lambda x \neq 0\),从而\(A^Hx \neq 0\),那么由\((A^HA)(A^Hx) = \lambda(A^Hx)\)知,\(\lambda\)是\(A^HA\)的特征值,那么,\(AA^H\)的所有非零特征值都是\(A^HA\)的非零特征值,反过来也是如此,因此两者非零特征值的集合是相同的
下面,我们还需要证明两者的特征值的代数重复度相同,由于\(AA^H, A^HA\)都可对角化,我们只需要证明两者的几何重复度相同
设\(x_1, x_2, ..., x_n\)是对应于\(AA^H\)的特征值\(\lambda\)的线性无关的特征向量,由之前推导的对应关系,我们考虑证明\(A^Hx_1, A^Hx_2,...,A^Hx_n\)线性无关
设有\(\sum k_i A^H x_i = 0\),那么\(\sum k_i (AA^H) x_i = 0\),从而\(\lambda \sum k_ix_i = 0\),因此\(k_1=k_2=...=k_n=0\)
对于\(n*n\)的复矩阵\(A\),设\(\lambda_1, ..., \lambda_n\)为其\(n\)个特征值,那么\(\sum_{i=1}^n |\lambda_i|^2 \leq \sum_{1 \leq i, j \leq n} |a_{ij}|^2\),当且仅当\(A\)是正规矩阵时取得等号
考虑Schur TH,存在酉矩阵\(U\),使得\(A = U^HBU\),其中\(B\)为上三角矩阵,并且对角线元素为\(A\)的特征值
注意到\(AA^H = U^HBB^HU\),而\(tr(AA^H) = \sum |a_{ij}|^2\),\(tr(BB^H) = \sum |b_{ij}|^2 \geq \sum |\lambda_i|^2\),当且仅当\(B\)是对角矩阵时,取到等号
由于相似矩阵的特征多项式相同,那么他们将有相同的迹,因此\(\sum |a_{ij}|^2 = tr(AA^H) = tr(BB^H)\geq \sum |\lambda_i|^2\),当且仅当\(A\)是正规矩阵时取得等号
设\(\sigma_1, ..., \sigma_n\)是\(A\)的奇异值,那么\(tr(A^HA) = tr(AA^H) = \sum_{i=1}^r \sigma_i^2\)
设\(M = AA^H\),由上个定理证明过程,我们知道,只要证明\(M\)可酉对角化即可
由于\(M\)是埃尔米特矩阵,这是显然的
矩阵\(A\)的非零奇异值的个数是该矩阵的秩
我们知道\(rank(A) = rank(AA^H)\),而对于\(AA^H\)而言,其酉相似于一个对角矩阵\(B\),对角线上的元素为\(A\)的奇异值的平方,因此\(rank(AA^H)\)为\(A\)的非零奇异值的个数
设\(A\)为可逆埃米尔特矩阵,且\(A\)的谱分解为\(\sum \lambda_i x_i x_i^H\),那么\(A^{-1} = \sum \lambda_i^{-1} x_ix_i^H\)
设\(X = \sum \lambda_i^{-1} x_ix_i^H\),那么\(AX = \sum_{i, j} \lambda_i* \lambda_j^{-1} x_ix_i^H x_jx_j^H = \sum_{i} x_ix_i^H = \sum_{i, j} x_ix_j^H = UU^H = I\)
若\(A\)是正规矩阵,则\(A\)的奇异值就是\(A\)的特征值的模
由\(A\)是正规矩阵,\(A\)可酉对角化,因此\(A = U^H diag(\lambda_1, \lambda_2, ..., \lambda_n) U\)
继而\(AA^H = U^H diag(|\lambda_1|^2, |\lambda_2|^2, ..., |\lambda_n|^2) U\),那么\(|\lambda_1|^2, |\lambda_2|^2, ..., |\lambda_n|^2\)就是\(AA^H\)的特征值,从而\(|\lambda_1|, |\lambda_2|, ..., |\lambda_n|\)就是\(A\)的奇异值
酉矩阵特征值值的模都为\(1\)
由于\(x^Hy = x^HU^HUy = (Ux)^H(Uy)\),对于酉矩阵\(U\)的特征值\(\lambda\),我们对其特征向量\(x\)进行考察,那么\(x^Hx = (Ux)^HUx = \lambda^H \lambda x^Hx = |\lambda|^2 x^Hx\),故\(|\lambda| = 1\)
若\(A\)是正规矩阵,且\(A\)的特征值的模为\(1\),那么\(A\)为酉矩阵
直接运用上题的结论即可
两个正规矩阵相似的充要条件是两者的特征多项式相同
充分性:如果正规矩阵\(A, B\)的特征多项式相同,那么存在酉矩阵\(U_1, U_2\),使得\(A = U_1^H \Lambda U_1, B = U_2^H \Lambda U_2\),从而\(A = (U_1^{-1}U_2)^H \Lambda (U_1^{-1}U_2)\),从而两者相似
必要性:相似矩阵有相同的特征多项式
若\(A\)为实矩阵,且\(A^TA = AA^T\),那么\(A\)是对称矩阵
\(A\)满足正规矩阵的定义,因此有\(A = U^H \Lambda U\),其中\(U\)为酉矩阵,\(\Lambda\)为特征值构成的对角阵
那么由\(A^H=A\),\(A^H = A^T\),我们得到\(A=A^T\)
正规矩阵\(A\)是埃尔米特矩阵,当且仅当\(A\)的特征值全为实数
”\(\Rightarrow\)“:显然
"\(\Leftarrow\)":我们考虑矩阵\(A\)的谱分解,\(A = \sum_{i} \lambda_i x_ix_i^H\),则有\(A^H = \sum_i \lambda_i^H x_i x_i^H = \sum_i \lambda_i x_ix_i^H = A\)
\(tr(xy^H) = y^Hx\)
取一组标准正交基,设出\(x, y\)在这组标准正交基下的坐标为,然后就不难看出了
特别的,如果我们令\(y = Ax\),则有\(tr(Axx^H) = x^HAx\)
暂定