矩阵分析 5

向量范数

介绍

  • 定义:如果\(V\)是数域\(P\)上的线性空间,且对于\(x \in V\),存在\(V \to R\)的函数\(||x||\),满足
    • 非负性:\(||x|| \geq 0\),当且仅当\(x = 0\)取等
    • 齐次性:\(||kx|| = |k|*||x||\)
    • 三角不等式:\(||x+y|| \leq ||x|| + ||y||\)

这里记录一些常见的范数

  • \(||x|| = \sqrt {\sum_{i=1}^n |x_i|^2}\),称作2-范数或者欧式范数,记为\(||x||_2\)

    • 该函数显然满足非负性和齐次性,利用柯西不等式可以得到三角不等式也满足
  • \(||x|| = max_{i=1}^n |x_i|\),称作\(\infty-\)范数,记为\(||x||_{\infty}\)

    • 验证三条性质都是简单的
  • \(||x|| = (\sum_{i=1}^n |x_i|^p)^{\frac{1}{p}}\),称作p-范数,其中\(1 \leq p < +\infty\),记为\(||x||_p\)

    • 非负性和齐次性仍然是显然的
    • 三角不等式则可由Young不等式或Holder不等式得出
    • 不难发现\(p= 2\)\(p \to +\infty\)的情况下,p-范数变为上述两种情况
  • 对于正定埃尔米特矩阵\(A\),定义\(||x||_A = \sqrt {x^HAx}\),称作椭圆范数

    • 非负性和齐次性仍然是显然的

    • 三角不等式:由于\(A\)是正定埃尔米特矩阵,因此存在非奇异矩阵\(P\),使得\(A = P^HP\)

      那么,\(||x||_A = ||Px||_2\),而\(||P(x+y)||_2 = ||Px+Py||_2 \leq ||Px||_2 + ||Py||_2\)

向量范数的等价性

  • 称向量范数\(||\cdot||_a\)\(||\cdot||_b\)等价,当且仅当存在\(c_1, c_2 > 0\),使得对于任意\(x\)

    \[c_1||x||_b \leq ||x||_a \leq c_2||x||_b\]

  • 两个范数等价,当且仅当它们具有相同的敛散性

    • 充分性是显然的,我们考虑必要性的证明

      反证法,不妨设对于任意大的整数\(n\),都存在\(x_n\),使得\(||x_n||_b > n||x_n||_a\)

      那么,我们考虑序列\(x_n' = x_n * ||x_n||_b^{-1}\),显然\(\lim_{n \to \infty} ||x_n'||_b = 1\)

      \(||x_n'||_a = ||x_n||_a *||x_n||_b^{-1} < \frac{1}{n}\),因此\(\lim_{n \to \infty} ||x_n'||_a = 0\),这与有相同的敛散性这一条件矛盾,矛盾的根源在于假设,因此命题是正确的

  • 有限维线性空间上的不同范数是等价的

    • 向量范数的等价关系有传递性,我们只需证明所有范数都与某种范数等价即可

    • 首先,由于是有限维线性空间,我们取一组基底\(e_1, e_2, ..., e_n\),对于任意向量\(x\),如果\(x = \sum x_ie_i\),那么,对于向量范数\(||\cdot||_a\),定义\(f(x_1, x_2, ..., x_n) = ||x||_a\),不难证明\(f(x_1,x_2,...,x_n)\)是一个连续函数

      不妨设\(||x||_b\)是另一种范数,我们考虑\(f(x_1,x_2,...,x_n)\)\(||x||_b = 1\)上的分布情况,由\(f\)的连续性可知它可以取到最大值\(M\)和最小值\(m\)

      而对于\(||x||_b = k(k \neq 0)\)的一般情况,我们有\(m \leq ||x * k^{-1}||_a \leq M\),即\(m||x||_b \leq ||x||_a \leq M ||x||_b\)

矩阵范数

矩阵范数

  • 定义:对于矩阵\(A\),如果存在实值函数\(||A||\),满足

    • 非负性:\(||A|| \geq 0\),当且仅当\(A = O\)时取等
    • 齐次性:\(||kA|| = k||A||\)
    • 三角不等式:\(||A+B|| \leq ||A|| + ||B||\)
    • 相容性:\(||AB|| \leq ||A|| *||B||\)

    称该函数为矩阵范数

定义中的次乘性的一个感性理解是,当\(||A|| < 1\)时,将有\(\lim_{n \to \infty} ||A||^n = 0(n \to \infty)\)

  • 不难验证下列函数都是矩阵范数

    \[||A||_{m_1} = \sum_{i, j} |a_{ij}|\]

    \[||A||_{m_2} = n* \max_{i.j} |a_{i,j}|\]

    \[||A||_F = (\sum_{i.j} |a_{ij}|^2)^{1/2}\]

最后一种矩阵范数简称为F-范数,F-范数有不错的性质

  • \(U, V\)为酉矩阵,那么\(||A||_F = ||UAV||_F\)
    • 注意到\(||A||_F = (tr(AA^H))^{1/2}\)\((UAV)(UAV)^H\)\(AA^H\)相似
  • 矩阵范数在有限维线性空间下也有等价性

算子范数

  • 定义:设\(||x||\)是一个向量范数,那么,我们定义\(||A|| = \sup_{x \neq 0} \frac{||Ax||}{||x||} = \max_{x = 1} ||Ax||\)为由向量范数\(||\cdot||\)诱导出的算子范数

    • 由定义,算子范数满足\(||Ax|| \leq ||A|| *||x||\),此时,我们称矩阵范数\(||A||\)和向量范数\(||x||\)相容

    • 算子范数是一种矩阵范数

      • 非负性,齐次性,三角不等式都可以转化为向量范数来证明
      • 对于次乘性,设\(x_0\)是在\(||x|| = 1\)中,使得\(||ABx||\)取到最大值的\(x\),那么\(||AB|| = ||ABx_0|| \leq ||A||*||Bx_0|| \leq ||A||*||B||\),其中的不等式利用的是算子范数的性质
    • \(||I||=1\)对任何算子范数成立

  • 我们给出几个特例的算子范数

    对应于向量范数\(||x||_1, ||x||_2, ||x||_{\infty}\)的算子范数分别为

    \[||A||_1 = \max_{j} \sum_{i=1}^m |a_{ij}|\]

    \[||A||_2 = \sigma_{max} = \sqrt {\lambda_{max} }\]

    上式中\(\lambda_{max}\)表示矩阵\(AA^H\)的最大特征值

    \[||A||_{\infty} =\max_{i} \sum_{j=1}^n |a_{ij}|\]

    它们分别被称作列范数,谱范数,行范数

    • 列范数和行范数不难证明,我们对谱范数稍作解释

      \(||x||=1\),不难得到\(||Ax||^2_2 = (Ax)^HAx = x^H A^HAx\)

      \(A^HA\)的谱分解为\(\sum \lambda_i x_i^Hx_i\),其中\(\lambda_1 \geq ... \geq \lambda_m\),并设\(x = \sum a_ix_i\)

      那么\(x^HA^HAx = \sum \lambda_i |a_i|^2 \leq \lambda_1\),当\(a_1 = 1\)时可以取到等号

谱范数

性质

谱范数和F-范数一样,有比较好的性质

  • \(U, V\)为酉矩阵,那么\(||A||_2 = ||UAV||_2\)

    • 证明:\(AA^H\)\((UAV)(UVA)^H\)相似
  • \(||A||_2 = ||A^H||_2\)

    • \(AA^H\)\(A^HA\)有相同的非零特征值
  • \(||A||_2 = \max_{||x||_2 = 1, ||y||_2=1} |y^HAx|\)

    • \(|y^HAx| \leq ||y^H||_2 * ||A||_2*||x||_2 \leq ||A||_2\)

      存在\(x_0\)满足条件,并且使得\(||Ax_0||_2 = ||A||_2\),此时,取\(y_0 = Ax_0 * ||Ax_0||^{-1}\)可以取得等号

  • \(||A^HA||_2 = ||A||_2^2\)

    • \(||A^HA||_2 \leq ||A^H||_2 * ||A||_2 = ||A||_2^2\)

      \(||A^HA||_2 = \max |y^HA^HAx| \geq \max |x^HA^HAx|\)

谱半径

  • 定义:设\(A\)的特征值为\(\lambda_1, ..., \lambda_n\),那么称\(\rho(A) = \max_{i} |\lambda_i|\),称为\(A\)谱半径

谱半径有非常良好的性质

  • \(\rho(A) \leq ||A||\),谱半径不会超过\(A\)任何一种范数

为了证明这个定理,我们需要一个引理 `

  • 引理:对于任何一种矩阵范数\(||\cdot||_A\),存在与其相容的向量范数\(||\cdot||_v\)

    • 任取\(y \neq 0, y \in V\),那么定义\(||x||_v = ||xy^H||_A\)

      容易验证这是一个向量范数,我们来考虑相容性

      \(||M||_A * ||x||_v = ||M||_A*||xy^H||_A \geq ||Mxy^H||_A = ||Mx||_v\)

现在让我们回到定理的证明,设\(\lambda\)为其特征值,\(x\)为其对应的特征向量,\(||\cdot||_v\)取与其相容的向量范数,那么\(|\lambda|*||x||_v = ||\lambda x||_v = ||Ax||_v \leq ||A|| * ||x||_v\),于是\(|\lambda| \leq ||A||\)

  • 如果\(A\)的正规矩阵,那么\(\rho(A) = ||A||_2\)

即证\(A\)的特征值的模的最大值等于\(A\)的最大奇异值,这个由特征值的模与奇异值之间的对应关系可以得到

  • \(||A||_2 = \sqrt {\rho(AA^H)}\)

这个是显然的