5 矩阵相似
5.1 相抵
5.1.1 相抵定义
如果矩阵A可以经过一系列初等行变换与初等列变换变成矩阵B,则称A与B是相抵的(等价的),记作\(A \stackrel{相抵}{\sim} B\)
5.1.2 相抵性质
显然的,相抵有以下的几个性质
- 反身性:任一矩阵A与自身相抵
- 对称性:如果A与B相抵,则B与A相抵
- 传递性:如果A与B相抵,B与C相抵,则A与C相抵
5.1.3 相抵标准形
\[ \begin{bmatrix} I_r & 0 \\ 0 & 0\\ \end{bmatrix} \]
对角线是连续的1与0,其他位置都为0的矩阵称为矩阵的相抵标准形
5.1.4 相抵与轶
设\(s \times n\)矩阵A的轶为r,如果\(r \neq 0\),则A相抵于相抵标准形
\[ \begin{bmatrix} I_r & 0 \\ 0 & 0\\ \end{bmatrix} \]
如果r=0,则A=0,此时称A的相抵标准形为零矩阵
证明:
因为任何矩阵都可以经过初等行列变换简化的阶梯矩阵J,形似
\[ J = \begin{bmatrix} 1 & 0 & \cdots & 0 & c_{1,r+1} & \cdots & c_{1,n}\\ 0 & 1 & \cdots & 0 & c_{2,r+1} & \cdots & c_{2,n}\\ \cdots & \cdots & & \cdots & \cdots & & \cdots \\ 0 & 0 & \cdots & 1 & c_{r,r+1} & \cdots & c_{r,n}\\ 0 & 0 & \cdots & 0 & 0 & \cdots & 0\\ \cdots & \cdots & & \cdots & \cdots & & \cdots \\ 0 & 0 & \cdots & 0 & 0 & \cdots & 0\\ \end{bmatrix} \]
注意,主对角元的数量就是矩阵A的轶,这个时候把A的第1列的\(-c_{1,r+1}\)倍驾到第r+1列,就可以消去矩阵的(r,r+1)的元,以此类推,我们可以通过初等列变换,将右边的元素都消去掉,变为
\[ J = \begin{bmatrix} 1 & 0 & \cdots & 0 & 0 & \cdots & 0\\ 0 & 1 & \cdots & 0 & 0 & \cdots & 0\\ \cdots & \cdots & & \cdots & \cdots & & \cdots \\ 0 & 0 & \cdots & 1 & 0 & \cdots & 0\\ 0 & 0 & \cdots & 0 & 0 & \cdots & 0\\ \cdots & \cdots & & \cdots & \cdots & & \cdots \\ 0 & 0 & \cdots & 0 & 0 & \cdots & 0\\ \end{bmatrix} \]
这个时候,矩阵A就能相抵于相抵标准形
\[ \begin{bmatrix} I_r & 0 \\ 0 & 0\\ \end{bmatrix} \]
所以,得证。
从这个定理可以看出,任何矩阵都可以相抵于相抵标准形,而且,其相抵的相抵标准形是唯一的,相抵标准形的主角元数量就是矩阵的轶。从中,我们也能得出一个推论,两个矩阵相抵的充分必要条件是,它们的轶相等。
因此,矩阵的轶完全刻画了矩阵的相抵关系。
5.1.5 相抵的等价结论
根据相抵与轶的关系,初等变换与可逆的关系,我们得出以下的结论
\[ 矩阵A与B相抵\\ \Leftrightarrow A经过初等行变换与初等列变换变成B\\ \Leftrightarrow 存在初等矩阵P_1,P_2,\cdots,P_t与初等矩阵Q_1,Q_2,\cdots,Q_m,使得P_t\cdots P_2P_1AQ_1Q_2\cdots Q_m=B \\ \Leftrightarrow 存在可逆矩阵P与可逆矩阵Q,使得PAQ=B \\ \Leftrightarrow A与B的轶相等 \]
5.2 特征值与特征向量
5.2.1 特征值与特征向量定义
设A是数域K上的n级矩阵,如果\(K^n\)中有非零列向量\(\alpha\),使得
\[ A\alpha = \lambda_0 \alpha,\lambda_0 \in K \]
则称\(\lambda_0\)是A的一个特征值,称\(\alpha\)是A的属于特征值\(\lambda_0\)的一个特征向量
从几何向量空间的意义上说,特征向量就是线性变换的不变方向,在这个方向上特征向量没有改变方向,只是简单的在原来的方向上伸缩长度。
注意,不是所有的矩阵都有特征向量,代表旋转的矩阵是没有特征向量的。
5.2.2 特征值性质
如果\(\alpha\)是A的属于特征值\(\lambda_0\)的一个特征向量,则对于任意的\(k \in K且k\neq 0\),\(k\alpha\)也是A的术语特征值\(\lambda_0\)的特征向量
证明:
\[ A(k\alpha) = k(A\alpha)=k(\lambda_0\alpha)=\lambda_0(k\alpha)\\ A(k\alpha) =\lambda_0(k\alpha) \]
所以,得证
这个性质告诉我们,对于一个矩阵来说,特征值是有限而且可数的,但特征向量是无穷大,不只一个方向的向量都可以是特征向量,甚至一个平面上所有向量都是特征向量。
5.2.3 特征多项式
对于矩阵A,我们称\(\lvert \lambda I-A\rvert=0\)为特征多项式
5.2.4 特征值与特征多项式
设A是数域K上的n级矩阵,则
- \(\lambda_0\)是A的一个特征值当且仅当\(\lambda_0\)是A的特征多项式\(\lambda I -A\)在K中的一个根
- \(\alpha\)是A的属于特征值\(\lambda_0\)的一个特征向量当且仅当\(\alpha\)是齐次线性方程组\((\lambda_0 I -A )X=0\)的一个非零解
证明:
因为\(A\alpha=\lambda_0\alpha,\alpha \neq 0 ,\lambda_0 \in K\)
因此\(A\alpha=\lambda_0I\alpha,\alpha \neq 0 ,\lambda_0 \in K\)
因此\((\lambda_0I-A)\alpha=0,\alpha \neq 0 ,\lambda_0 \in K\)
因此\(\alpha\)是齐次线性方程组\((\lambda_0 I -A)X=0\)的一个非零解
因此\(\lvert \lambda_0 I -A\rvert = 0 ,\lambda_0 \in K\)(齐次线性方程组行列式为0才有非零解)
因此\(\lambda_0\)是A的特征多项式\(\lambda I -A\)在K中的一个根
因此我们证得第一个结论
当我们求得特征向量\(\lambda_0\)后,因为\((\lambda_0I-A)\alpha=0,\alpha \neq 0 ,\lambda_0 \in K\),所以\(\alpha\)就是\((\lambda_0I-A)X=0\)的一个非零解,而这个非零解就是齐次线性方程组的解空间,我们也将这个解空间称为矩阵A的属于\(\lambda_0\)特征值的特征子空间。
因此我们证得第二个结论
从这个定理可以看出,特征值与特征向量的问题归根到底还只是一个齐次线性方程组的问题而已。
5.3 相似
5.3.1 相似定义
设A与B都是数域K上的n级矩阵,如果存在数域K上的一个n级可逆矩阵U,使得
\[ U^{-1}AU=B \]
则称A与B是相似的,记作\(A \sim B\)
从定义中可以看出,相似跟相抵是不一样的,相抵是\(PAQ=B\),而相似是\(U^{-1}AU=B\)。相似的本质就是不同基下的同一线性变换。特别注意,相似仅仅对方阵有效,而且矩阵U必须要是可逆的。
另外,相似也可以看成是一种相抵的特殊情况,所以相抵的性质相似也都有。
5.3.2 相似性质
相似关系依然和相抵一样,有反身性,对称性和传递性的性质。
另外,两个矩阵相似,则有
- 相似矩阵的行列式的值相同,\(\lvert B \rvert = \lvert U^{-1} A U \rvert = \lvert U^{-1} \rvert \lvert A \rvert \lvert U \rvert = \lvert A \rvert\)
- 相似矩阵或都可逆,或者都不可逆,并且当它们可逆时,它们的逆矩阵也都相似。$$
- 相似的矩阵有相同的轶,因为相似就是一种相抵。
- 相似的矩阵有相同的迹,\(tr(B) = tr(U^{-1}AU)=tr(U^{-1}(AU))=tr(AU(U^{-1}))=tr(A)\)
- 相似的矩阵有相同的特征多项式,\(\lvert \lambda I - B \rvert = \lvert \lambda I - U^{-1}AU \rvert = \lvert U^{-1} \lambda I U - U^{-1}AU \rvert=\lvert U^{-1} (\lambda I - A)U \rvert=\lvert U^{-1} \rvert \lvert \lambda I - A \rvert \lvert U \rvert = \lvert \lambda I - A \rvert\)
- 相似的矩阵有相同的特征值
5.3.3 相似标准形与可对角化
如果一个n级矩阵A能够相似于对角矩阵\(D=diag\{a_1,a_2,\cdots,a_n\}\),则称A可对角化,把对角矩阵D称为A的相似标准形
注意,相似标准形实质就是对角矩阵,和相抵不同的是,并不是所有矩阵都可以相似于相似标准形。
5.3.4 可对角化与特征向量
数域K上的n级矩阵A可对角化的充分必要条件是A有n个线性无关的特征向量\(\alpha_1,\alpha_2,\cdots,\alpha_n\),此时令
\[ U=(\alpha_1,\alpha_2,\cdots,\alpha_n) \]
则 \(U^{-1}AU=diag\{\lambda_1,\lambda_2,\cdots,\lambda_n\}\)
其中\(\lambda_i\)是\(\alpha_i\)所属的特征值,\(i=1,2,\cdots,n\)。
证明:
因为要存在数域K上n级可逆矩阵\(U=(\alpha_1,\alpha_2,\cdots,\alpha_n)\),使得\(U^{-1}AU=D\),
则\(AU=UD\)
又因为D是对角矩阵\(D=diag\{\lambda_1,\lambda_2,\cdots,\lambda_n\}\),且设U为\(U=(\alpha_1,\alpha_2,\cdots,\alpha_n)\)
即\(K^n\)中存在n个线性无关(U是可逆矩阵)的列向量\(\alpha_1,\alpha2,\cdots,\alpha_n\),使得
\[ AU=UD\\ A(\alpha_1,\alpha_2,\cdots,\alpha_n)=(\alpha_1,\alpha_2,\cdots,\alpha_n) diag\{\lambda_1,\lambda_2,\cdots,\lambda_n\}\\ A(\alpha_1,\alpha_2,\cdots,\alpha_n)=(\lambda_1 \alpha_1,\lambda_2 \alpha_2,\cdots,\lambda_n \alpha_n)\\ A\alpha_1=\lambda\alpha_1,A\alpha_2=\lambda\alpha_2,\cdots,A\alpha_n=\lambda\alpha_n \]
因为\(\lambda\)都是矩阵A的特征值,\(\alpha\)都是矩阵A的特征向量。那么只要凑够了n个线性无关的特征向量,我们就能拼凑出这个矩阵的对角化条件。
所以得证
注意,这个定理将相似与特征向量联系在一起,矩阵可对角化的关键是,这个矩阵有没有n个线性无关的特征向量。
5.3.5 可对角化与特征子空间
数域K上n级矩阵A可对角化的充分必要条件是:A的属于不同特征值的特征子空间的维数之和等于n。
证明:
这个条件比较难证明,我们退一步说,如果A的不同特征值的特征向量都是线性无关的,那么特征子空间的维数之和就是总的线性无关的特征向量之和。也就是结论了。
因此,我们只需证明不同特征值的特征向量都是线性无关的即可。
我们设\(\alpha_1,\alpha_2,\cdots,\alpha_s\)与\(\beta_1,\beta_2,\cdots,\beta_r\)分别属于A的属于\(\lambda_1,\lambda_2\)的线性无关的特征向量,然后我们看一下\(\alpha_1,\cdots,\alpha_s,\beta_1,\cdots,\beta_r\)是否线性无关
我们考虑齐次线性方程组
\[ k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s+l_1\beta_1+l_2\beta_2+\cdots+l_r\beta_r=0 \]
方程组两边乘以A,得
\[ k_1A \alpha_1+k_2A \alpha_2+\cdots+k_sA\alpha_s+l_1A\beta_1+l_2A\beta_2+\cdots+l_rA\beta_r=0\\ k_1\lambda_1\alpha_1+k_2\lambda_1\alpha_2+\cdots+k_s\lambda_1\alpha_s+l_1\lambda_2\beta_1+l_2\lambda_2\beta_2+\cdots+l_r\lambda_2\beta_r=0\\ \]
方程组两边乘以\(\lambda_2\),得
\[ k_1\lambda_2\alpha_1+k_2\lambda_2\alpha_2+\cdots+k_s\lambda_2\alpha_s+l_1\lambda_2\beta_1+l_2\lambda_2\beta_2+\cdots+l_r\lambda_2\beta_r=0 \]
两延伸方程组相减,得
\[ k_1(\lambda_1-\lambda_2)\alpha_1+k_2(\lambda_1-\lambda_2)\alpha_2+\cdots+k_s(\lambda_1-\lambda_2)\alpha_s=0 \]
又因为\(\lambda_1 \neq \lambda_2\),\(\alpha\)是线性无关向量,则\(k_1=k_2=\cdots=k_s=0\)
同理,可证\(l_1=l_2=\cdots=l_r=0\)
所以,\(\alpha_1,\cdots,\alpha_s,\beta_1,\cdots,\beta_r\)是线性无关的。
因此,不同特征值的特征向量不需要作向量的相关性判断了,它们之间是肯定线性无关的。所以只需要将每个特征值的特征子空间维数相加,就能得到总的线性无关特征向量是否为n。得证。
5.4 正交相似
5.4.1 正交相似定义
如果对于n级矩阵A,B,存在一个n级正交矩阵T,使得\(T^{-1}AT=B\),则称A正交相似于B
注意,正交相似是相似的一种特殊情况,两个矩阵之间不仅相似,而且相似变换的矩阵T不仅是个可逆矩阵,还是一个正交矩阵。
5.4.2 正交相似性质
根据正交矩阵的性质,\(T'=T^{-1}\),因此,如果矩阵A正交相似于矩阵B,那么必定存在正交矩阵T使得
\[ T'AT=B \]
5.4.3 实对称矩阵
实对称矩阵就是在对称矩阵的基础上加上每个元素都是实数域上的元素。
5.4.4 实对称矩阵与正交相似
实对称矩阵一定正交相似于对角矩阵
证明:
这个定理相当重要,实对称矩阵是仅次于方阵以外,一个具有相当广泛使用的矩阵。证明也很麻烦,分三步
- 实对称矩阵对应的特征多项式必定有实数根
- 实对称矩阵的不同特征值对应的特征向量是正交的
- 实对称矩阵的n-1阶正交相似对角矩阵时,n阶必定也正交相似对角矩阵。
首先,实对称矩阵对应的特征多项式在复数域上是肯定有解的,如果我们能证明复数域上的特征值都是实数,即\(\overline{\lambda_0}=\lambda_0\),即可得出特征多项式都有实数根
\[ A\alpha=\lambda\alpha\\ \overline{A}\overline{\alpha}=\overline{\lambda}\overline{\alpha}\\ A\overline{\alpha}=\overline{\lambda}\overline{\alpha}\\ \alpha'A\overline{\alpha}=\overline{\lambda}\alpha'\overline{\alpha}\\ \]
又
\[ A\alpha = \lambda\alpha\\ (A\alpha)' = (\lambda\alpha)'\\ \alpha'A'=\lambda\alpha'\\ \alpha'A=\lambda\alpha'\\ \alpha'A\overline{\alpha}=\lambda\alpha'\overline{\alpha}\\ \]
比较两式,得
\[ \overline{\lambda}\alpha'\overline{\alpha}=\lambda\alpha'\overline{\alpha}\\ (\overline{\lambda}-\lambda)\alpha'\overline{\alpha}=0\\ \]
因为\(\alpha'\overline{\alpha} \neq 0\),因此
\[ \overline{\lambda}-\lambda = 0 \]
所以,得证第一个结论,这个证明非常巧妙,使用到了转置矩阵与原矩阵的乘积就是内积的性质。
设\(\lambda_1,\lambda_2\)是矩阵A的两个不同的特征值,\(\alpha_1,\alpha_2\)是它们的相应的两个特征向量则
\[ \lambda_1(\alpha_1,\alpha_2)\\ = (\lambda_1\alpha_1,\alpha_2)\\ = (\lambda_1\alpha_1)'\alpha_2\\ = (A\alpha_1)'\alpha_2\\ = \alpha_1'A'\alpha_2\\ = \alpha_1'A\alpha_2\\ \]
又
\[ \lambda_2(\alpha_1,\alpha_2)\\ = (\alpha_1,\lambda_2\alpha_2)\\ = (\alpha_1)'(\lambda_2\alpha_2)\\ = \alpha_1'A\alpha_2\\ \]
联立两式,得
\[ \lambda_1(\alpha_1,\alpha_2)=\lambda_2(\alpha_1,\alpha_2)\\ (\lambda_1-\lambda_2)(\alpha_1,\alpha_2)=0\\ (\alpha_1,\alpha_2)=0\\ \]
所以,得证第二个结论。依然使用到了转置矩阵与原矩阵的乘积就是内积的性质,非常巧妙。
当n=1时,显然实对称矩阵正交相似于对角矩阵
假设当n-1阶时,实对称矩阵正交相似于对角矩阵,那么当n阶时,取实对称矩阵矩阵的其中一个特征值\(\lambda_1\),并取它的单位特征向量\(\eta_1\)。
然后将\(\eta_1\)与\(R^n\)中任意的向量组成一个\(R^n\)的标准正交基(注意,是任意的,不是来自其他特征值的特征向量),令
\[ T_1=(\eta_1,\eta_2,\cdots,\eta_n) \]
因此
\[ T_1^{-1}AT_1\\ = T_1^{-1}(A\eta_1,A\eta_2,\cdots,A\eta_n)\\ =T_1^{-1}(\lambda_1\eta_1,A\eta_2,\cdots,A\eta_n)\\ =(T_1^{-1}\lambda_1\eta_1,T_1^{-1}A\eta_2,\cdots,T_1^{-1}A\eta_n)\\ =(\lambda_1,T_1^{-1}A\eta_2,\cdots,T_1^{-1}A\eta_n)\\ =\begin{bmatrix} \lambda_1 & a \\ 0 & B \\ \end{bmatrix} \]
又因为T是正交矩阵,A是实对称矩阵,\(T^{-1}AT\)是实对称矩阵,所以\(a=0\),即
\[ T_1^{-1}AT_1\\ =\begin{bmatrix} \lambda_1 & a \\ 0 & B \\ \end{bmatrix}\\ =\begin{bmatrix} \lambda_1 & 0 \\ 0 & B \\ \end{bmatrix} \]
又存在正交矩阵\(T_2\),使得\(T_2^{-1}B{T_2}=diag\{\lambda_2,\cdots,\lambda_n\}\),因此
\[ T_1^{-1}AT_1=\begin{bmatrix} \lambda_1 & 0 \\ 0 & B \\ \end{bmatrix}\\ \begin{bmatrix} 1 & 0 \\ 0 & T_2^{-1} \\ \end{bmatrix}T_1^{-1}AT_1\begin{bmatrix} 1 & 0 \\ 0 & T_2\\ \end{bmatrix}=\begin{bmatrix} 1 & 0 \\ 0 & T_2^{-1} \\ \end{bmatrix}\begin{bmatrix} \lambda_1 & 0 \\ 0 & B \\ \end{bmatrix}\begin{bmatrix} 1 & 0 \\ 0 & T_2\\ \end{bmatrix}\\ \begin{bmatrix} 1 & 0 \\ 0 & T_2^{-1} \\ \end{bmatrix}T_1^{-1}AT_1\begin{bmatrix} 1 & 0 \\ 0 & T_2\\ \end{bmatrix}=\begin{bmatrix} \lambda_2 & 0 \\ 0 & T_2^{-1}BT_2\\ \end{bmatrix}\\ \]
因此,我们成功地将矩阵A相似于一个对角矩阵,然后我们看看相似变换的
\[ T=T_1\begin{bmatrix} 1 & 0 \\ 0 & T_2 \\ \end{bmatrix} \]
因为左右两端都是正交矩阵,所以T是正交矩阵,因此,我们证明了n级矩阵也是正交相似于对角矩阵。这个证明相当神奇,想办法降级来证明正交性。
所以,综上所述,实对称矩阵必然正交相似于对角矩阵。
6 矩阵合同
6.1 合同与标准形
6.1.1 合同定义
属于K上两个n级矩阵A与B,如果存在K上的一个可逆矩阵C,使得
\[ C'AC=B \]
则称A与B合同,记作\(A \simeq B\)
从定义可以看出,合同是相抵的一种特殊情况,它跟相似不一样的地方是,转换矩阵是\(C'AC\),而不是\(C^{-1}AC\),另外注意\(C\)是一个可逆矩阵
6.1.2 合同标准形
如果矩阵A合同于一个对角矩阵,则这个对角矩阵是A的合同标准形
跟相似标准形一样,合同标准形并不是所有矩阵都能做到的。
6.1.3 二次型定义
数域K上两个n元二次型\(X'AX\)与\(Y'BY\),如果存在一个非退化线性替换\(X=CY\),把\(X'AX\)变成\(Y'BY\),则称二次型\(X'AX\)与\(Y'BY\)等价,记作\(X'AX \cong Y'BY\)
二次型就是前后都是同一个向量,中间夹着一个矩阵的变化,它的体现就是多元的二次多项式。
6.1.4 合同与二次型
二次型的问题本质上就是实对称矩阵的合同问题
证明:
n元二次型\(X'AX\)经过非退化线性替换\(X=CY\),变成
\[ (CY)'A(CY)=Y'C'ACY=Y'(C'AC)Y \]
记\(B=C'AC\),则上式就是
\[ X'AX = Y'BY \]
其中A与B合同。
所以只要矩阵A合同于一个对角矩阵,就能写成相应的二次型表达式
6.1.5 二次型的正交替换
如果A是实对称矩阵,则必定可以找到一个正交矩阵C,使得\(C'AC=B\),其中B是对角矩阵,这种替换称为正交替换
证明:
在正交相似中,我们证明了如果A是实对称矩阵,必定可以寻找一个正交矩阵C,使得
\[ C^{-1}AC = B \]
又C是正交矩阵,所以\(C^{-1}=C'\)
因此,使得
\[ C'AC=B \]
所以,得证
6.1.6 二次型的非正交替换
如果A是实对称矩阵,则必定可以找到一个非正交矩阵C,使得\(C'AC=B\),其中B是对角矩阵,这种替换称为非正交替换
证明:
因为要使\(A \simeq B\)
即要存在可逆矩阵C,使得\(C'AC=B\)
即要存在初等矩阵\(P_1,P_2,\cdots,P_t\),使得\(P_t'\cdots P_2'P_1'AP_1P_2\cdots,P_t=B\)
因此,我们可以对矩阵A进行初等列变换(注意,初等变换放在A的右乘,所以是初等列变换),同时对矩阵A作成对的初等行变换,如果矩阵A经过多次的成对初等变换后能变为对角矩阵,那么这个矩阵A就能合同于对角矩阵,同时,转换矩阵C就是成对初等变换的初等列变换(这就是非正交替换的方法)。
下面,我们证明对于任意对称矩阵(注意,不只是实对称矩阵)都合同于一个对角矩阵
显然,当n=1时,结论成立
假设当n-1阶时,结论成立,那么当n阶时
情形一,\(a_11 \neq 0\),则矩阵A为
\[ A=\begin{bmatrix} a_11 & \alpha \\ \alpha' & A_1\\ \end{bmatrix}\\ \begin{bmatrix} 1 & 0 \\ -a_{11}^{-1}\alpha' & I_{n-1}\\ \end{bmatrix} A\begin{bmatrix} 1 & -a_{11}^{-1}\alpha \\ 0 & I_{n-1}\\ \end{bmatrix}=\begin{bmatrix} 1 & 0 \\ -a_{11}^{-1}\alpha' & I_{n-1}\\ \end{bmatrix} \begin{bmatrix} a_11 & \alpha \\ \alpha' & A_1\\ \end{bmatrix}\begin{bmatrix} 1 & -a_{11}^{-1}\alpha \\ 0 & I_{n-1}\\ \end{bmatrix}\\ \begin{bmatrix} 1 & 0 \\ -a_{11}^{-1}\alpha' & I_{n-1}\\ \end{bmatrix} A\begin{bmatrix} 1 & -a_{11}^{-1}\alpha \\ 0 & I_{n-1}\\ \end{bmatrix}=\begin{bmatrix} a_{11} & 0 \\ 0 & A_1-a_{11}^{-1}\alpha'\alpha\\ \end{bmatrix} \]
由于\(A_1\)是对称矩阵,\(a_{11}^{-1}\alpha'\alpha\)也是对称矩阵,所以\(A_1-a_{11}^{-1}\alpha'\alpha\)也是对称矩阵,且是n-1级的对称矩阵,并且它能对角化
因此我们成功将矩阵A变为对角矩阵,同时变换的方式就是一对的行列变换。
情形二,\(a_{11} = 0,存在a_{ii}\neq 0\),将第i行替换到第一行就可以了,情况二变成了情形一
情形三,\(a_{11} = a_{22}=\cdots=a_{ii} =0,存在a_{ij} \neq 0且i \neq 0\),将第j列加到i列,j行加到i行就可以了,情况三变成了情形二
情形四,\(a_{ij}=0\),矩阵为零矩阵,显然成立
所以综上所述,n级对称矩阵非正交合同于对角矩阵,因此,任一对称矩阵都能合同于一个对角矩阵,得证。
6.2 合同与规范形
6.2.1 二次型系数与轶
二次型\(X'AX\)的标准形中系数不为0的平方项的个数r等于它的矩阵A的轶
证明:
二次型的标准形等价于对称矩阵的对角矩阵的主对角元的数量。由于对称矩阵合同过程使用的都是初等变换,故其合同的对角矩阵的主对角元数量是唯一的,都是等于矩阵的轶,所以得证。
6.2.2 二次型的规范形
\[ z_1^2+z_2^2+\cdots+z_p^2-z_{p+1}^2-\cdots-z_{r}^{2} \]
实二次型\(X'AX\)有形如上式的标准形,称它为\(X'AX\)的规范形,它的特征是,只含平方项,且平方项的系数为1,-1或0.
6.2.3 二次型的规范形的唯一性
n元实二次型\(X'AX\)的规范形是唯一的
证明:
首先,二次型的平方项数目是固定的,都是等于矩阵的轶。但是1和-1系数的数量可能不一样,所以,我们假设
\[ X'AX=y_1^2+y_2^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2\\ X'AX=z_1^2+z_2^2+\cdots+z_q^2-z_{q+1}^2-\cdots-z_r^2\\ \]
其中\(X=CY,X=BZ\),因此\(CY=BZ\),即\(Z=(B^{-1}C)Y\),且\(p>q\),即
\[ \begin{bmatrix} z_1\\ \cdots\\ z_q\\ z_{q+1}\\ \cdots\\ z_n\\ \end{bmatrix}=M_{n \times n}\begin{bmatrix} k_1\\ \cdots\\ k_p\\ k_{p+1}\\ \cdots\\ k_n\\ \end{bmatrix} \]
我们令\(k_{p+1}=\cdots=k_n=0\),并且\(z_1=z_2=\cdots=z_n=0\),然后看方程有没有解
\[ \begin{bmatrix} 0\\ \cdots\\ 0\\ 0\\ \cdots\\ 0\\ \end{bmatrix}=M_{n \times n}\begin{bmatrix} k_1\\ \cdots\\ k_p\\ 0\\ \cdots\\ 0\\ \end{bmatrix}\\ \begin{bmatrix} 0\\ \cdots\\ 0\\ \end{bmatrix}=M_{q \times p}\begin{bmatrix} k_1\\ \cdots\\ k_p\\ \end{bmatrix}\\ \]
因为矩阵\(M_{qxp}\)中非零行为q,未知量为p,即未知量为p>非零行为q,所以方程组肯定有非零解。
所以,我们存在\(y_1,\cdots,y_p \neq 0\),\(y_{p+1},\cdots,y_r=0\),且\(z_1,\cdots,z_r=0\),使得
\[ y_1^2+y_2^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2=z_1^2+z_2^2+\cdots+z_q^2-z_{q+1}^2-\cdots-z_r^2\\ \]
这使得方程组左边为正数,右边为零,与等号矛盾,所以,\(p>q\)不成立。同理\(p<q\)也不成立,故\(p=q\),所以得证
6.2.4 二次型的正惯性
因为二次型的规范形是唯一的,所以,我们考虑将规范型中的系数为+1平方项个数定义为正惯性指数,系数为-1的平方项个数定义为负惯性指数,两者相差称为符号差
6.2.6 实对称矩阵的等价结论
\[ 实对称矩阵A与B合同\\ \Leftrightarrow 它们的二次规范形相同\\ \Leftrightarrow 它们的轶相同,且正惯性指数也相等\\ \]
6.3 合同与正定性
6.3.1 正定的定义
n元实二次型\(X'AX\)称为正定的,如果对于\(R^n\)中任意非零列向量\(\alpha\),都有\(\alpha'A\alpha>0\)
6.3.2 正定与正惯性指数
n元实二次型\(X'AX\)是正定的充分必要条件为它的正惯性指数等于n
显然呀,没什么好说的
6.3.3 正定与合同
n元实二次型\(X'AX\)是正定的充分必要条件为它合同于单元矩阵
证明:
正惯性指数等于n,也就是它的合同矩阵对角元都是+1,也就是单元矩阵了,所以得证。
这个定理说明了,合同是正定性质的传递,如果一个矩阵是正定的,而其他矩阵如果合同于它,那这个矩阵也是正定的。
6.3.4 正定与特征值
n元实二次型\(X'AX\)是正定的充分必要条件为它的特征值大于0
证明:
对于正定对称矩阵A来说,如果它的特征值存在少于0。由于相似变换的矩阵可以是正交矩阵,所以相似的关系变为合同的关系,也就是这个对称矩阵A合同于一个存在少于0的对角矩阵,那它必然不是正定的,与假设矛盾,所以,对于正定对称矩阵A来说,它的特征值必然都大于0,必要性得证
如果这个矩阵是对称矩阵,且特征值都大于0.那么相似矩阵可以是正交矩阵,造成这个矩阵合同于对角元都是大于0的对角矩阵,因此这个矩阵是正定的,充分性得证明。
6.3.5 正定与行列式
n元实二次型\(X'AX\)是正定的充分必要条件为它的所有顺序主子式都大于0
证明略
6.3.6 半正定
实对称矩阵A称为半正定(负定,半负定,不定)的,如果实二次型\(X'AX\)是半正定(负定,半负定,不定)的
7 总结
线性代数的定义都很简单,有很多定理甚至看起来都很傻,可是这些定理堆积起来后,推导出的新定理却很神奇。要特别注意,正交,可逆,相似,合同这几个方面的内容,它们是整个理论中最有应用价值的部分。
- 本文作者: fishedee
- 版权声明: 本博客所有文章均采用 CC BY-NC-SA 3.0 CN 许可协议,转载必须注明出处!