《线性代数》的读书笔记之一

2017-01-06 fishedee 数学

1 概述

线性代数是数学中另外一个重要的分支,有着广泛的应用意义,同时,它也是第一个引入抽象的数学分析的分支——线性空间

1.1 研究对象

\[ \begin{cases} x1 + x2 + x3 = 3 \\ x1 + 2x2 + 3x3 = 6 \\ x1 + 10x2 + 100x3 = 111 \\ \end{cases} \]

在初中时,我们就开始学习解线性方程组,那时候我们用高斯消元法就能算出来了,不难。

但是,我们对这个简单的线性方程组问题,如果我们换个角度来看它,它是这样的:

\[ \begin{bmatrix} 1 & 1 & 1 \\ 1 & 2 & 3 \\ 1 & 10 & 100 \\ \end{bmatrix} \begin{bmatrix} x_1\\ x_2\\ x_3\\ \end{bmatrix} = \begin{bmatrix} 3\\ 6\\ 11\\ \end{bmatrix} \]

我们将\([x_1,x_2,x_3]\)提取出来变成未知向量,方程组系数提取出来变成向量转换系数,右侧是结果向量,就会变成上式,变成形如一个

\[ AX=Y \]

的一元方程式,只是每个X,Y变量不再是数学分析中单个数字变量,而是变成了向量变量。而A不再是数学分析中的数字系数,而是一个向量系数。方程组问题被转化为一个简单的问题

在线性方程组中,如果变量不是数字,而是向量时,怎么求解

在普通的方程组中

\[ 3x = 78 \]

这个问题中,计算相当简单,但当x变成一个向量时,这个问题就很复杂了,因为向量中的每个分量都是相互影响的,怎么去求解这些元,这就是线性代数要解决的问题。

可以看出,线性代数是初中代数学的推广,它将单个数字作为变量的线性方程组推广到将单个向量作为变量的线性方程组。注意,线性代数研究的仍然是单个元的问题,只是这个元不是一个数字,是一个向量。除此以外,线性代数还将整个计算进行推广,引入了矩阵求逆,矩阵相似,转置等问题,并深挖了行列式,迹等的性质。

整体来说,线性代数研究的是,在线性空间中关于线性映射的问题。

1.2 应用

就像高等数学下册所说中,这个世界是多元的,所以有了多元的数学分析,但我们又可以将多元看成是一元向量,所以有了线性代数。线性代数是从一个更为特别的角度来研究世界的工具,它将多个未知变量看成了一个未知向量,而不是多个未知数字。其应用有:

  • 解线性方程组,高数下册中很多的矩阵形式就是因为这个。
  • 解线性映射方程,多个矩阵求逆,乘法运算等的方程,这是计算机图形学中的基石,怎么用计算机来模拟一个3d的世界。
  • 矩阵拆分与同构,矩阵中的特征值分解,奇异值分解,将矩阵拆分了多个向量想乘的逼近(相当于高数中用泰勒公式来逼近任意一个函数),为图像压缩(奇异值分解),大数据降维(PCA方法)提供理论基础。

整个线性代数中的主要难点在于,定义和定理很多,推导链很长,所以要特别注意证明的过程。要抛开直观的概念来理解线性代数,而是要认真套定义来证明定理,这样才能深刻理解为什么。

2 行列式

2.1 方程组

2.1.1 非齐次线性方程组

非齐次线性方程组是各个方程关于未知量均为一次的方程组,并且,常数项不全为0。显然,非齐次线性方程组的解有:

  • 只有一个解
  • 有无穷多个解
  • 无解

2.1.2 齐次线性方程组

常数项全部为零的线性方程组。显然齐次线性方程组的解有:

  • 只有零解
  • 包含非零解

2.2 矩阵初等变换解法

2.2.1 矩阵的定义

\(s\cdot m\)个数排成s行,m列的一张表称为\(s \times m\)矩阵,其中的每一个数称为这个矩阵的一个元素,第i行与第j列交叉的未知的元素称为矩阵的\((i,j)\)元。

矩阵通常用大写英文字母\(A,B,C,\cdots\)表示,一个\(s \times m\)矩阵可以简单记作\(A_{s \times m}\),它的\((i,j)\)元记作\(A(i;j)\),如果矩阵A的(i,j)元全是\(a_{ij}\),那么可以记作\(A=(a_{ij})\)

2.2.2 矩阵的初等行变换

矩阵的初等行变换为:

  • 把一行的倍数加到另外一行上
  • 互换两个行的位置
  • 用一个非零乘某一行

同理,我们可以定义矩阵的初等列变换

2.2.3 阶梯形矩阵

\[ \begin{bmatrix} 1 & 3 & 1 & 2 \\ 0 & 1 & -1 & -3 \\ 0 & 0 & 3 & 6 \\ 0 & 0 & 0 & 0 \\ \end{bmatrix} \]

若矩阵A满足两条件:

  • 若有零行(元素全为0的行),则零行应在最下方
  • 非零首元(即非零行的第一个不为零的元素)的列标号随行标号的增加而严格递增,则称此矩阵A为阶梯形矩阵。

则称该矩阵为阶梯形矩阵

2.2.4 简化行阶梯形矩阵

\[ \begin{bmatrix} 1 & 0 & 0 & 3 \\ 0 & 1 & 0 & -1 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 0 \\ \end{bmatrix} \]

若矩阵A满足:

  • 它是阶梯形矩阵
  • 每个非零行的主元都是1
  • 每个主元所在的列的其他元素都是0

则称该矩阵为简化行阶梯形矩阵

2.1.5 高斯约当算法

对于非线性方程组,解法为

  • 先将方程组转换为增广矩阵
  • 然后将增广矩阵用初等行变换变为阶梯形矩阵,如果这时候出现\(0=d(d \neq 0)\)的等式,则原方程组无解
  • 再将阶梯形矩阵用初等行变换变为简化阶梯矩阵,如果非零行个数r等于未知量个数n,则方程有唯一解,否则有无穷解

对于线性方程组,解法为

  • 先将方程组转换为系数矩阵
  • 然后将系数矩阵用初等行变换变为阶梯形矩阵,如果这时候非零行个数r小于未知量个数n,则方程有非零解,否则只有零解

证明是显然,因为初等行变换的每一步都与原方程组是等价的,解空间是没有变化的。

2.3 行列式

2.3.1 逆序数

对于n个不同的元素,规定标准次序为小数在前,大数在后,这n个元素的任一排列中,当某两个元素的先后次序与标准次序不同时,就说有1个逆序。一个\(\tau\)来表示,例如

\[ \tau(2341) = 3 \]

因为逆序的有21,34,31,共三对。

其中,逆序数为奇数的排列称为奇排列,逆序数为偶数的排列称为偶排列

2.3.2 逆序数的性质

  • 对换n元排列的两个数字,改变该数列的奇偶性
  • 任一n元排列与排列\(1,2,\cdots,n\)可以经过一系列对换互变,并且所作对换的次数与这个n元排列有相同的奇偶性

2.3.3 行列式的定义

n阶行列式

\[ \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \cdots & \cdots & & \cdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{vmatrix} \]

是n!项的代数和,其中每一项都是位于不同行、不同列的n个元素的乘积,把这n个元素按照行指标成自然序排好位置,当列指标所称排列为偶排列时,该项带正号,奇排列时,该项带负号,即

\[ \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \cdots & \cdots & & \cdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{vmatrix} \stackrel{def}{=} \sum\limits_{j_1 j_2 \cdots j_n}(-1)^{\tau(j_1 j_2 \cdots j_n)}a_{1j_1}a_{2j_2}\cdots a_{nj_n} \]

其中\(j_1 j_2 \cdots j_n\)是一个n元排列,令

\[ A = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \cdots & \cdots & & \cdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{bmatrix} \]

则n阶行列式也被称为n级矩阵A的行列式,简记为\(\lvert A \rvert\)或者\(det(A)\)

从定义上看,行列式的定义有点神奇,就是是突然冒出来的。其实行列式的定义最开始是从高斯消元法中寻找规律得出来的,所以这一步看起来比较奇怪。另外,行列式是一个单一的数值,不是向量,更不是矩阵。而且,行列式必须是等阶的,不存在三行两列这样的不等阶矩阵的行列式。

另外,要注意的是,当行指标不是顺序排列,而是任意序排列时,符号为

\[ (-1)^{\tau(i_1 i_2 \cdots i_n)\tau(k_1 k_2 \cdots k_n)}a_{i_1 k_1}a_{i_2 k_2}\cdots a_{i_n k _n} \]

也就是将行指标与列指标分别取逆序数之和

2.3.4 上三角行列式

主对角线以下元素全为零的行列式称为上三角行列式,套用行列式的定义,上三角的行列式的值等于对角线上n个元素的乘积

2.4 行列式的性质

行列式有很多特别的性质

2.4.1 行列等价

Screen Shot 2017-01-09 at 8.46.42 A

行列互换,行列式的值不变

2.4.2 提取公因子

Screen Shot 2017-01-09 at 8.47.32 A

行列式一行的公因子可以提出去

2.4.3 和式分解

Screen Shot 2017-01-09 at 8.48.16 A

行列式中若某一行(列)是两组数的和,则此行列式等于两个行列式的和,这两个行列式的这一行(列)分别是第一组数和第二组数,而其余各行与原来行列式的相应各行相同。

2.4.4 两行互换取反

Screen Shot 2017-01-09 at 8.50.27 A

两行互换,行列式反号

2.4.5 两行相同为零

两行相同,行列式的值为0

这个可以直接用第四点性质推导出来,因A=-A,故A = 0

2.4.6 两行成比例为零

Screen Shot 2017-01-09 at 8.52.44 A

两行成比例,行列式的值为0。这个明显也是第5点的推论。

2.4.7 行倍数相加不变

Screen Shot 2017-01-09 at 8.53.42 A

行倍数相加行列式不变。显然将结果行列式拆开,会发现第二个行列式两列成比例,所以为0,所以依然是相等,是第6点的推论。

2.5 行列式展开

2.5.1 一阶余子式与代数余子式

n阶行列式中,划去第i行和第j列,剩下的元素按原来次序组成的n-1阶行列式称为(i,j)元的余子式,记为\(M_{ij}\),令

\[ A_{ij} = (-1)^{i+j}M_{ij} \]

\(A_{ij}\)是(i,j)元的代数余子式

注意,余子式的定义是一个行列式,是一个数值,代数余子式就是在余子式的基础上加入了正负号

2.5.2 一阶本行行列式展开

n阶行列式\(\lvert A \rvert\)等于它的第i行元素与自己的代数余子式的乘积之和,即

\[ \lvert A \rvert = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots + a_{in}A_{in} = \sum\limits_{j=1}^{n} a_{ij}A_{ij} \]

这个定理也被称为行列式的第i行展开式

注意,这个定理对于第j列展开也是成立的,证明的方法可以用数学归纳法

2.5.3 一阶非本行行列式展开

n阶行列式\(\lvert A \rvert\) 的第i行元素与第k行\((k \neq i)\)相应元素的代数余子式的乘积之和等于零。即当\(k \neq i\)时,有

\[ \sum\limits_{j=1}^{n} a_{ij} A_{kj} = 0 \]

证明:

第i行元素与第k行的代数余子式乘积相加,等价为先将第i行的元素替换到第k行上,然后按第k行展开的代数余子式乘积相加。

但是,因为替换以后,第i行与第k行的元素相等,根据行列式的性质,整个行列式的值为0,所以得证。

注意,这个定理是说非本行的行列式展开和为0,而不是说单项为0。

2.5.4 k阶子式,余子式和代数余子式

n阶行列式\(\lvert A \rvert\)中任意取定k行,k列(1<=k<n),位于这些行和列的交叉处的\(k^2\)个元素按原来的排法组成的k阶行列式,称为\(\lvert A \rvert\)的一个k阶子式。如果取定第\(i_1,i_2,\cdots,i_k\)\((i_1<i_2<\cdots<i_k)\),取定第\(j_1,j_2,\cdots,j_k\)\((j_1<j_2<\cdots<j_k)\),则所得到的k阶子式记作

\[ A\begin{pmatrix} i_1,i_2,\cdots,i_k\\ j_1,j_2,\cdots,j_k \\ \end{pmatrix} \]

划去子式所在的第\(i_1,i_2,\cdots,i_k\)行,第\(j_1,j_2,\cdots,j_k\)列,剩下的元素按原来的排法组成的(n-k)阶行列式,称为子式的余子式

该子式的余子式乘以

\[ (-1)^{(i_1+i_2+\cdots+i_k)+(j_1+j_2+\cdots+j_k)} \]

称为子式的代数余子式

注意,这个定义中包含了,子式,余子式和代数余子式三个的定义,注意它们之间的区别。并且,余子式都是等阶的,就是没有k行,m列的子式说法。

2.5.5 拉普拉斯定理

在n阶行列式\(\lvert A \rvert\)中,取定k行,第\(i_1,i_2,\cdots,i_k\)行(\(i_1<i_2<\cdots<i_k\),且1<=k<n),则这k行元素形成的所有k阶子式与它们自己的代数余子式的乘积之和等于\(\lvert A \rvert\)

证明略

这个定理说明了,按k阶展开行列式,跟一阶展开的行列式有相似的定理,都是子式与代数余子式的乘积之和。

2.6 行列式解法

2.6.1 初等变换的行列式变化

对矩阵A进行初等变换变成矩阵B,则

\[ \lvert A \rvert = k \lvert B \rvert \]

其中k是某个非零常数

证明:

因为初等变换为

  • 把一行的倍数加到另外一行上,行列式值不变。
  • 互换两个行的位置,行列式的值取反。
  • 用一个非零乘某一行,行列式的值按非零数翻倍。

所以,初等变换的任意复合操作,都只是原来行列式值的倍数,得证。

注意,这个结论说明了矩阵初等变换不会改变矩阵行列式的零性。也就是说,如果原来矩阵的行列式不为0,那么该矩阵经过任意次初等变换之后,新矩阵的行列式依然不为0。

2.6.2 克莱姆法则

n个方程的n元线性方程组,如果它的系数行列式$A \(,则它有唯一解,如果它的系数行列式\)A = 0$,则它无解或有无穷个解。当线性方程组有唯一解时,解为:

\[ (\frac {\lvert B_1 \rvert} {\lvert A \rvert} ,\frac {\lvert B_2 \rvert} {\lvert A \rvert},\cdots,\frac {\lvert B_n \rvert} {\lvert A \rvert}) \]

其中\(\lvert A \rvert\)是方程组的系数行列式,并且,

\[ \lvert B_j \rvert = \begin{vmatrix} a_{11} & \cdots &a_{1,j-1} & b_1 & a_{1,j+1} & \cdots & a_{1,n} \\ a_{21} & \cdots &a_{2,j-1} & b_2 & a_{2,j+1} & \cdots & a_{2,n} \\ \cdots & &\cdots & \cdots & \cdots & \cdots & a_{1,n} \\ a_{n1} & \cdots &a_{n,j-1} & b_n & a_{n,j+1}& \cdots& a_{n,n} \\ \end{vmatrix} \]

证明:

如果将线性方程组的系数变为系数矩阵A,它经过处等变换后变为阶梯矩阵J,根据高斯约当算法

  • 如果线性方程组有唯一解,则阶梯矩阵非零行个数r等于未知量个数n,即阶梯矩阵没有零行,所以这时的阶梯矩阵的行列式不为0(上三角行列式的性质)。
  • 由于阶梯矩阵由系数矩阵经过处等变换转化过来,初等变换不改变矩阵行列式的零性,所以系数矩阵的行列式也不为0。

所以证得,当系数矩阵的行列式不为0时,方程组有唯一解,否则有无穷解或无解。这个定理说明了,在n元n个方程组的情况下,常数项不影响方程组的是否有解,只有系数项会影响。

然后,我们将解代入到第i条方程中,有

\[ a_{i1}\frac{\lvert B_1 \rvert} {\lvert A \rvert} + a_{i2}\frac{\lvert B_2\rvert} {\lvert A \rvert} +\cdots + a_{in}\frac{\lvert B_n \rvert} {\lvert A \rvert} \\ = \frac {1} {\lvert A \rvert}\sum\limits_{j=1}^{n} a_{ij} \lvert B_j \rvert \\ = \frac {1} {\lvert A \rvert} \sum\limits_{j=1}^{n} a_{ij} \left( \sum\limits_{k=1}^{n} b_k A_{kj}\right)\\ = \frac {1} {\lvert A \rvert} \sum\limits_{j=1}^{n} \left( \sum\limits_{k=1}^{n} a_{ij}b_kA_{kj}\right) \\ = \frac {1} {\lvert A \rvert} \sum\limits_{k=1}^{n}\left( b_k \sum\limits_{j=1}^{n} a_{ij}A_{kj}\right) \\ = \frac {1} {\lvert A \rvert} (b_1\cdot 0 +\cdots+ b_{i-1}\cdot 0+b_{i}\cdot \lvert A \rvert + b_{i+1}\cdot 0+\cdots+b_n\cdot 0)\\ = b_i \]

所以证得解均满足方程组的每一条,所以证得解空间。证明的过程中使用了一阶非本行行列式展开为0的行列式性质,非常巧妙。

这个定理利用了行列式的性质就能一步得初方程组的解,而且适用于齐次与非齐次的线性方程组。但是,要注意的是,这个定理只适用于n元n个方程组,不适用于n元k个方程组\((k \neq n)\)的情况。而且,这个法则没有说出无穷解时的解结构。

3 向量空间

3.1 向量空间

3.1.1 数域

设K是复数集的一个子集,如果K满足

  • \(0,1\in K\)
  • 对于任意的\(a,b\in K\),都有\(a \pm b , ab \in K\),并且当\(b \neq 0\)时,有\(\frac a b \in K\)

那么称K是一个数域

简单来说,数域就是对于加、减、乘、除四种运算封闭。显然,有理数Q,实数集R,复数集C都是数域,但是整数集Z不是数域。

3.1.2 向量空间

取定一个数域K,设n是任意给定的一个正整数,令

\[ K^n \stackrel{def}{=}\{(a_1,a_2,\cdots,a_n)|a_i\in K,i=1,2,\cdots,n\} \]

\(K^n\)中的两个元素\((a_1,a_2,\cdots,a_n)\)\((b_1,b_2,\cdots,b_n)\)称为相等,如果它们满足:\(a_1=b_1,a_2=b_2,\cdots,a_n=b_n\)

\(K^n\)中的元素用小写希腊字母\(\alpha,\beta,\gamma,\cdots\)来表示

\(K^n\)中规定加法运算如下:

\[ (a_1,a_2,\cdots,a_n)+(b_1,b_2,\cdots,b_n)\stackrel{def}{=}(a_1+b_1,a_2+b_2,\cdots,a_n+b_n) \]

在K中的元素与\(K^n\)的元素之间规定数量乘法运算如下:

\[ k(a_1,a_2,\cdots,a_n) \stackrel{def}{=}(ka_1,ka_2,\cdots,ka_n),k\in K \]

容易验证加法和数量乘法满足下述的8条运算法则:对于任意\(\alpha,\beta,\gamma \in K^n\),以及任意\(k,l \in K\),有

  • \(\alpha+\beta=\beta+\alpha\)(加法交换律)
  • \((\alpha+\beta)+\gamma=\alpha+(\beta+\gamma)\)(加法结合律)
  • 把元素\((0,0,\cdots,0)\)记作0,称0是\(K^n\)的零元素
  • 对于\(\alpha = (a_1,a_2,\cdots,a_n)\in K^n\),令\(-\alpha \stackrel{def}{=}(-a_1,-a_2,\cdots,-a_n)\in K^n\),称\(-\alpha\)\(\alpha\)的负元素
  • \(1\alpha=\alpha\)
  • \((kl)\alpha = k(l\alpha)\)
  • \((k+l)\alpha=k\alpha+l\alpha\)
  • \(k(\alpha+\beta)=k\alpha+k\beta\)

数域K上所有n元有序数组组成的集合\(K^n\),连同定义在它上面的加法运算和数量乘法及其满足的8条运算法则一起,称为数域K上的一个n维向量空间。\(K^n\)的运算称为n维向量;设向量\(\alpha=(a_1,a_2,\cdots,a_n)\),称\(a_i\)\(\alpha\)的第i个分量

从定义看出,向量空间是纯粹的从数域底层开始定义的运算,它仅仅定义了向量的加法和数乘运算,并且这种运算都满足8条运算法则。注意,这里的8条运算法则,广义上的线性空间也是用这8条法则。

3.1.3 向量空间性质

在n维向量空间\(K^n\)中,可以定义减法运算如下

\[ \alpha-\beta \stackrel{def}{=}\alpha + (-\beta) \]

在向量空间中,很容易满足这四条运算法则

  • \(0\alpha=0\)
  • \((-1)\alpha=-\alpha\)
  • \(k0=0\)
  • \(k\alpha=0 \Rightarrow k=0或\alpha=0\)

3.1.4 行向量和列向量

设n元有序数组可以写成一行:\((a_1,a_2,\cdots,a_n)\)称为行向量,也可以把n元有序数组写成一列

\[ \begin{bmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \\ \end{bmatrix} \]

称它为列向量

3.1.5 向量组

\[ A=\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \cdots & \cdots & & \cdots\\ a_{s1} & a_{s2} & \cdots & a_{sn}\\ \end{bmatrix} \]

矩阵A的每一行是n维向量,把第i个行向量\((a_{i1},a_{i2},\cdots,a_{in})\)记作\(\gamma_{i}\),则\(\gamma_1,\gamma_2,\cdots,\gamma_s\)称为A的行向量组。同理可以定义相应的列向量组。

从这个角度看,矩阵可以看成是行向量组,或列向量组。

3.2 线性无关

3.2.1 线性组合与线性表出

\(K^n\)中,给定向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\),任给K中一组数\(k_1,k_2,\cdots,k_s\),我们把\(k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s\)称为向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)的一个线性组合,把\(k_1,k_2,\cdots,k_s\)称为系数。

对于\(\beta \in K^n\),如果存在K中一组数\(c_1,c_2,\cdots,c_s\)使得

\[ \beta = c_1 \alpha_1 + c_2\alpha_2+\cdots+c_s\alpha_s \]

则称\(\beta\)可以由\(\alpha_1,\alpha_2,\cdots,\alpha_s\)线性表出

从定义可以看出,线性表出就是由其他向量加权导出

3.2.2 线性相关与线性无关

\(K^n\)中向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s(s>=1)\)称为线性相关的,如果有K中不全为零的数\(k_1,k_2,\cdots,k_s\),使得

\[ k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s = 0 \]

\(K^n\)中向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s(s>=1)\)不是线性相关的,则就是线性无关的,也就是从

\[ k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s = 0 \]

可以推出所有系数\(k_1,k_2,\cdots,k_s\)全为0。

注意,线性相关描述的是向量组的关系,线性表出描述的是向量组与向量的关系,两者是不一样的。

3.2.3 线性相关的性质

  • 如果向量组的一个部分组线性相关,则整个向量组也线性相关。相应的等价说法为,如果向量组线性无关,则它的任何一个部分组也线性无关。
  • 如果向量组线性无关的,则它的延伸组也线性无关。相应的等价说法为,如果向量组线性相关的,则它的缩短组也线性相关。

套入线性相关的性质就可以证明了

3.2.4 线性相关与齐次线性方程组的联系

\[ k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s = 0 \]

向量组是否线性相关关键是看\(k_1,k_2,\cdots,k_s\)是否全为0,如果我们将向量展开,就得出

\(a_{11},a_{21},\cdots,a_{m1}\)看成是一个向量\(\alpha_1\),将\(x_1\)看成是系数\(k_1\),所以向量组是否线性相关的问题等价于齐次线性方程组是否有非零解的问题

3.2.5 线性表出与非齐次线性方程组的联系

\[ \beta = c_1 \alpha_1 + c_2\alpha_2+\cdots+c_s\alpha_s \]

向量\(\beta\)能否被\(\alpha_1,\alpha_2,\cdots,\alpha_s\)线性表出,关键是看是否有\(c_1,c_2,\cdots,c_s\)满足上述的方程组。如果我们将向量展开,就得出

\(a_{11},a_{21},\cdots,a_{m1}\)看成是一个向量\(\alpha_1\),将\(b_1,b_2,\cdots,b_m\)看成是向量\(\beta\),所以向量\(\beta\)能否线性表出的问题等价于非齐次线性方程组是否有解的问题

3.2.6 线性相关与线性表出的联系

向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s(s>=2)\)线性相关的充分必要条件是至少有一个向量可以由其他向量线性表出

证明:

\(\alpha_1,\alpha_2,\cdots,\alpha_s\)线性相关,则

\[ k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s = 0 \]

存在不全为0的数\(k_1,k_2,\cdots,k_s\)满足上式,设\(k_i \neq 0\),则

\[ \alpha_i = -\frac {k_1} {k_i} \alpha_1-\frac {k_2} {k_i} \alpha_2-\cdots-\frac {k_s} {k_i} \alpha_s \]

所以\(\alpha_i\)可以由其他剩余的向量线性表出

所以证得必要性

\(\alpha_i\)可以由其他向量线性表出,则

\[ \alpha_i = c_1 \alpha_1 + c_2\alpha_2+\cdots+c_s\alpha_s \\ c_1 \alpha_1 + c_2\alpha_2+\cdots+c_s\alpha_s - \alpha_i = 0 \]

所以向量组线性相关,证得充分性

所以得证

3.2.7 线性相关的相互等价结论

根据线性方程组的定理,以及线性相关与线性方程组的关系,我们得出以下相互等价的结论

对于一般的向量组

\[ 向量组相关 \\ \Leftrightarrow 其中一个向量可以由其他向量线性表出 \\ \Leftrightarrow 向量组所代表的齐次线性方程组有非零解 \]

特别的,对于n个n元向量,有

\[ n个n元向量组相关 \\ \Leftrightarrow 其中一个向量可以由其他向量线性表出 \\ \Leftrightarrow 向量组所代表的齐次线性方程组有非零解 \\ \Leftrightarrow 向量组的行列式等于零 \]

向量组无关则结论取相反就可以了

3.3 轶

3.3.1 极大线性无关组

\(K^n\)中向量组的一个部分组称为极大线性无关组,如果这个部分组本身是线性无关的,但是从这个向量组的其他向量中任取一个添进去,得到新的部分组都线性相关

注意,极大线性无关组的选取是任意的,只要是极大且无关就可以了

3.3.2 向量组等价

如果向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)的每一个向量都可以由向量组\(\beta_1,\beta_2,\cdots,\beta_s\)线性表出,则称向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)可以由\(\beta_1,\beta_2,\cdots,\beta_s\)线性表出。如果向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)与向量组\(\beta_1,\beta_2,\cdots,\beta_r\)可以互相线性表出,则称向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)与向量组\(\beta_1,\beta_2,\cdots,\beta_r\)等价,记作

\[ \{\alpha_1,\alpha_2,\cdots,\alpha_s\} \cong \{\beta_1,\beta_2,\cdots,\beta_r\} \]

向量组的等价关系还是比较明显的,显然我们可以得出等价关系的这些性质

  • 反身性,任何一个向量组都与自身等价
  • 对称性,如果\(\alpha_1,\alpha_2,\cdots,\alpha_s\)\(\beta_1,\beta_2,\cdots,\beta_r\)等价,则\(\beta_1,\beta_2,\cdots,\beta_r\)\(\alpha_1,\alpha_2,\cdots,\alpha_s\)等价
  • 传递性,如果\(\{\alpha_1,\alpha_2,\cdots,\alpha_s\} \cong \{\beta_1,\beta_2,\cdots,\beta_r\}\),并且\(\{\beta_1,\beta_2,\cdots,\beta_r\} \cong \{\gamma_1,\gamma_2,\cdots,\gamma_t\}\),则\(\{\alpha_1,\alpha_2,\cdots,\alpha_s\} \cong \{\gamma_1,\gamma_2,\cdots,\gamma_t\}\)

3.3.3 向量组的任意两个极大线性无关组等价

向量组的任意两个极大线性无关组等价

证明:

设向量组为\(\alpha_1,\alpha_2,\cdots,\alpha_s\),它的其中一个极大线性无关组为\(\alpha_1,\alpha_2,\cdots,\alpha_m\)

因为取任意的\(i \in \{1,2,\cdots,m\}\),有

\[ \alpha_i = 0\alpha_1+0\alpha_2+\cdots+1\alpha_i+\cdots+0\alpha_s \]

所以,极大线性无关组肯定是可以被向量组线性表出的。

另外,因为极大无关组\(\alpha_1,\alpha_2,\cdots,\alpha_m\)是线性无关的,如果添加一个新的\(j \in \{1,2,\cdots,m\},\alpha_j\)进去,就会线性相关,所以,根据线性相关与线性表出的结论,\(\alpha_j\)肯定可以被极大无关组所表出

所以,向量组可以被极大线性无关组线性表出

所以,综上所述,向量组与其自身任意一个极大线性无关组等价,又有等价关系的传递性我们得出,向量组的任意两个极大线性无关组等价,得证。

这个定理告诉我们,研究向量组的关键在于研究极大线性无关组,因为它就是等价于向量组本身。

3.3.4 向量组的任意两个极大线性无关组数量相同

向量组的任意两个极大线性无关组数量相同

证明:

首先,从直觉看出,向量组\(\beta_1,\beta_2,\cdots,\beta_r\)可以由向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)线性表出,如果\(\beta_1,\beta_2,\cdots,\beta_r\)线性无关,则\(r<=s\)。但是,这个命题比较难证明,我们可以换个做法,去证明如果\(r>s\)时,则向量组\(\beta_1,\beta_2,\cdots,\beta_r\)线性相关

要证明\(\beta_!\)线性相关,那就要考虑

\[ x_1\beta_1+x_2\beta_2+\cdots+x_r\beta_r=0 \]

有没有非零解,又

\[ \begin{cases} \beta_1 = a_{11}\alpha_1+a_{21}\alpha_2+\cdots+a_{s1}\alpha_s \\ \beta_2 = a_{12}\alpha_1+a_{22}\alpha_2+\cdots+a_{s2}\alpha_s \\ \cdots\\ \beta_1r = a_{1r}\alpha_1+a_{2r}\alpha_2+\cdots+a_{sr}\alpha_s \\ \end{cases} \]

代入原方程中,有

\[ \begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1r}x_r=0 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2r}x_r=0 \\ \cdots a_{s1}x_1+a_{s2}x_2+\cdots+a_{sr}x_r=0 \\ \end{cases} \]

由于未知量有r个,方程组有s个,且r>s,所以肯定有非零解。

从上述引理,可以推出,向量组\(\beta_1,\beta_2,\cdots,\beta_r\)可以由向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)线性表出,如果\(\beta_1,\beta_2,\cdots,\beta_r\)线性无关,则\(r<=s\)。因为如果\(s>r\),则\(\beta\)线性向量组相关。(注意这种证明方法,用反向逻辑将要证明的条件与结论反转,然后用多一次反向逻辑,就可以得出结论)

所以,可以对于向量组的极大无关组\(\alpha\)\(\beta\),由于\(\alpha\)\(\beta\)等价,所以\(\alpha\)可以被\(\beta\)线性表出,且\(\alpha\)线性无关,所以\(count(\alpha) <= count(\beta)\),同理,可以得出\(count(\beta) >= count(\alpha)\),所以\(count(\alpha)=count(\beta)\),所以得证

这个定理更进一步揭示了向量组,研究向量组的关键在于研究极大线性无关组,而任意两个极大线性无关组的数目竟一致地都是相同的。

3.3.5 轶的定义

向量组的极大线性无关组所含向量的个数称为这个向量组的轶

从定义可以看出,因为向量组的任意两个极大线性无关组的数量相同,所以我们定义这个数量为轶,它比线性无关更深刻地描述了向量组的性质。

3.3.6 轶与线性无关的联系

向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)线性无关的充分必要条件时它的轶等于它的所含向量的个数s

证明:

当向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)线性无关时,它的极大无关向量组就是它本身,所以轶为s,必要性得证

当向量\(\alpha_1,\alpha_2,\cdots,\alpha_s\)的轶为s时,这个向量组的极大无关向量组的个数为s,又向量组只有s个向量,所以这个向量组都线性无关。

这个定理联系了轶与线性无关的关系,更进一步的,线性相关只描述了向量组的线性相关性,但没有描述向量组究竟有多相关和多不相关,但轶可以。

3.3.7 轶与线性表出的联系

如果向量组(I)可以由向量组(II)线性表出,则

\[ I的轶<=II的轶 \]

证明:

设向量组I的极大无关向量组为\(\alpha_1,\alpha_2,\cdots,\alpha_r\),向量组II的极大无关向量组为\(\beta_1,\beta_2,\cdots,\beta_s\)

由于向量组I可以被其极大无关向量组II线性表出,向量组I包含着\(\alpha_1,\alpha_2,\cdots,\alpha_r\),而向量组II又可以被其极大无关向量组\(\beta_1,\beta_2,\cdots,\beta_s\)线性表出。

所以\(\alpha_1,\alpha_2,\cdots,\alpha_r\)可以被\(\beta_1,\beta_2,\cdots,\beta_s\)线性表出,而\(\alpha_1,\alpha_2,\cdots,\alpha_r\)线性无关,则r<=s,所以得证

这个定理将轶与线性表出拉上了联系。

3.3.8 轶的相互等价结论

由于轶与线性相关和线性表出都拉上了联系,所以轶有以下的等价结论

等价结论一

\[ 向量组相关 \\ \Leftrightarrow 向量组的轶小于向量组的行数和列数\\ \Leftrightarrow 其中一个向量可以由其他向量线性表出 \\ \Leftrightarrow 向量组所代表的齐次线性方程组有非零解 \]

等价结论二

\[ 向量组无关 \\ \Leftrightarrow 向量组的轶等于向量组的行数或列数\\ \Leftrightarrow 任何一个向量都不可以由其他向量线性表出 \\ \Leftrightarrow 向量组所代表的齐次线性方程组有非零解 \]

等价结论三

\[ 向量\beta可以由向量组\alpha_1,\alpha_2,\cdots,\alpha_s线性表出 \\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}的轶等于向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}的轶\\ \Leftrightarrow 如果向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}线性无关,则向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}线性相关 \\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}所代表的非齐次线性方程组有解(唯一解或无穷解) \]

等价结论四

\[ 向量\beta不可以由向量组\alpha_1,\alpha_2,\cdots,\alpha_s线性表出 \\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}的轶小于向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}的轶\\ \Leftrightarrow 如果向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}线性无关,则向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}线性无关 \\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}所代表的非齐次线性方程组没有解 \]

3.4 轶性质

3.4.1 列轶与行轶

矩阵可以看成是列向量组,或者是行向量组。矩阵的列向量组的轶称为矩阵的列轶,矩阵的行向量组称为行轶。

3.4.2 阶梯矩阵的轶性质

阶梯矩阵J的行轶与列轶相等,它们都等于J的非零行的个数

证明:

设阶梯向量组为

\[ \begin{bmatrix} a_1 & b_1& c_1 & d_1 & e_1 \\ 0 & b_2& c_2 & d_2 & e_2 \\ 0 & 0& c_3 & d_3 & e_3 \\ 0 & 0 & 0 & 0 & 0 \\ \end{bmatrix} \]

设阶梯向量组的列向量分别为\((\alpha_1,\alpha_2,\alpha_3,\alpha_4,\alpha_5)\),因为前三列的组成的三阶向量子式的行列式不为0,所以线性无关,因此它们的延伸组\(\alpha_1,\alpha_2,\alpha_3\)也就线性无关了。当我们加入\(\alpha_4\)时,矩阵变为

\[ \begin{bmatrix} a_1 & b_1& c_1 & d_1 \\ 0 & b_2& c_2 & d_2 \\ 0 & 0& c_3 & d_3 \\ 0 & 0 & 0 & 0 \\ \end{bmatrix} \]

显然,行列式为0,所以\(\alpha_1,\alpha_2,\alpha_3,\alpha_4\)线性相关。同理,可以证得\(\alpha_1,\alpha_2,\alpha_3,\alpha_5\)线性相关。所以该阶梯矩阵的列向量组的轶为3。

同理,可以证得该阶梯矩阵的行向量组的轶也为3。

所以,结果得证

3.4.3 初等行变换与轶

矩阵的初等变换不改变矩阵的行轶,也不改变矩阵的列轶

证明:

这个证明相当麻烦,要分两步,先证明不改变行轶,然后再证明不改变列轶。

首先,对于行向量来说,执行下面的三种初等变换

  • 把一行的倍数加到另外一行上,向量组\((\alpha_1,\alpha_2,\cdots,\alpha_s)\)变为\((\alpha_1,k\alpha_2+\alpha_1,\cdots,\alpha_s)\),那么第一个向量组显然是可以线性表出到第二个向量组,第二个向量组,通过\(\alpha_2 = \frac {1} {k}(k\alpha_2+\alpha_1)-\frac {1} {k}\alpha_1\)就可以从第二个向量组线性表出到第一个向量组,所以轶是没有变化的。
  • 互换两个行的位置,向量组\((\alpha_1,\alpha_2,\cdots,\alpha_s)\)变为\((\alpha_2,\alpha_1,\cdots,\alpha_s)\),显然依然是说同一个向量组,所以轶是没有变化的,
  • 用一个非零乘某一行,向量组\((\alpha_1,\alpha_2,\cdots,\alpha_s)\)变为\((\alpha_1,k\alpha_2,\cdots,\alpha_s)\),显然两个向量组依然是可以相互表出的,所以轶没有变化的。

所以,综上所述,每个初等变换都不改变行向量的轶,所以初等变换的任意复合操作都不会改变行向量的轶。

首先证明初等变换不改变矩阵相应列的线性相关性,设A矩阵的任取s个列向量为\(\alpha_1,\alpha_2,\cdots,\alpha_s\),与初等变换后的B矩阵的相应s个列向量为\(\beta_1,\beta_2,\cdots,\beta_s\)

如果这s个列向量线性无关,则

\[ x_1\alpha_1+x_2\alpha_2+\cdots+x_s\alpha_s = 0 \]

中的\(x_1,x_2,\cdots,x_s\)只有零解。同时由于初等变换不改变线性方程组的解空间。

\[ y_1\beta_1+y_2\beta_2+\cdots+y_x\beta_s = 0 \]

的解依然和\(x_1,x_2,\cdots,x_s\)相同,所以均为0。所以\(y_1,y_2,\cdots,y_s\)只有零解。所以证得初等变换不改变矩阵相应列的线性相关性。

设变换后的矩阵B极大无关向量组在\(j_1,j_2,\cdots,j_s\)列,那么在矩阵A的\(j_1,j_2,\cdots,j_s\)也是线性无关的,所以矩阵A的列轶与矩阵B的列轶相等。证得矩阵的初等变换不改变列轶。

这是一个巧妙的证明过程,在证明列轶不变和行轶不变时,使用了不同的方法。并从证明过程中,我们得知,如果变换后的矩阵B的极大无关向量组在\(j_1,j_2,\cdots,j_s\),那么变换前的矩阵A的极大无关向量组也相应的在\(j_1,j_2,\cdots,j_s\)。注意,这个结论只对初等行变换有效,对初等列变换是无效的。

3.4.4 任意矩阵的轶的性质

任一矩阵A的行轶等于列轶,并且等于初等行变换后阶梯形矩阵J的非零行个数,且矩阵J的主元所在列正是矩阵A的极大无关向量组的所在列。

证明:

首先,因为任一矩阵A可以转换为阶梯形矩阵J,根据初等变换与轶的性质,所以A的行轶等于J的行轶,A的列轶等于J的列轶,又阶梯矩阵的行轶等于它的列轶。所以A的行轶等于A的列轶。

然后,因为阶梯矩阵J的轶正是矩阵J的非零行个数,所以矩阵A的行轶和矩阵A的列轶,都等于矩阵J的非零行个数。

最后,因为初等行变换不改变相应列的线性相关性,又因为阶梯矩阵J的主元列正是阶梯矩阵J的极大无关向量组所在列,所以其对应的列也是矩阵A的极大无关向量组所在列。

所以,证得所有结论。

这个定理非常有用,它不仅指出了任意矩阵的性质,而且指出了计算任意矩阵的轶,以及其列向量组的极大无关向量组所在列的方法。

3.4.5 轶与行列式的联系

任一非零矩阵的轶等于它的不为零的子式的最高阶数。

证明:

设矩阵A的轶为r,它的初等行变换的阶梯矩阵为J,则阶梯矩阵J的非零行个数为r,调整阶梯矩阵的列,将阶梯矩阵J的主元按连续下降,则显然这连续的r个主元所在位置的列行列式不为0,则这r个列线性无关,其对应的矩阵A的所在列也线性无关,故其行列式也不为0。我们证明了,如果一个矩阵的轶为r,我们必然可以找到一个r子式的行列式不为0。

\(r<m<=min(s,n)\),s为矩阵的行数,n为矩阵的列数,则如果矩阵存在m列的子式的行列式不为0,所在m列向量组线性无关,则它们的延伸组向量也线性无关,所以矩阵的轶至少大于m,与题设矛盾,所以大于r的子式都等于零。

这个定理沟通了任意矩阵与行列式的联系。

3.4.6 矩阵轶的等价结论

所以,结合行列式,我们进一步得出更多的等价结论。

等价结论一

\[ 向量组相关 \\ \Leftrightarrow 向量组的轶小于向量组的行数和列数\\ \Leftrightarrow 向量组所代表矩阵的不为0子式的最高阶数小于向量组的行数和列数\\ \Leftrightarrow 其中一个向量可以由其他向量线性表出 \\ \Leftrightarrow 向量组所代表的齐次线性方程组有非零解 \]

等价结论二

\[ 向量组无关 \\ \Leftrightarrow 向量组的轶等于向量组的行数或列数\\ \Leftrightarrow 向量组所代表矩阵的不为0子式的最高阶数等于向量组的行数或列数\\ \Leftrightarrow 任何一个向量都不可以由其他向量线性表出 \\ \Leftrightarrow 向量组所代表的齐次线性方程组有非零解 \]

等价结论三

\[ 向量\beta可以由向量组\alpha_1,\alpha_2,\cdots,\alpha_s线性表出 \\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}的轶等于向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}的轶\\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}所代表矩阵的不为0子式的最高阶数等于向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}的所代表矩阵的不为0子式的最高阶数\\ \Leftrightarrow 如果向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}线性无关,则向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}线性相关 \\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}所代表的非齐次线性方程组有解(唯一解或无穷解) \]

等价结论四

\[ 向量\beta不可以由向量组\alpha_1,\alpha_2,\cdots,\alpha_s线性表出 \\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}的轶小于向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}的轶\\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}所代表矩阵的不为0子式的最高阶数少于向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}的所代表矩阵的不为0子式的最高阶数\\ \Leftrightarrow 如果向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s\}线性无关,则向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}线性无关 \\ \Leftrightarrow 向量组\{\alpha_1,\alpha_2,\cdots,\alpha_s,\beta\}所代表的非齐次线性方程组没有解 \]

3.5 子空间与维

3.5.1 子空间的定义

设V是在数域K上的向量空间,并设W是V的子集。则W是个子空间,当且仅当它满足下列三个条件:

  • 零向量0在W中。
  • 如果u和v是W的元素,则向量和u+v是W的元素。
  • 如果u是W的元素而c是来自K的标量,则标量积cu是W的元素

可以看出,子空间的定义是在向量组的基础上,加上加法和数乘封闭的条件。

3.5.2 基的定义

设U是\(K^n\)中一个子空间,U中的向量组\(\alpha_1,\alpha_2,\cdots,\alpha_r\)如果满足下述的两个条件:

  • \(\alpha_1,\alpha_2,\cdots,\alpha_r\)线性无关
  • U中每一个向量都可以由\(\alpha_1,\alpha_2,\cdots,\alpha_r\)线性表出

则称\(\alpha_1,\alpha_2,\cdots,\alpha_r\)是U的一个基

从定义中可以看出,基其实就是子空间的极大无关向量组,那根据极大无关向量组的性质,子空间中任意两个基的数量肯定相同。

3.5.3 维数的定义

设U是\(K^n\)的一个非零子空间,U的一个基所含向量的个数称为U的维数,记作\(dim_K U\),或者简记作\(dimU\)

从定义可以看出,既然同一个子空间的基的数量都相同,则定义这个基数量为维数。它本质就是子空间所代表的向量组的轶。

3.5.4 向量生成子空间

\(\alpha_1,\alpha_2,\cdots,\alpha_s\)\(K^n\)的任意一个向量组,令

\[ U = \{k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s|k_1,k2,\cdots,k_s\in K\} \]

则称U为由\(\alpha_1,\alpha2,\cdots,\alpha_s\)生成的子空间,记作\(\langle \alpha_1,\alpha_2,\cdots,\alpha_s\rangle\)

显然,这种生成子空间的方式是符合子空间的三个要求的。注意,这些向量都可以线性相关的。

3.5.5 向量生成子空间的维数与轶

向量组\(\alpha_1,\alpha_2,\cdots,\alpha_s\)的轶等于由它生成的子空间的维数

证明:

设向量组的极大无关组为\(\beta_1,\beta_2,\cdots,\beta_s\),因为它们可以线性表出向量组\(\alpha\),向量组\(\alpha\)又可以线性表出向量组生成子空间。所以极大无关组可以线性表出生成子空间,而且极大无关向量组是线性无关的。

所以生成子空间的维数等于极大无关组的数量,也就是生成子空间的维数等于向量组的轶。

这个其实都太直观了,没什么好证明的。

3.6 内积与正交

3.6.1 内积

\(R^n\)中,任给\(\alpha=(a_1,a_2,\cdots,a_n),\beta=(b_1,b_2,\cdots,b_n)\),规定

\[ (\alpha,\beta) \stackrel{def}{=} a_1b_1 + a_2b_2+\cdots+a_nb_n \]

这个二元实值函数\((\alpha,\beta)\)称为\(R^n\)的一个内积,这个也被称为\(R^n\)中的标准内积。

从定义中可以看出,内积是向量到数值的一个映射。而且,内积的定义其实有很多种方法,通过这种标准内积定义的\(R^n\)空间称为欧几里得空间。

3.6.2 内积性质

对一切\(\alpha,\beta,\gamma \in R^n,k \in R\),有

  • 对称性,\((\alpha,\beta)=(\beta,\alpha)\)
  • 线性性之一,\((\alpha+\gamma,\beta)=(\alpha,\beta)+(\gamma,\beta)\)
  • 线性性之二,\((k\alpha,\beta)=k(\alpha,\beta)\)
  • 正定性,\((\alpha,\alpha)>=0\),等号成立当且仅当\(\alpha=0\)

直接套定义就可以证明了

3.6.3 长度

因为定积有正定性,所以,我们定义向量\(\alpha\)的长度\(\lvert \alpha \rvert\)规定为

\[ \lvert \alpha \rvert \stackrel{def}{=} \sqrt{(\alpha,\alpha)} \]

另外,定义长度为1的向量称为单位向量,并且,显然下列的性质成立

\[ \lvert k \alpha \rvert = \lvert k \rvert \lvert \alpha \rvert \]

注意,长度的符号和行列式的符号相同,要注意上下文指向的是向量长度,还是矩阵行列式。

3.6.4 正交

在欧几里得的空间\(R^n\)中,如果\((\alpha,\beta)=0\),则称\(\alpha\)\(\beta\)是正交的,记作\(\alpha \perp \beta\)

3.6.5 正交向量组与线性无关的联系

在欧几里得空间\(R^n\)中,由非零向量组成的向量组如果其中每两个不同的向量都正交(即它们两两相交),则称它们是正交向量组。

在欧几里得空间中,正交向量组一定是线性无关的。

证明:

\((\alpha_1,\alpha_2,\cdots,\alpha_s)\)是正交向量组,那么考虑以下方程组

\[ k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s = 0 \]

中的k值是多少

如果方程组两边与\(\alpha_1\)做内积,得

\[ (k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s,\alpha_1)=(0,\alpha_1) \\ k_1(\alpha_1,\alpha_1)+k_2(\alpha_2,\alpha_1)+\cdots+k_s(\alpha_s,\alpha_1)=0\\ k_1(\alpha_1,\alpha_1)+0+\cdots+0=0\\ k_1(\alpha_1,\alpha_1) = 0 \]

\(\alpha_1\)是非零向量,故\((\alpha_1,\alpha_1)>0\),所以\(k_1=0\)。以此类推,\(k_2=\cdots=k_s=0\),所以\((\alpha_1,\alpha_2,\cdots,\alpha_s)\)向量组线性无关。

3.6.6 正交基

因为正交向量组都是线性无关的,而正交向量组有很多特别的性质,所以我们尽量将向量组的极大无关向量组有正交向量组来表达,因此有了正交基的定义。

在欧几里得空间\(R^n\)中,n个向量组成的正交向量组一定是\(R^n\)的一个基,称它为正交基。n个单位向量组成的正交向量组称为\(R^n\)的一个标准正交基。

注意正交基与标准正交基的不同定义。

3.6.6 施密特正交化

\(\alpha_1,\alpha_2,\cdots,\alpha_s\)是欧几里得空间\(R^n\)的一个线性无关的向量组,令

\[ \beta_1 = \alpha_1\\ \beta_2 = \alpha_2 - \frac {(\alpha_2,\beta_1)} {(\beta_1,\beta_1)}\beta_1 \\ \cdots \\ \beta_s = \alpha_s - \sum\limits_{j=1}^{s-1} \frac {(\alpha_s,\beta_j)} {(\beta_j,\beta_j)} \beta_j \\ \]

\(\beta_1,\beta_2,\cdots,\beta_s\)是正交向量组,并且\(\beta_1,\beta_2,\cdots,\beta_s\)\(\alpha_1,\alpha_2,\cdots,\alpha_s\)等价

证明:

我们用数学归纳法证明\(\beta_1,\beta_2,\cdots,\beta_s\)是正交向量组

当s=1时,显然\(\beta_1=\alpha_1\)是正交向量组成立

假设s=k时成立,\(\beta_1,\beta_2,\cdots,\beta_k\)是正交向两组,且它与\(\alpha_1,\cdots,\alpha_k\)等价,那么当s=k+1时,假设当1<=i<=k时

\[ (\beta_{k+1},\beta_i)\\ = (\alpha_{k+1} - \sum\limits_{j=1}^{k} \frac {(\alpha_{k+1},\beta_j)} {(\beta_j,\beta_j)} \beta_j,\beta_i)\\ =(\alpha_{k+1},\beta_i)-\sum\limits_{j=1}^{k} \frac {(\alpha_{k+1},\beta_j)} {(\beta_j,\beta_j)} (\beta_j,\beta_i) \\ =(\alpha_{k+1},\beta_i)-\frac {(\alpha_{k+1},\beta_i)}{(\beta_i,\beta_i)}(\beta_i,\beta_i) \\ = 0 \]

所以证得\(\beta_{k+1}\)与其他的\(\beta\)向量都正交。又\(\beta_{k+1}\)\(\alpha_{k+1}\)线性表出的,所以\(\beta_1,\beta_2,\cdots,\beta_{k+1}\)\(\alpha_1,\cdots,\alpha_{k+1}\)等价

所以证得结论。

4 矩阵运算

4.1 特殊矩阵

4.1.1 单位矩阵

主对角线上的元素都为1,其余元素全为0的n阶矩阵称为n阶单位矩阵,记为\(I_n\)

4.1.2 数量矩阵

主对角线上的元素都为同一个数k,其余元素全为0的n阶矩阵称为数量矩阵。

4.1.3 对角矩阵

主对角线意外的元素全为零的方阵称为对角矩阵,简记作\(diag\{d_1,d_2,\cdots,d_n\}\),注意,对角矩阵必须为方阵。

4.1.4 上(下)三角矩阵

主对角线下(上)方元素全为零的方阵称为上(下)三角矩阵,注意,三角矩阵必须为方阵。

4.1.5 基本矩阵

只有一个元素是1,其他元素全为零的矩阵称为基本矩阵,(i,j)元为1的基本矩阵记作\(E_{ij}\)

4.1.6 初等矩阵

由单位矩阵经过一次初等行列变换得到的矩阵称为初等矩阵。例如矩阵的初等行变换为:

\[ \begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1\\ \end{bmatrix}\rightarrow\begin{bmatrix} 1 & 0 & 0\\ k & 1 & 0\\ 0 & 0 & 1\\ \end{bmatrix} \]

把一行的倍数加到另外一行上,记作P(2,1(k)),称为I型初等矩阵。

\[ \begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1\\ \end{bmatrix}\rightarrow\begin{bmatrix} 1 & 0 & 0\\ 0 & 0 & 1\\ 0 & 1 & 0\\ \end{bmatrix} \]

互换两个行的位置,记作P(2,3),称为II型初等矩阵。

\[ \begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1\\ \end{bmatrix}\rightarrow\begin{bmatrix} 1 & 0 & 0\\ 0 & c & 0\\ 0 & 0 & 1\\ \end{bmatrix} \]

用一个非零乘某一行,记作P(2(c)),称为III型初等矩阵。

同理的还有初等列变换的初等矩阵。

4.1.7 对称矩阵

一个矩阵A如果满足

\[ A'=A \]

则称A是对称矩阵,简单来说,就是以对角线为对称轴的对称矩阵。

4.1.8 满轶矩阵

设A是n阶矩阵, 若rank(A) = n, 则称A为满秩矩阵

4.1.9 正交矩阵

n阶矩阵的行向量组是单位正交向量组的矩阵是正交矩阵

4.2 矩阵基础运算

4.2.1 和

\(A=(a_{ij}),B=(b_{ij})\)都是数域K上的\(s \times n\)矩阵,令

\[ C = (a_{ij}+b_{ij})_{s \times n} \]

则矩阵C是矩阵A与B的和,记作

\[ C = A + B \]

矩阵的和就是两个矩阵的对应位置相加,相当直接简单。

我们定义相应的负矩阵为

\[ -A =(-a_{ij})_{s \times n} \]

4.2.2 数乘

\(A=(a_{ij})\)都是数域K上的\(s \times n\)矩阵,设\(k \in K\),令

\[ M = (ka_{ij})_{s \times n} \]

则称矩阵M是k与矩阵A的数量乘积,记作

\[ M = kA \]

矩阵的数乘就是相应位置乘以常数k

4.2.3 和与数乘的性质

对于数域K上任意\(s \times n\)矩阵A,B,C,以及任意\(k,l\in K\),有

  • \(A+B=B+A\)
  • \((A+B)+C=A+(B+C)\)
  • \(A+0=0+A=A\)
  • \(A+(-A)=(-A)+A=0\)
  • \(1A=A\)
  • \((kl)A=k(la)\)
  • \((k+l)A=kA+lA\)
  • \(k(A+B)=kA+kB\)

4.2.4 转置

将矩阵A的行与列互换得到的矩阵B称为A的转置,记作\(A'\),或\(A^T,A^t\),即

\[ A'(i;j) = A(j;i) \]

4.2.5 转置的性质

对于数域K上任意\(s \times n\)矩阵A,有

  • \((A+B)'=A'+B'\)
  • \(\lvert A' \rvert = \lvert A \rvert\)
  • \(rank(A')=rank(A)\)

4.2.6 迹

n级矩阵A的主对角线上元素的和称为A的迹,记作tr(A)

迹是像行列式一样,是矩阵的一种性质

4.2.7 迹的性质

  • tr(A+B)=tr(A)+tr(B)
  • tr(kA) = ktr(A)
  • tr(AB) = tr(BA)

注意,第三个性质尤其神奇

4.3 矩阵乘法运算

4.3.1 乘法

\(A=(a_{ij})_{s\times n},B=(a_{ij})_{n \times m}\),令

\[ C = (c_{ij})_{s \times m} \]

其中

\[ c_{ij} = a_{i1}b_{1j} +a_{i2}b_{2j}+\cdots+a_{in}b_{nj}=\sum\limits_{k=1}^{n} a_{ik}b_{kj} \]

则称矩阵C称为矩阵A与矩阵B的乘积,记作\(C=AB\)

从定义可以看出,矩阵乘积必须左矩阵的列数与右矩阵的行数相同才能实施,生成的矩阵的行数等于左矩阵的行数,列数等于右矩阵的列数。

4.3.2 乘法的运算

对于数域K上任意\(s \times n\)矩阵A,B,C,D

  • 结合律,\((AB)C=A(BC)\)
  • 分配律,\(A(B+C)=AB+AC,(B+C)D=BD+CD\)
  • 单元,\(IA=AI=A\)
  • 数乘,\(k(AB)=(kA)B=A(kB)\)
  • 转置,\((AB)'=B'A'\)

注意,矩阵没有交换律,也就是\(AB \neq BA\),只有部分可交换矩阵才可以执行这个操作

4.3.3 方幂

设A是一个n级矩阵,因为矩阵的乘法适合结合律,所以\(A\cdot A \cdot A \cdots \cdot A\)表示唯一的一个矩阵,把它记作\(A^m\),即

\[ A^m \stackrel{def}{=} A\cdot A \cdot A \cdots \cdot A \]

显然,方幂有以下的性质

\[ A^kA^l=A^{k+l}\\ (A^k)^l=A^{kl} \]

4.3.4 乘法的几何意义

因为矩阵既可以看成一个线性变换,又可以看成一个向量组,所以两个矩阵的乘法既可以看成是两个线性变换的叠加,也可以是两个向量组标准内积的叠加。

例如:

C被看成是两个线性变换的叠加。

但如果我们将A看成是行变量组\(\alpha_1=(1,2,3),\alpha_2=(4,5,6)\),B看成是列向量组\(\beta_1=(1,2,3),\beta_2=(4,5,6)\),则C为

\[ C=AB=\begin{bmatrix} \alpha_1 \\ \alpha_2 \\ \end{bmatrix}\begin{bmatrix} \beta_1 & \beta_2 \\ \end{bmatrix} = \begin{bmatrix} \alpha_1\beta_1 & \alpha_1\beta_2 \\ \alpha_2\beta_1 & \alpha_2\beta_2 \\ \end{bmatrix} \]

代入原式,你会发现依然是相等的。所以,矩阵C被看成是向量组的内积叠加。

另外,我们也可以将A看成是列向量组\(\alpha_1=(1,4),\alpha_2=(2,5),\alpha_3=(3,6)\),将B看成是线性变换,那么AB就是向量组的线性变换。

\[ C=AB=\begin{bmatrix} \alpha_1& \alpha_2&\alpha_3\\ \end{bmatrix}\begin{bmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \\ \end{bmatrix} = \begin{bmatrix} 1\alpha_1+2\alpha_2+3\alpha_3 & 4\alpha_1+5\alpha_2+6\alpha_3 \\ \end{bmatrix} \]

同理,可以将A看成是线性变换,B看成是行向量组,C依然也是向量组在某个线性变换后的结果

4.4 矩阵乘法的性质

4.4.1 乘法与对角矩阵

用一个对角矩阵左(右)乘一个矩阵A,就相当于用对角矩阵的主对角元分别去乘A的相应行和列。注意,这里将乘法看成是向量组的线性映射。

特别地,两个n级对角矩阵的乘积还是n级对角矩阵。

4.4.2 乘法与三角矩阵

两个n级上三角矩阵A与B的乘积仍是上三角矩阵,并且AB主对角元等于A与B的相应主对角元的乘积。

4.4.3 乘法与基本矩阵

\(E_{ij}\)左(右)乘一个矩阵A,就相当于把A的第j行搬到第i行的位置(把A的第i列搬到第j列的位置),而乘积矩阵的其余行(列)全为0.

4.4.4 乘法与初等矩阵

用初等行矩阵左乘一个矩阵A,就相当于进行一次相应的初等行变换。当用初等行矩阵右乘一个矩阵A,就相当于进行一次相应的初等列变换。

这个定理非常重要,它将以前矩阵的初等行列变换变为乘法的操作,使得行列变换在计算机的执行,或矩阵分析中,变成一种数值计算,大大方便了初等行列变换的整个计算和分析。

4.4.5 乘法与轶

\(A=(a_{ij})_{s\times n},B={(b_{ij})}_{n\times m}\),则

\[ rank(AB) <= min\{rank(A),rank(B)\} \]

证明:

矩阵乘法AB=AB可以看成是A的列向量组在B线性变换后的列向量组,所以AB的所有列向量组都可以被A的列向量组线性表出,因此

\[ rank(AB) <= rank(A) \]

同理

\[ rank(AB) <= rank(B) \]

综上所述,则

\[ rank(AB) <= min\{rank(A),rank(B)\} \]

所以得证

4.4.6 转置乘法与轶

设A是实数域上\(s \times n\)矩阵,则

\[ rank(A'A)=rank(AA')=rank(A) \]

证明:

如果我们证明了\((A'A)X=0\)\(AX=0\)同解,就可以证明这个结论了。

假设\(\eta\)\(AX=0\)的解,即\(A\eta=0\),那么

\[ (A'A)\eta\\ = A'(A\eta)\\ = A'0\\ = 0 \]

所以\(\eta\)也是\((A'A)X=0\)的解

假设\(\delta\)\((A'A)X=0\)的解,即\((A'A)\delta=0\),那么

\[ (A'A)\delta=0\\ \delta'(A'A)\delta=0\\ (A\delta)'A\delta=0 \]

\(A\delta=(c_1,c_2,\cdots,c_n)\),则

\[ (c_1,c_2,\cdots,c_n)'(c_1,c_2,\cdots,c_n)=0\\ c_1^2+c_2^2+\cdots+c_n^2=0\\ c_1=c_2=\cdots=c_n=0\\ (c_1,c_2,\cdots,c_n)=0\\ A\delta=0\\ \]

所以\(\delta\)也是\(AX=0\)的解

综上所述,\(AX=0\)\((A'A)X=0\)是拥有相同的解空间,所以根据维数公式,它们的轶都相同,得证。

这个证明相当巧妙,引入了齐次方程组的维数公式来证明。

4.4.7 乘法与行列式

设A,B都是n级矩阵,则

\[ \lvert AB \rvert = \lvert A \rvert \lvert B \rvert \]

证明可以用矩阵分块运算来推导,就不详说了,整体思路是

\[ \lvert A \rvert \lvert B \rvert = \begin{vmatrix} A & 0 \\ -I & B \\ \end{vmatrix}=\begin{vmatrix} 0 & AB \\ -I & B \\ \end{vmatrix}=\lvert AB \rvert \]

注意,这个公式只对n阶矩阵有效,这也是非常重要的证明公式。

4.4.8 Binet.Cauchy公式

设A是\(s \times n\)矩阵,B是\(n \times s\)矩阵,如果\(s>n\),则\(\lvert AB \rvert =0\)。如果\(s<=n\),则$AB $等于A的所有s阶子式与B的相应s阶子式的乘积之和,则

\[ \lvert AB \rvert = \sum\limits_{1<=v_1<v_2<\cdots<v_s<=n} A\begin{pmatrix} 1,2,\cdots,s\\ v_1,v_2,\cdots,v_s\\ \end{pmatrix}B\begin{pmatrix} v_1,v_2,\cdots,v_s\\ 1,2,\cdots,s\\ \end{pmatrix} \]

证明略

4.5 矩阵可逆运算

4.5.1 可逆

对于数域K上的矩阵A,如果存在数域K上的矩阵B,使得

\[ AB=BA=I \]

则称A是可逆矩阵(或非奇异矩阵),并且,矩阵B称为A的逆矩阵,记作\(A^{-1}\)

注意,从定义可以看出,可逆运算是针对n阶矩阵的,非方阵是不能求逆操作的。另外,矩阵的逆显然是唯一的。

4.5.2 可逆的运算

可逆的运算有

  • \(AA^{-1}=A^{-1}A=I\)
  • \((A^{-1})^{-1}=A\)
  • \((AB)^{-1}=B^{-1}A^{-1}\)
  • \((A')^{-1}=(A^{-1})'\)

4.5.3 伴随矩阵

把n级矩阵A的第1行元素的代数余子式写成第1列,A的第2行元素的代数余子式写在第2列,\(\cdots\),第n行元素的代数余子式写在第n列,组成一个矩阵

\[ \begin{bmatrix} A_{11} & A_{21} &\cdots&A_{n1}\\ A_{12} & A_{22} &\cdots&A_{n2}\\ \cdots & \cdots & & \cdots\\ A_{1n} & A_{2n} &\cdots&A_{nn}\\ \end{bmatrix} \]

称它为A的伴随矩阵,记作\(A^{*}\)

注意,从定义中可以看出,伴随矩阵是将原来矩阵的各元素的代数余子式写在原来的位置,再进行一次转置得到的。注意,需要一次转置操作。

4.6 矩阵可逆的性质

4.6.1 可逆与行列式

数域K上的n级矩阵A可逆的充分必要条件为\(\lvert A \rvert \neq 0\),且当A可逆时,

\[ A^{-1}=\frac {1} {\lvert A \rvert}A^* \]

证明:

因为\(AA^-1=I\) 所以\(\lvert A \rvert \lvert A^{-1} \rvert = \lvert I \rvert = 1\) 所以\(\lvert A \rvert \neq 0\)\(\lvert A^{-1} \rvert \neq 0\)

所以证得必要性

\[ AA^*=\begin{bmatrix} a_{11} & a_{12} &\cdots&a_{1n}\\ a_{21} & a_{22} &\cdots&a_{2n}\\ \cdots & \cdots & & \cdots\\ a_{n1} & a_{n2} &\cdots&a_{nn}\\ \end{bmatrix}\begin{bmatrix} A_{11} & A_{21} &\cdots&A_{n1}\\ A_{12} & A_{22} &\cdots&A_{n2}\\ \cdots & \cdots & & \cdots\\ A_{1n} & A_{2n} &\cdots&A_{nn}\\ \end{bmatrix}=\begin{bmatrix} \lvert A \rvert & 0&\cdots&0\\ 0 & \lvert A \rvert &\cdots&0 \\ \cdots & \cdots & & \cdots\\ 0 & 0 & \cdots&\lvert A \rvert\\ \end{bmatrix}=\lvert A \rvert I \]

因此

\[ A\frac {A^*} {\lvert A \rvert } = I \]

所以,当\(\lvert A \rvert \neq 0\)时,我们可以找到逆矩阵为$A^{-1}= {A }A^* $,因此充分性得证

这个定理解释了可逆的关键条件,并且给出了使用伴随矩阵法求逆的方法

4.6.2 可逆与初等矩阵

矩阵可逆的充分必要条件是它可以表示成一些初等矩阵的乘积。

证明:

如果矩阵可以表示成一些初等矩阵的乘积,例如是\(P_3P_2P_1\),那由于每个初等矩阵都是可逆的,所以,该矩阵也是可逆的,它的逆矩阵为\(P_1^{-1}P_2^{-1}P_3^{-1}\),所以必要性得证

如果矩阵可逆,由于可逆矩阵的行列式不为0,它必然可以通过多次的初等行变换化为对角矩阵。也就是存在\(P_3P_2P_1A=I\),所以\(A=(P_3P_2P_1)^{-1}I\),因此矩阵A是多个初等矩阵的乘积,所以充分性得证

这个定理解释了可逆矩阵与初等矩阵的关系,并且提出了给用初等矩阵法求逆提供了基础。

4.6.3 满轶矩阵与轶

如果矩阵A是满轶矩阵,那么对于任意的矩阵B,有

\[ rank(AB) = rank(B) \]

因为任意次初等行列变换不改变矩阵的轶,即

\[ rank(P_n\cdots P_2P_1B)=rank(B) \]

而任意次初等矩阵的乘积是可逆矩阵,可逆矩阵的行列式不为0,所以可逆矩阵等价于满轶矩阵,即

\[ rank(AB)=rank(B) \]

这是一个矩阵乘法中关于轶的扩展性质

4.6.4 可逆的等价条件

特别地,对于n阶矩阵,它有很多特别的性质

\[ 矩阵可逆 \\ \Leftrightarrow 矩阵的行列式不为0\\ \Leftrightarrow 矩阵的行向量组和列向量组都线性无关\\ \Leftrightarrow 矩阵所表示的齐次线性方程组只有零解\\ \Leftrightarrow 矩阵是满轶矩阵\\ \Leftrightarrow 矩阵是可以表示成多个初等矩阵的乘积\\ \Leftrightarrow 矩阵是非奇异的\\ \]

4.6.5 可逆与正交矩阵

n阶正交矩阵的充分必要条件是\(A'=A^{-1}\),并且它的列向量组也是正交单位向量组

证明:

如果矩阵A是正交向量组,即

\[ \begin{bmatrix} \alpha_1\\ \alpha_2\\ \cdots\\ \alpha_n\\ \end{bmatrix} \]

是正交向量

我们让\(AA'\),看看结果是什么

\[ \begin{bmatrix} \alpha_1\\ \alpha_2\\ \cdots\\ \alpha_n\\ \end{bmatrix}\begin{bmatrix} \alpha_1 & \alpha_2& \cdots & \alpha_n\\ \end{bmatrix} = \begin{bmatrix} 1&0&\cdots&0\\ 0&1&\cdots&0\\ 0&0&\cdots&1\\ \end{bmatrix}=I \]

所以\(AA'=I\),所以A是可逆矩阵,并且\(A^{-1}=A'\),注意整个推导过程都是等价推导的,所以这是充分必要条件。

又因为

\[ AA'=I\\ A'AA'=A'I\\ A'AA'A=A'IA\\ A'AI=I\\ A'A=I \]

因此A’矩阵的行向量组是A矩阵的列向量组,并且\(A'A=I\),所以\(A'\)的行向量组是正交单位向量组,因此A的列向量组也是正交单位向量组,也就是A’也是正交矩阵

这个定理可以得到可逆的一个特别情况,如果矩阵是正交矩阵,它的转置就是它的逆矩阵。

4.6.6 正交矩阵的性质

  • I是正交矩阵
  • 若A与B是正交矩阵,则AB也是正交矩阵
  • 若A是正交矩阵,则A’也是正交矩阵
  • 若A是正交矩阵,则\(\lvert A\rvert = 1 或 -1\)

4.7 矩阵分块

4.7.1 分块

若矩阵A的若干行,若干列的交叉位置元素按原来顺序排成的矩阵称为A的一个子矩阵

把一个矩阵A的行分成若干组,列也分成若干组,从而A被分成若干个子矩阵,把A看成是由这些子矩阵组成的,这称为矩阵的分块,这种由子矩阵组成的矩阵称为分块矩阵。

4.7.2 加法

\[ A=\begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \\ \end{bmatrix},B=\begin{bmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \\ \end{bmatrix} \]

\[ A+B=\begin{bmatrix} A_{11}+B_{11} & A_{12}+B_{12} \\ A_{21}+B_{21} & A_{22}+B_{22} \\ \end{bmatrix} \]

这是显然的。

4.7.3 乘法

\[ A=\begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \\ \end{bmatrix},B=\begin{bmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \\ \end{bmatrix} \]

\[ AB=\begin{bmatrix} A_{11}B_{11}+A_{12}B_{21} & A_{11}B_{12}+A_{12}B_{22} \\ A_{21}B_{11}+A_{22}B_{21} & A_{21}B_{12}+A_{22}B_{22} \\ \end{bmatrix} \]

证明略,这是可以用数学归纳法证明的

4.7.4 转置

\[ A=\begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \\ \end{bmatrix} \]

\[ A'=\begin{bmatrix} A_{11}' & A_{21}'\\ A_{12}' & A_{22}' \\ \end{bmatrix} \]

这是显然的,注意对角位置的变化

4.7.5 初等矩阵变换

下述的三种变换称为分块矩阵的初等行变换

  • 把一个块行的左P倍加到另一个块行
  • 两个块行互换位置
  • 用一个可逆矩阵左乘某一块行

注意第三点

相关文章