线代你也太难了wwwwwwww

基本信息

授课教师: dz
上课教材: 《线性代数》(hzd版)
教辅资料: MIT-线性代数

 

部分回忆题

  1. $if\ \forall k\in\Bbb{Z}^{+},\begin{vmatrix}kE+A&B\\ C&D\end{vmatrix}=0.proof:|D|=0 $

  2. if ARn×n,A>0,α,βRn.proof:(αTβ)2αTAαβTA1βif\ A\in\Bbb{R}^{n\times n},A>0,\alpha,\beta\in\Bbb{R}^n.proof:(\alpha^T\beta)^2\le\alpha^TA\alpha\cdot\beta^TA^{-1}\beta

  3. if ARn×n,A=AT,i=1,2,...,n,j=1naij=0.proof:aR,s.t. A=aJ=a(11...111...1 11...1)nif\ A\in\Bbb{R}^{n\times n},A=A^T,\forall i=1,2,...,n,\displaystyle\sum_{j=1}^na_{ij}=0.proof:\exist a\in\Bbb{R},s.t.\ A^*=aJ=a\begin{pmatrix}1&1&...&1\\\\1&1&...&1\\\\\vdots&\vdots&\ &\vdots\\\\1&1&...&1\end{pmatrix}_n

 

MISC

λEnAn×mBm×n=λnmλEmBm×nAn×m|\lambda E_n-A_{n\times m}B_{m\times n}|=\lambda^{n-m}|\lambda E_m-B_{m\times n}A_{n\times m}|

x=(x,x)=xTx||x||=\sqrt{(x,x)}=x^Tx

ATA0,if tr(ATA)=0,then λ(A)=0A^TA\ge 0,if\ tr(A^TA)=0,then\ \lambda(A)=0

XPn×n,X=P(Er O)(ErO)TQ\forall X\in\Bbb{P}^{n\times n}, X=P(E_r\ O)(E_r O)^TQ

if A=AT,then λ(A)=0 or ki,(kR)if\ -A=A^T,then\ \lambda(A)=0\ or\ ki,(k\in\Bbb{R})

[知乎八大类型行列式及其解法](https://zhuanlan.zhihu.com/p/34685081)[知乎 | 八大类型行列式及其解法](https://zhuanlan.zhihu.com/p/34685081)

 

第 1 章 线性方程组的求解

定理

  • AA化成行最简后有相同的非零行(即相同的秩r线性方程组有解\overline{A}与A化成行最简后有相同的非零行(即相同的秩r)\hArr 线性方程组有解
  • AA化成行最简后有不同的非零行(即相同的秩r线性方程组无解\overline{A}与A化成行最简后有不同的非零行(即相同的秩r)\hArr 线性方程组无解

推论
对于齐次线性方程组,c1=c2=...=cnc_1 = c_2 = ... =c_n

  • 一定有解 x1=x2=...=xn=0x_1 = x_2 =...= x_n = 0
  • r<n有无穷解有非零解r<n \hArr 有无穷解 \hArr 有非零解
  • r=n解是唯一的无非零解r=n \hArr 解是唯一的 \hArr 无非零解

 

第 2 章 行列式与矩阵的秩

n-排列

一次对换改变n-排列的奇偶性

τ(i1i2...in)+τ(inin1...i1)=n(n1)2\tau(i_1i_2...i_n) + \tau(i_ni_{n-1}...i_1) = \frac{n(n-1)}{2}

$ \footnotesize{P.S.可以用于说明冒泡等排序的时间复杂度} $

方阵的行列式

detA=j1j2...jn(1)τ(j1j2...jn)a1j1a2j2...anjn,其中A=(aij)n×n\det{A} = \displaystyle\sum_{j_1j_2...j_n}(-1)^{\tau(j_1j_2...j_n)}a_{1j_1}a_{2j_2}...a_{nj_n}, 其中A=(a_{ij})_{n\times n}
$ \footnotesize{P.S.i,j互换位置依然成立} $
解释:对列的每个n-排列都求积,最后求和

行列式的来源 | Cramer法则:求解线性方程组的解时,满足xi=DiDx_i = \frac{D_i}{D}

n阶行列式的性质

  • 展开后有n项
  • 每项都有n个元素,且没有两个元素的行或列是重复的
  • 奇排列的项为负,偶排列的项为正

特殊n阶行列式计算

  • D主对角线三角=a1a2...anD_{主对角线三角} = a_1a_2...a_n
  • D副对角线三角=(1)n(n1)2a1a2...anD_{副对角线三角} = (-1)^{\frac{n(n-1)}{2}} a_1a_2...a_n

k=1naikAjk={A,if i=j0,if ij  1i,jn(n>1)\displaystyle\sum_{k=1}^na_{ik}A_{jk} = \begin{cases}|A|,&\text{if }i = j \\\\ 0,&\text{if }i\ne j \end{cases}\space\space 1 \le i, j \le n(n \gt 1)

即,某一行元素向量乘以本行代数余子式向量等于行列式;乘以其他行代数余子式向量等于零

Vandermonde行列式

Dn=11...1x1x2...xnx12x22...xn2 x1n1x2n1...xnn1=1ijn(xjxi)D_n = \begin{vmatrix}1&1&...&1\\\\x_1&x_2&...&x_n\\\\x_1^2&x_2^2&...&x_n^2\\\\ \vdots&\vdots&\space&\vdots\\\\x_1^{n-1}&x_2^{n-1}&...&x_n^{n-1}\end{vmatrix} =\displaystyle\prod_{1\le i\le j \le n}(x_j - x_i)

Proof.逐行相减,展开得递推式\footnotesize{Proof.逐行相减,展开得递推式}

Cramer法则

定理 当且仅当线性方程组系数行列式不为0时,有且仅有唯一解

xj=DjD,  j=1,2,...,n且x_j = \frac{D_j}{D},\space\space j=1,2,...,n

其中DjD_j表示D中第j个列向量被系数向量取代后的行列式

Laplace定理

A=1j1<j2<...<jknD(j1 j2...jki1 i2...ik)A(j1 j2...jki1 i2...ik)|A| = \displaystyle\sum_{1\le j_1\lt j_2\lt ... \lt j_k\le n}D\begin{pmatrix}j_1\space j_2...j_k\\\\i_1\space i_2...i_k\end{pmatrix}A\begin{pmatrix}j_1\space j_2...j_k\\\\ i_1\space i_2...i_k\end{pmatrix}

即,行列式等于将行列式按某几行/列展开后行列式与代数余子式的积的和
eg.Os×tAs×sBt×tCt×s=(1)stABeg.\begin{vmatrix}O_{s\times t}&A_{s\times s}\\\\ B_{t\times t}&C_{t\times s}\end{vmatrix} = (-1)^{st}|A||B|

初等变换(行/列交换,倍乘以及倍加)不改变矩阵的秩

等价关系

  • 自反性 ARAA\stackrel{R}{\backsim}A
  • 对称性 ARBBRAA\stackrel{R}{\backsim}B \hArr B\stackrel{R}{\backsim}A
  • 传递性 ARB,BRCARCA\stackrel{R}{\backsim}B, B\stackrel{R}{\backsim}C \hArr A\stackrel{R}{\backsim}C

秩相同的矩阵之间的关系为相抵等价关系
r(A)=r时,(ErOOO)A的等价标准形当r(A)=r时,\begin{pmatrix}E_r&O\\\\O&O\end{pmatrix}为A的等价标准形

 

第 3 章 矩阵的运算

An阶方阵,则cA=cnA若A是n阶方阵,则|cA| = c^n|A|

As×tBt×u=Cs×uA_{s\times t}B_{t\times u} = C_{s\times u}
即,目标矩阵的行数等于左矩阵的行数,列数等于右矩阵的列数

重要定理

  • AB=AB|A||B| = |AB|

  • (AB)T=BTAT(AB)^T = B^TA^T

矩阵的逆

An阶方阵,则 A可逆A0r(A)=n设A是n阶方阵,则\space A可逆\hArr|A|\ne 0 \hArr r(A) = n

A1=1AAA^{-1} = \frac{1}{|A|} A^*

A=(A11A21...An1A12A22...An2 A1nA2n...Ann)A^*=\begin{pmatrix}A_{11}&A_{21}&...&A_{n1}\\\\ A_{12}&A_{22}&...&A_{n2}\\\\ \vdots & \vdots & \space &\vdots \\\\ A_{1n}&A_{2n}&...&A_{nn} \end{pmatrix}

A1aij求代数余子式即A^{-1}对a_{ij}求代数余子式

矩阵初等变换与矩阵乘法的联系

定理 对矩阵进行初等变换等价于矩阵乘以该初等变换对应的初等矩阵

矩阵求逆

(A  E)仅有限次初等行变换(E  A1)\begin{pmatrix}A\space\vdots\space E\end{pmatrix}\xrightarrow{仅有限次初等行变换}\begin{pmatrix}E\space\vdots\space A^{-1}\end{pmatrix}

(A...E)仅有限次初等列变换(E...A1)\begin{pmatrix}&A&\\\\&...&\\\\&E&\end{pmatrix}\xrightarrow{仅有限次初等列变换}\begin{pmatrix}&E&\\\\&...&\\\\&A^{-1}&\end{pmatrix}

矩阵运算对秩的影响

  • 乘以可逆矩阵,秩不变
  • r(AB)min{r(A),r(B)}r(AB)\le \min\{r(A),r(B)\}
  • r(C)=r(A)+r(B), C=(OABO)r(C) = r(A) + r(B),\space C = \begin{pmatrix}O&A\\\\B&O\end{pmatrix}
  • r(A+B)r(A)+r(B)r(A+B)\le r(A)+r(B)
  • Sylvester不等式 r(AB)r(A)+r(B)nSylvester不等式\space r(AB)\ge r(A)+r(B)-n
  • Frobenius不等式 r(ABC)r(AB)+r(BC)r(B)Frobenius不等式\space r(ABC)\ge r(AB)+r(BC)-r(B)

二级结论

  • A=An1|A^*| = |A|^{n-1}
  • (A)=An2A(A^*)^* = |A|^{n-2}A
  • A2=Enr(A+En)=r(AEn)=nA^2=E_n \hArr r(A+E_n)=r(A-E_n)=n

 

第 7 章 线性空间

线性空间

P为数域,V为线性空间,则V上定义了V×VV的加法和P×VV的乘法,对α,βV若P为数域,V为线性空间,则V上定义了V\times V\rightarrow V的加法和P \times V\rightarrow V的乘法,对\forall\alpha,\beta\in V

  • α+β=β+α\alpha +\beta = \beta + \alpha
  • (α+β)+γ=α+(β+γ)(\alpha+\beta)+\gamma=\alpha+(\beta+\gamma)
  • θV,α+θ=α\exist\theta\in V,\alpha+\theta=\alpha
  • ϵV,α+ϵ=θ\exist\epsilon\in V,\alpha+\epsilon=\theta
  • 1α=α1\alpha=\alpha
  • (c1c2)α=c1(c2α)(c_1c_2)\alpha=c_1(c_2\alpha)
  • (c1+c2)α=c1α+c2α(c_1+c_2)\alpha=c_1\alpha+c_2\alpha
  • c(α+β)=cα+cβc(\alpha+\beta)=c\alpha+c\beta

向量组的线性关系

c1α1+c2α2+...+csαs为向量组{α1,α2,...,αs}的一个线性组合称c_1\alpha _1+c_2\alpha _2+...+c_s\alpha _s为向量组\{\alpha _1,\alpha _2,...,\alpha _s\}的一个线性组合

  • 设向量组{β,α1,α2,...,αs},若有β=c1α1+c2α2+...+csαs=(α1,α2,...,αs)(c1c2cs),则称β可由{α1,α2,...,αs}线性表出(与ci是不是0无关)设向量组\{\beta,\alpha _1,\alpha _2,...,\alpha _s\},若有\beta = c_1\alpha _1+c_2\alpha _2+...+c_s\alpha _s=\begin{pmatrix}\alpha _1,\alpha _2,...,\alpha _s\end{pmatrix}\begin{pmatrix}c_1\\\\ c_2\\\\\vdots\\\\ c_s\end{pmatrix},则称\beta可由\{\alpha _1,\alpha _2,...,\alpha _s\}线性表出(与c_i是不是0无关)
  • 即非平凡的线性组合成为线性表出

若存在不全为零的c,使得(α1,α2,...,αs)(c1c2cs)=θ,则称{α1,α2,...,αs}线性相关,令A=(α1 α2 ... αs)若存在不全为零的c,使得\begin{pmatrix}\alpha _1,\alpha _2,...,\alpha _s\end{pmatrix}\begin{pmatrix}c_1\\\\ c_2\\\\\vdots\\\\ c_s\end{pmatrix}=\theta,则称\{\alpha _1,\alpha _2,...,\alpha _s\}线性相关,令A=(\alpha_1\ \alpha_2\ ...\ \alpha_s)

  • {α1,α2,...,αs}线性相关αi可由其余s1个向量表示r(A)<n\{\alpha _1,\alpha _2,...,\alpha _s\}线性相关\hArr\exist\alpha _i可由其余s-1个向量表示\hArr r(A)<n
  • {α1,α2,...,αs}线性无关αi不可由其余s1个向量表示r(A)=n\{\alpha _1,\alpha _2,...,\alpha _s\}线性无关\hArr\forall\alpha _i不可由其余s-1个向量表示\hArr r(A)= n
  • {α1,α2,...,αs}线性无关,但是{β,α1,α2,...,αs}线性相关,则β可由{α1,α2,...,αs}线性表出,且表出形式唯一若\{\alpha _1,\alpha _2,...,\alpha _s\}线性无关,但是\{\beta,\alpha _1,\alpha _2,...,\alpha _s\}线性相关,则\beta可由\{\alpha _1,\alpha _2,...,\alpha _s\}线性表出,且表出形式唯一

向量组的线性表示及等价

  • 两个向量组(I)(II),若(I)中的任何一个向量均可由(II)中有限个向量线性表出,则称(I)可由(II)线性表出两个向量组(I)(II),若(I)中的任何一个向量均可由(II)中有限个向量线性表出,则称(I)可由(II)线性表出
  • (α1,α2,...,αs)=(β1,β2,...,βt)Mt×s(\alpha_1,\alpha_2,...,\alpha_s)=(\beta_1,\beta_2,...,\beta_t)M_{t\times s}
  • (I)={α1,α2,...,αs}(II)={β1,β2,...,βt}(I)可由(II)线性表出且s>t,则{α1,α2,...,αs}线性相关若(I)=\{\alpha _1,\alpha _2,...,\alpha _s\},(II)=\{\beta _1,\beta _2,...,\beta _t\},(I)可由(II)线性表出且s>t,则\{\alpha _1,\alpha _2,...,\alpha _s\}线性相关
  • {α1,α2,...,αs}可由{β1,β2,...,βt}线性表出且{α1,α2,...,αs}线性无关,则st若\{\alpha _1,\alpha _2,...,\alpha _s\}可由\{\beta _1,\beta _2,...,\beta _t\}线性表出且\{\alpha _1,\alpha _2,...,\alpha _s\}线性无关,则s\le t
  • 向量组的线性相关称为等价向量组的线性相关称为等价

极大线性无关组与向量组的秩

  • 阶梯头所在的列(即主列)所对应的原向量为一个极大线性无关组
  • 向量组的秩等于其极大线性无关组向量个数

维数 基 坐标

  • dimV=n,其中nV的极大线性无关组的向量个数,也就是V的秩,极大线性无关组为一组基\dim V = n,其中n为V的极大线性无关组的向量个数,也就是V的秩,极大线性无关组为一组基
  • η1,η2,..,ηnVPn的一组基,则(η1 η2 ... ηn)可逆HPn×nr(H)=n,则H的列向量是Pn的一组基设\eta_1,\eta_2,..,\eta_n为V\in P^n的一组基,则(\eta_1\ \eta_2\ ...\ \eta_n)可逆\hArr\forall\Eta\in P_{n\times n},r(\Eta)=n,则\Eta的列向量是P^n的一组基
  • αV,XPn,使得α=(α1,α2,...,αn)X,其中X成为α在基{α1,α2,...,αn}下的坐标\forall\alpha\in V, \exist X\in P^n, 使得\alpha=(\alpha _1,\alpha _2,...,\alpha _n)X,其中X成为\alpha在基\{\alpha _1,\alpha _2,...,\alpha _n\}下的坐标
  • A的维数即是主列的个数r(A)A的基的数量A的维数即是主列的个数\hArr r(A)\hArr A的基的数量
  • 主行数与主列数相等,都等于秩

基之间的过渡矩阵 坐标变换

  • 对于两组基,由于等价,有(β1,β2,...,βn)=(α1,α2,...,αn)M,其中M称为过渡矩阵,且M可逆,M1βα的过渡矩阵对于两组基,由于等价,有(\beta _1,\beta _2,...,\beta _n)=(\alpha _1,\alpha _2,...,\alpha _n)M,其中M称为过渡矩阵,且M可逆,M^{-1}为\beta到\alpha的过渡矩阵
  • αV在上述两组基下的坐标分别是Xn×1Yn×1,则Y=M1X设\alpha\in V在上述两组基下的坐标分别是X_{n\times 1},Y_{n\times 1},则Y=M^{-1}X

子空间

  • θVV的平凡子空间\theta与V是V的平凡子空间
  • WV的子空间,则WV的加法和数乘封闭若W是V的子空间,则W对V的加法和数乘封闭
  • {α1,α2,...,αs}V的一组子向量,定义其扩张的子空间L(α1,α2,...,αs)={c1α1+c2α2+...+csαsciP,i=1,2,...,s},则LV的子空间,dimL=r(α1,α2,...,αs)若\{\alpha_1,\alpha_2,...,\alpha_s\}是V的一组子向量,定义其扩张的子空间L(\alpha_1,\alpha_2,...,\alpha_s)=\{c_1\alpha_1+c_2\alpha_2+...+c_s\alpha_s|c_i\in P,i=1,2,...,s\},则L是V的子空间,\dim L=r(\alpha_1,\alpha_2,...,\alpha_s)
  • 基即是能扩张出V的向量个数最少的向量组

向量组线性相关与向量坐标的关系

(α1,α2,...,αs)n维空间V的一组基,V中的向量β1,β2,...,βs,β在所给基下的坐标分别为A1,A2,...,As,YPn,令A=(A1 A2 ... As),则设(\alpha_1,\alpha_2,...,\alpha_s)是n维空间V的一组基,V中的向量\beta _1,\beta _2,...,\beta _s,\beta在所给基下的坐标分别为A_1,A_2,...,A_s,Y\in P^n,令A=(A_1\ A_2\ ...\ A_s),则

  • β可由β1,β2,...,βs线性表出线性方程组AX=Y有解\beta可由\beta _1,\beta _2,...,\beta _s线性表出\hArr 线性方程组AX=Y有解
  • $ \beta _1,\beta _2,…,\beta _s线性相关\hArr A_1,A_2,…,A_s线性相关$
  • $ \beta _1,\beta _2,…,\beta _s线性无关\hArr A_1,A_2,…,A_s线性无关$
  • $ r(\beta _1\beta _2…\beta _s)=r(A_1A_2…A_s)$
  • 坐标的线性关系可以映射到向量的线性关系

β1,β2,...,βs,βα1,α2,...,αtV的两个向量组,又已知A1,A2,...,As,YPt,且A=(A1 A2 ... As)。若α1,α2,...,αt线性无关且(β1 β2 ... βs β)=(α1 α2 ... αt)(A1 A2 ... As Y)设\beta _1,\beta _2,...,\beta _s,\beta与\alpha_1,\alpha_2,...,\alpha_t是V的两个向量组,又已知A_1,A_2,...,A_s,Y\in P^t,且A=(A_1\ A_2\ ...\ A_s)。若\alpha_1,\alpha_2,...,\alpha_t线性无关且(\beta _1\ \beta _2\ ...\ \beta _s\ \beta)=(\alpha_1\ \alpha_2\ ...\ \alpha_t)(A_1\ A_2\ ...\ A_s\ Y)

  • β可由β1,β2,...,βs线性表出线性方程组AX=Y有解\beta可由\beta _1,\beta _2,...,\beta _s线性表出\hArr 线性方程组AX=Y有解
  • $ \beta _1,\beta _2,…,\beta _s线性相关\hArr A_1,A_2,…,A_s线性相关$
  • $ \beta _1,\beta _2,…,\beta _s线性无关\hArr A_1,A_2,…,A_s线性无关$
  • $ r(\beta _1\beta _2…\beta _s)=r(A_1A_2…A_s)=r(A)$
  • 即上述关系可以映射到任意由线性表出对应的两个向量组

 

第 4 章 n元向量空间

第 4 章前半部分(4.1~4.7均为第 7 章对应部分的特殊情况,因此可联系复习)

线性方程组解的结构

假定线性方程组的一般形式为:AX=b,其中APm×n,bPm,XPn,r(A)=r,A的每一列均不等于θ假定线性方程组的一般形式为:AX=b,其中A\in P^{m\times n},b\in P^m,X\in P^n,r(A) = r,A的每一列均不等于\theta

b=O,即齐次线性方程组,有若b=O,即齐次线性方程组,有

  • 齐次线性方程组的解的线性组合(解空间W0)仍是解齐次线性方程组的解的线性组合(解空间W_0)仍是解
  • dimW0=nr=nr(A)n\dim W_0=n-r=n-r(A)\le n
  • W0的任意一个极大线性无关组,称为基础解系,W0即可认为是基础解系扩张而成的线性空间W_0的任意一个极大线性无关组,称为基础解系,W_0即可认为是基础解系扩张而成的线性空间
  • X=t1η1+t2η2+...+tnrηnr,其中η为求解后得到的每一个列向量,即基础解系X=t_1\eta_1+t_2\eta_2+...+t_{n-r}\eta_{n-r},其中\eta为求解后得到的每一个列向量,即基础解系
  • 秩越大,解空间维数越小,理解为有序的系数矩阵不需要过多的未知数

bO,即非齐次线性方程组,有若b\ne O,即非齐次线性方程组,有

  • AX=OAX=b的导出组,W0为导出组的解空间,η1,η2,...,ηnr为一组基础解系,η0AX=b的任一特解,则X=η0+t1η1+t2η2+...+tnrηnr称AX=O为AX=b的导出组,W_0为导出组的解空间,\eta_1,\eta_2,...,\eta_{n-r}为一组基础解系,\eta_0为AX=b的任一特解,则X=\eta_0+t_1\eta_1+t_2\eta_2+...+t_{n-r}\eta_{n-r}
  • 求解非齐次线性方程组时,先求解同型的齐次线性方程组,再加上特解

 

第 8 章 欧氏空间

欧氏空间的定义

对于线性空间V,定义二元函数内积(α,β):V×VR,同时满足以下条件,称为欧氏空间对于线性空间V,定义二元函数内积(\alpha,\beta):V\times V\rightarrow R,同时满足以下条件,称为欧氏空间

  • (α,β)=(β,α)(\alpha,\beta)=(\beta,\alpha)
  • k(α,β)=(kα,β)k(\alpha,\beta)=(k\alpha,\beta)
  • (α+β,γ)=(α+γ)+(β,γ)(\alpha+\beta,\gamma)=(\alpha+\gamma)+(\beta,\gamma)
  • α:(α,α)0,等号成立当且仅当α=0\forall\alpha:(\alpha,\alpha)\ge0,等号成立当且仅当\alpha=0

内积=def(α,β)=αTβ=x1y1+x2y2+...+xnynP内积\stackrel{def}{=}(\alpha,\beta)=\alpha^T\beta=x_1y_1+x_2y_2+...+x_ny_n\in P

  • ε1,ε2,...,εn是欧氏空间Rn的一组基,XY分别是αβ的坐标,则度量矩阵=defM=(ε1Tε1ε1Tε2...ε1Tεnε2Tε1ε2Tε2...ε2Tεn εnTε1εnTε2...εnTεn),则(α,β)=αTβ=XTMY若\varepsilon_1,\varepsilon_2,...,\varepsilon_n是欧氏空间R^n的一组基,X,Y分别是\alpha和\beta的坐标,则度量矩阵\stackrel{def}{=}M=\begin{pmatrix}\varepsilon_1^T\varepsilon_1&\varepsilon_1^T\varepsilon_2&...&\varepsilon_1^T\varepsilon_n\\\\\varepsilon_2^T\varepsilon_1&\varepsilon_2^T\varepsilon_2&...&\varepsilon_2^T\varepsilon_n\\\\\vdots&\vdots&\ &\vdots\\\\\varepsilon_n^T\varepsilon_1&\varepsilon_n^T\varepsilon_2&...&\varepsilon_n^T\varepsilon_n&\end{pmatrix},则(\alpha,\beta)=\alpha^T\beta=X^TMY

长度=defα=(α,α)长度\stackrel{def}{=}|\alpha|=\sqrt{(\alpha,\alpha)}

  • CauthySchwaz不等式  (α,β)αβ,当且仅当αβ线性相关时等号成立Cauthy-Schwaz不等式\ \ |(\alpha,\beta)|\le|\alpha||\beta|,当且仅当\alpha与\beta线性相关时等号成立
  • <α,β>=arccos(α,β)αβ<\alpha,\beta>=\arccos\displaystyle\frac{(\alpha,\beta)}{|\alpha||\beta|}

Schmidt正交化过程{β1=α1,βk=αkj=1k1(αk,βj)(βj,βj)βj,其中αi为线性无关向量组Schmidt正交化过程\begin{cases}\beta_1=\alpha_1,\\\\\beta_k=\alpha_k-\displaystyle\sum_{j=1}^{k-1}\frac{(\alpha_k,\beta_j)}{(\beta_j,\beta_j)}\beta_j\end{cases},其中\alpha_i为线性无关向量组

  • s=n,则αi为基,βi为正交基,1βiβi为标准正交基若s=n,则\alpha_i为基,\beta_i为正交基,\frac{1}{|\beta_i|}\beta_i为标准正交基
  • M可逆    ε1,ε2,...,εn线性无关M可逆\iff\varepsilon_1,\varepsilon_2,...,\varepsilon_n线性无关

URn×n,若UTU=UUT=E,则称U是正交矩阵设U\in R^{n\times n},若U^TU=UU^T=E,则称U是正交矩阵

  • U=(α1 α2 ... αn),则α1 α2 ... αt是标准正交基U是正交矩阵U1=UTU=(\alpha_1\ \alpha_2\ ...\ \alpha_n),则\alpha_1\ \alpha_2\ ...\ \alpha_t是标准正交基\hArr U是正交矩阵\Rightarrow U^{-1}=U^T

将r个线性无关的向量扩张成一组n个的基

  • 取极大线性无关组
  • 再极大线性无关组用行向量的形式化成行阶梯
  • 行阶梯所在列置0,其它分别取1,得到的向量组即是基

 

第 5 章 矩阵的特征值理论与相似对角化

矩阵的相似
if 可逆P,s.t.P1A=B,则称AB相似,以下说法等价:if \ \exist可逆P,s.t.P^{-1}A=B,则称AB相似,以下说法等价:

  • A与对角阵Λ=(λi)n×n=(λ1    λ2        λn)(λiP)相似/A可以对角化A与对角阵\Lambda=(\lambda_i)_{n\times n}=\begin{pmatrix}\lambda_1&\ &\ &\ \\\\\ &\lambda_2&\ &\ \\\\\ &\ &\ddots&\ \\\\\ &\ &\ &\lambda_n\end{pmatrix}(\lambda_i\in P)相似/A可以对角化
  • 可逆P,s.t.P1AP=Λ\exist可逆P,s.t.P^{-1}AP=\Lambda
  • n个线性无关的向量组εi,s.t.A(ε1,ε2,...,εn)=,s.t.(ε1,ε2,...,εn)Λ\exist n个线性无关的向量组\varepsilon_i,s.t.A(\varepsilon_1,\varepsilon_2,...,\varepsilon_n)=,s.t.(\varepsilon_1,\varepsilon_2,...,\varepsilon_n)\Lambda
  • n个线性无关的向量组εi,s.t.(Aε1,Aε2,...,Aεn)=(λ1ε1,λ2ε2,...,λnεn)\exist n个线性无关的向量组\varepsilon_i,s.t.(A\varepsilon_1,A\varepsilon_2,...,A\varepsilon_n)=(\lambda_1\varepsilon_1,\lambda_2\varepsilon_2,...,\lambda_n\varepsilon_n)
  • n个线性无关的向量组εi,s.t.Aεi=λiεi,1in\exist n个线性无关的向量组\varepsilon_i,s.t.A\varepsilon_i=\lambda_i\varepsilon_i,1\le i\le n
  • A存在n个线性无关的特征向量A存在n个线性无关的特征向量
  • An个不同的特征值A有n个不同的特征值
  • r1+r2+...+rs=nr_1+r_2+...+r_s=n

不是所有的A都可以对角化

对角阵的来源:

A可以对角化,An个线性无关的特征向量,组成可逆矩阵P=(ξ1ξ2...ξn), AP=A(ξ1ξ2...ξn)=(λ1ξ1 λ2ξ2...λnξn)=(ξ1ξ2...ξn)(λ1    λ2        λn)=PΛ    P1AP=Λ当A可以对角化, A有n个线性无关的特征向量, 组成可逆矩阵P=(\xi_1\xi_2...\xi_n),\ AP=A(\xi_1\xi_2...\xi_n)=(\lambda_1\xi_1\ \lambda_2\xi_2...\lambda_n\xi_n)=(\xi_1\xi_2...\xi_n)\begin{pmatrix}\lambda_1&\ &\ &\ \\\\\ &\lambda_2&\ &\ \\\\\ &\ &\ddots&\ \\\\\ &\ &\ &\lambda_n\end{pmatrix}=P\Lambda\iff P^{-1}AP=\Lambda

定义及计算

对于APn×n,if λ0P,ξθPn,s.t.Aξ=λ0ξ,则称λ0AP中的特征值,反过来,称ξλ0的特征向量对于A\in P^{n\times n},if\ \exist\lambda_0\in P,\xi\ne\theta\in P^n,s.t.A\xi=\lambda_0\xi,则称\lambda_0是A在P中的特征值,反过来,称\xi是\lambda_0的特征向量

  • 一个特征向量只能属于一个特征值,但是特征值可以属于无穷多个特征向量
  • if λ=0, ξ=αPn×1if\ \lambda=0,\ \xi=\forall\alpha\in P^{n\times1}
  • λ0PA的特征值    (λ0EA)ξ=θn×1,即齐次线性方程组有非零解    λ0EA=0    r(λ0EA)<n\lambda_0\in P是A的特征值\iff(\lambda_0 E-A)\xi=\theta_{n\times 1},即齐次线性方程组有非零解\iff|\lambda_0E-A|=0\iff r(\lambda_0 E-A)<n

λEA(λP)A特征多项式,记作fA(λ)f(λ),λEA=f(λ)=0称作特征方程称|\lambda E-A|(\lambda\in P)为A特征多项式,记作f_A(\lambda)\backsim f(\lambda),则|\lambda E-A|=f(\lambda)=0称作特征方程

  • λ0A的特征值    f(λ0)=0\lambda_0是A的特征值\iff f(\lambda_0)=0
  • f(λ)=0的所有根,即是A的所有特征值(重根按重数计,因此我们说An个特征值)f(\lambda)=0的所有根,即是A的所有特征值(重根按重数计,因此我们说A有n个特征值)
  • As个互不相同的特征值,第i个特征值的重数为ni,则f(λ)=(λλ1)n1(λλ2)n2...(λλs)ns设A有s个互不相同的特征值,第i个特征值的重数为n_i,则f(\lambda)=(\lambda-\lambda_1)^{n_1}(\lambda-\lambda_2)^{n_2}...(\lambda-\lambda_s)^{n_s}

ξPnA的属于特征值λ0的特征向量    ξ是齐次线性方程组(λ0EA)XO的非零解向量\xi\in P^n是A的属于特征值\lambda_0的特征向量\iff\xi是齐次线性方程组(\lambda_0E-A)X=O的非零解向量

  • 求出f(λ)=0的所有互异根λ1,λ2,...,λs(1sn)求出f(\lambda)=0的所有互异根\lambda_1,\lambda_2,...,\lambda_s(1\le s\le n)
  • 针对每一个λi求出线性特征方程的通解Xi=k1η1i+k2η2i+...+knriηnrii, dimWλi=ri=r(λiEA),其中Wλiλi的解空间针对每一个\lambda_i求出线性特征方程的通解X^i=k_1\eta_1^i+k_2\eta_2^i+...+k_{n-r_i}\eta_{n-r_i}^i,\ \dim W_{\lambda_i}=r_i=r(\lambda_iE-A),其中W_{\lambda_i}为\lambda_i的解空间
  • ξi=k1η1i+k2η2i+...+knriηnrii, t1,t2,...,tnriP且不全为0\xi_i=k_1\eta_1^i+k_2\eta_2^i+...+k_{n-r_i}\eta_{n-r_i}^i,\ t_1,t_2,...,t_{n-r_i}\in P且不全为0

基本性质

A的不同特征值的特征向量线性无关,即Aξi=λiξi{ξ1,ξ2,...,ξs}线性无关A的不同特征值的特征向量线性无关,即A\xi_i=\lambda_i\xi_i\Rightarrow\{\xi_1,\xi_2,...,\xi_s\}线性无关

  • 证明x1ξ1+x2ξ2+...+xsξs=θ只有非零解时,技巧:可以左乘A以出现特征方程证明x_1\xi_1+x_2\xi_2+...+x_s\xi_s=\theta只有非零解时,技巧:可以左乘A以出现特征方程
  • 推广:所有不同特征值的特征向量组成的向量组线性无关,其子向量组也线性无关推广:所有不同特征值的特征向量组成的向量组线性无关,其子向量组也线性无关

A=i=1nλi, tr(A)=i=1nλi|A|=\displaystyle\prod_{i=1}^n\lambda_i,\ tr(A)=\displaystyle\sum_{i=1}^n\lambda_i

矩阵的相似对角化

kAk重特征值,(λEA)ξ=0,dimWλ=nr(λEA)kk是A的k重特征值,(\lambda E-A)\xi=0,\dim W_\lambda=n-r(\lambda E-A)\le k

对于一个不确定是否是可对角化阵,当λ是单根的时候,一定满足上述条件,因此无需判断单根;当λ是重根的时候,要判断r=n对于一个不确定是否是可对角化阵,当\lambda是单根的时候,一定满足上述条件,因此无需判断单根;当\lambda是重根的时候,要判断r=n

判断是否可以对角化:判断是否可以对角化:

  • 求特征值λEnA=0,得到重根和非重根求特征值|\lambda E_n-A|=0,得到重根和非重根
  • 对于重根λ,判断其解空间的维数是否小于等于自己的重数dimWλ=n(λEA)k对于重根\lambda,判断其解空间的维数是否小于等于自己的重数\dim W_\lambda=n-(\lambda E-A)\le k

r(A)=1    A=αβT,其中α,β是列向量r(A)=1\iff A=\alpha\beta^T,其中\alpha,\beta是列向量

相似理论

An个特征值λiA有n个特征值\lambda_i

  • f(λ)=λEnA=...=(λa11)(λa22)...(λann)=λn(a11+a22+...+annλn1+...+)(1)nAf(\lambda)=|\lambda E_n-A|=...=(\lambda-a_{11})(\lambda-a_{22})...(\lambda-a_{nn})=\lambda^n-(a_{11}+a_{22}+...+a_{nn}\lambda^{n-1}+...+)(-1)^n|A|

  • f(A)=(λλ1)(λλ2)...(λλn)f(A)=(\lambda-\lambda_1)(\lambda-\lambda_2)...(\lambda-\lambda_n)

Hamiltonn-Cayley定理

f(λ)=λEnAf(A)=On×nf(\lambda)=|\lambda E_n-A|\Rightarrow f(A)=O_{n\times n}

Aξ=λξAkξ=λkξ(数学归纳法)A\xi=\lambda\xi\Rightarrow A^k\xi=\lambda^k\xi(数学归纳法)

A的特征值的集合为sp(A)={λ1,λ2,...λn}设A的特征值的集合为sp(A)=\{\lambda_1,\lambda_2,...\lambda_n\}

  • {g(λ)λg(A)}=sp(g(A))\{g(\lambda)|\lambda\in g(A)\}=sp(g(A))

A1ξ=1λξA^{-1}\xi=\displaystyle\frac{1}{\lambda}\xi

A,B相似r(A)=r(B),A=B,tr(A)=tr(B),λEA=λEB,特征值相同A,B相似\Rightarrow r(A)=r(B),|A|=|B|,tr(A)=tr(B),|\lambda E-A|=|\lambda E-B|,特征值相同

AB可对角化,则AB相似    AB有相同的特征值若A,B可对角化,则A,B相似\iff A,B有相同的特征值

A,B相似g(A),g(B)相似A,B相似\Rightarrow g(A),g(B)相似

已知A,求方阵A1000已知A,求方阵A^{1000}

  • 计算特征值
  • 验证可对角化
  • 求出P,P1求出P,P^{-1}
  • PA1000P1=Λ1000PA^{1000}P^{-1}=\Lambda^{1000}
  • 遇事不决,先求对角阵(bushi)

实对称矩阵

共轭:将A转置后,对每个元素取共轭

实对称矩阵A的特征值都是实数实对称矩阵A的特征值都是实数

实对称矩阵属于不同特征值的特征向量正交实对称矩阵属于不同特征值的特征向量正交

求实对称矩阵A的正交阵求实对称矩阵A的正交阵

  • λEA=0λi|\lambda E-A|=0\Rightarrow \lambda_i
  • 验证λi,(λiEA)ξ=0,dimWi=rik,求出ξi验证\lambda_i,(\lambda_iE-A)\xi=0,\dim W_i=r_i\le k,求出\xi_i
  • ri=1,ξi单位化;ri>1,Schmidt正交化βir_i=1, \xi_i单位化;r_i>1, Schmidt正交化\Rightarrow\beta_i
  • U=(β1β2...βn)U=(\beta_1\beta_2...\beta_n)

 

矩阵的分解

  • 可逆矩阵的三角分解

An阶可逆矩阵,则A可以唯一的分解为A=U1C上三角A=C下三角U2,其中U为正交矩阵,C的对角线元素均为正数设A是n阶可逆矩阵,则A可以唯一的分解为A=U_1C_{上三角}或A=C_{下三角}U_2, 其中U为正交矩阵,C的对角线元素均为正数

证明:对A进行列向量分组,施密特正交化得到A=(ηi)C,其中cii=βi>0证明:对A进行列向量分组,施密特正交化得到A=(\eta_i)C, 其中c_{ii}=|\beta_i|>0

  • 任意矩阵的三角分解

APm×n,A可以唯一的分解为A=(L O)U1,A=U2(R O)T设A\in P^{m\times n},则A可以唯一的分解为A=(L\ O)U_1,A=U_2(R\ O)^T

  • 矩阵的满秩分解

APm×n,r(A)=r,BPm×r,r(B)=r,CPr×n,r(C)=r,s.t.A=BC设A\in P^{m\times n},r(A)=r,\exists B\in P^{m\times r},r(B)=r,C\in P^{r\times n},r(C)=r,s.t.A=BC

矩阵的满秩分解不唯一。我们一般选取阶梯矩阵主元所在列对应的列向量作为B,选取非零行向量作为C

  • 矩阵的奇异值分解

r(A)=r(AAT)=r(ATA)r(A)=r(AA^T)=r(A^TA)

AATATA均是半正定的对称阵,且特征值λi=μi,奇异值δi=λi0AA^T与A^TA均是半正定的对称阵,且特征值\lambda_i=\mu_i,奇异值\delta_i=\sqrt{\lambda_i}\ge0

APm×n,r(A)=r,δ1δ2...δr,U1Pm×m,U2Pn×n,s.t.U1TAU2=Δ设A\in P^{m\times n},r(A)=r,\delta_1\ge\delta_2\ge...\ge\delta_r,\exists U_1\in P^{m\times m},U_2\in P^{n\times n},s.t. U_1^TAU_2=\Delta

A=U1ΔU2TA=U_1\Delta U_2^T

  • 方阵的极分解

An阶可逆方阵,则A可以唯一的分解为A=U1S1A=S2U2,其中U是正交矩阵,S是正定矩阵设A为n阶可逆方阵,则A可以唯一的分解为A=U_1S_1或A=S_2U_2, 其中U是正交矩阵,S是正定矩阵

若A不可逆,则S为半正定阵

证明:利用A的奇异值分解

 

第 6 章 二次型

定义

f(x1x2..xn)=a11x12+2a12x1x2+2a13x1x3+...2annxn2=i=1naiixi2+21i<jaijxixjf(x_1x_2..x_n) = a_{11}x_1^2+2a_{12}x_1x_2+2a_{13}x_1x_3+...2a_{nn}x_n^2 = \displaystyle\sum_{i=1}^na_{ii}x_i^2+2\sum_{1\le i<j\le }a_{ij}x_ix_j

称以下操作为线性变换

xi=ci1y1+ci2y2+...+cinynx_i=c_{i1}y_1+c_{i2}y_2+...+c_{in}y_n

我们只考虑C0, C=(cij)n×n的变换矩阵我们只考虑|C|\ne 0,\ C =( c_{ij})_{n\times n}的变换矩阵

找到一个线性变换,使得代入原式之后,不存在交叉项,我们称为标准型

f=d1y12+d2y22+...+dnyn2f=d_1y_1^2+d_2y_2^2+...+d_ny_n^2

 

二次型的矩阵形式与矩阵的合同

找到一个非退化的线性变换Xn×1=CYn×1,使得二次型fd1y12+d2y22+...+dnyn2找到一个非退化的线性变换X_{n\times 1}=CY_{n\times 1},使得二次型f\rightarrow d_1y_1^2+d_2y_2^2+...+d_ny_n^2

f=XTAX=YTCTACY=YTDYf=X^TAX=Y^TC^TACY=Y^TDY

  • 其中A是一个对称阵,A=(aij)n×n,其中aji=aij(j>i)其中A是一个对称阵,A=(a_{ij})_{n\times n},其中a _{ji} = a _{ij}(j>i)

  • D是一个对角阵,D=(di)n×nD是一个对角阵, D=(d_{i})_{n\times n}

  • ϕ:fA是双射\phi :f\rightarrow A是双射

由于f和A一一对应,这一章所有的结论,都有二次型语言和矩阵语言

 

配方法

二次型一定能由非退化线性变换化作标准型

主元法

  • 先将x1作为主元整理配方,再考虑有平方项的主元先将x_1作为主元整理配方,再考虑有平方项的主元

没有平方项的做法

  • 先构建非退化的线性变换X=C1Y,代入产生平方项(C1不唯一)先构建非退化的线性变换X=C_1Y,代入产生平方项(C_1不唯一)
  • 再按主元法处理y的二次型,得到标准化矩阵Y=C2Z再按主元法处理y的二次型,得到标准化矩阵Y=C_2Z
  • 代入得X=(C1C2)Z代入得X=(C_1C_2)Z

 

对称阵与二次型的转化

f=XTAX=XTBXA=Bf=X^TAX=X^TBX\Rightarrow A=B
f=XTAX为标准型    A=Λf=X^TAX为标准型\iff A=\Lambda

对称阵A, 可逆阵C, s.t.CTAC=D\forall 对称阵A,\ \exists可逆阵C,\ s.t.C^TAC=D

  • A复原到二次型f(x1x2...xn)后标准化把A复原到二次型f(x_1x_2...x_n)后标准化
  • 标准化矩阵C即是所求矩阵标准化矩阵C即是所求矩阵

对称阵问题可以转化为二次型问题

U为正交阵U为正交阵

  • 实对称矩阵A,U,s.t.U1AU=Λ=(λi)n×n\forall 实对称矩阵A, \exists U,s.t.U^{-1}AU=\Lambda=(\lambda_i)_{n\times n}

  • 实二次型f,X=UY,s.t.f=λiyi2(λi为特征值)\forall 实二次型f, \exists X=UY,s.t.f=\displaystyle\sum\lambda_iy_i^2,(\lambda_i为特征值)

因此解决二次型的问题可以使用前几章的方法,只要能用就行

 

相似,等价和合同

若A,B:

  • 相似:P1AP=B相似:P^{-1}AP=B
  • 等价:PAQ=B等价:PAQ=B
  • 合同:CTAC=B合同:C^TAC=B

 

规范型

f=XTAX, X=CY=1rdiyi2,(di0)r=r(A)f=X^TAX,\ X=CY=\displaystyle\sum_1^r d_iy_i^2,(d_i\ne0)\Rightarrow r=r(A)

在复数域中

{yi=1dizi,1iryi=zi,r+1in\begin{cases}y_i=\displaystyle\frac{1}{\sqrt{d_i}}z_i,1\le i\le r\\\\ y_i=z_i,r+1\le i\le n\end{cases}

则可以化作唯一的规范型

f=z12+z22+...+zr2f=z_1^2+z_2^2+...+z_r^2

在实数域中

f=XTAX=d1y12+...+dpyp2(dp+1yp+12+...+dryr2)f=X^TAX=d_1y_1^2+...+d_py_p^2-(d_{p+1}y_{p+1}^2+...+d_ry_r^2)

令:zi=1diyi令:z_i = \displaystyle\frac{1}{\sqrt{d_i}}y_i

则可以化作实数域内的规范型

f=z12+...+zp2(zp+12+...+zr2)f=z_1^2+...+z_p^2-(z_{p+1}^2+...+z_r^2)

惯性定理

f化作标准型,正平方项的项数p唯一,称为正惯性指数f化作标准型,正平方项的项数p唯一,称为正惯性指数

实对称阵ACTAC=D=(di)n×n中,正数个数p唯一实对称阵A,C^TAC=D=(d_i)_{n\times n}中,正数个数p唯一

实二次型f,X=CY,s.t. f化为唯一的规范型\Rightarrow \forall实二次型f,\exists X=CY,s.t.\ f化为唯一的规范型

$ 对于\forall实对称阵A,B, A,B合同\iff r(A)=r(B)且p(A)=p(B) $

正惯性指数p求解

  • f=XTAX,配方法求解标准型,其中正数的个数为pf=X^TAX,配方法求解标准型,其中正数的个数为p
  • 正交阵U,UTAU=Λ,用特征值求解,正数特征值为p\exists 正交阵U,U^TAU=\Lambda,用特征值求解,正数特征值为p

 

正定型

f=XTAXA为实对称二次型,对XRnθ,f>0A正定(A>0)f=X^TAX,A为实对称二次型,对\forall X\in \Bbb{R}^n\ne\theta,f>0\Rightarrow A正定(A>0)

f(x1,x2,...,xn)=XTAX正定:若f(x_1,x_2,...,x_n)=X^TAX正定:

  • f的正惯性指数为n/An个特征值均为正AEn合同f的正惯性指数为n/A的n个特征值均为正\Rightarrow A与E_n合同
  • 可逆实矩阵B,s.t. A=BTB,B=ΛUT,其中U为正交阵U1AU=Λ\exists 可逆实矩阵B,s.t.\ A=B^TB,B=\sqrt{\Lambda}U^T,其中U为正交阵U^{-1}AU=\Lambda

 

子式

子式:A的第j1,j2,...,js行列子式:A的第j_1,j_2,...,j_s行列

主子式:A的第k1<k2<...<ks行列主子式:A的第k_1<k_2<...<k_s行列

顺序主子式ΔsA的第1,2,...,s行列顺序主子式\Delta_s:A的第1,2,...,s行列

f(x1,x2,...,xn)=XTAX正定:(用于判断f是否正定)若f(x_1,x_2,...,x_n)=X^TAX正定:(用于判断f是否正定)

  • Δi>0,1in\Delta_i>0,1\le i \le n

 

负定型和半正定型

f<0    f>0,(f)正定(1)kΔk>0,1kn若f<0\iff -f>0,(-f)正定\Rightarrow(-1)^k\Delta_k>0,1\le k\le n

f0    f半正定若f\ge 0\iff f半正定\Rightarrow

  • 正惯性指数p=r正惯性指数p=r
  • 特征值λi0特征值\lambda_i\ge 0
  • 实矩阵B,s.t.A=BTB\exists 实矩阵B,s.t.A=B^TB
  • 主子式0\forall主子式\ge 0

 

正定矩阵的性质

n阶矩阵A是正定矩阵,若n阶矩阵A是正定矩阵, 则

  • A>0A^*>0
  • A>0|A|>0
  •     AE合同可逆C,CTAC>0\iff A与E合同\Rightarrow \forall 可逆C,C^TAC>0
  • A1正定A^{-1}正定
  • A1+A2正定A_1+A_2正定
  • A1A2正定Ak>0A_1\cdot A_2正定\Rightarrow A^k>0
  • if A1A2=A2A1, A1A2>0if\ A_1\cdot A_2=A_2\cdot A_1,\ A_1\cdot A_2>0