我的原文地址
第七章:线性变换的Jordan标准形1. 总括本章是线性代数中较为深入的内容. 对复数域上的n维线性空间完满解决了第四章第四节提出的问题,证明mathbb{C}上n维线性空间内的任意线性变换的矩阵都可以化为一种最简形式——Jordan标准形. 这一理论为研究线性变换的各种问题提供了一个强有力的工具.
本章不但内容是重要的,而且处理方法也是在代数学中具有典型性的. 在第一节,先用商空间的技巧解决了幂零矩阵的Jordan标准形问题,在第二节则使用空间分解的方法解决了一般线性变换的Jordan标准形问题. 应仔细体会这两种基本方法的运用,它们是代数学各领域普遍使用的一套处理问题的特有方法. 本章结果虽然限制在复数域上线性空间成立,但在一般数域特别是实数域上线性空间内,也常常可以使用这些结果. 办法是取定一组基,把oldsymbol{A}的问题转化为A的问题,然后把A看作复数域上矩阵,用A的Jordan标准形处理有关问题,再把结果返回到原数域. 在上一章第二节处理正交变换时已经使用了这种方法. 这也是代数学中普遍使用的一种方法,应给予足够重视. 第三节是一个应用,进一步讨论Jordan标准形时,最小多项式起重要作用,但本纲要不使用这种方法来讨论Jordan标准形理论.Contents Contents 1. 总括 2. 幂零线性变换的Jordan标准形 2.1. 循环不变子空间 2.2. 幂零线性变换的Jordan标准形 3. 一般线性变换的Jordan标准形 3.1. Jordan标准形的存在性 3.2. Jordan标准形的唯一性 4. 最小多项式 4.1. 方阵的化零多项式 4.2. 方阵的最小多项式2. 幂零线性变换的Jordan标准形
先从一类最简单的线性变换入手,然后指出:任意线性变换可以归结为此类线性变换,从而解决问题.
一个线性变换的特征值和特征向量对研究该变换有重要意义,所以先看幂零线性变换的特征值.
Theorem 1. n维线性空间的幂零线性变换oldsymbol{A}的特征多项式为f(lambda)=lambda^n,从而oldsymbol{A}有唯一特征值lambda _ 0=0.对mathbb{C}^n中的非零X _ 0,AX _ 0=lambda _ 0X _ 0,, A^mX _ 0=lambda _ 0^mX _ 0,故lambda _ 0=0,即f(lambda)在mathbb{C}内n个根都是0,所以f(lambda)=lambda^n.2.1. 循环不变子空间对幂零线性变换,任取一非零向量alpha,存在正整数k使oldsymbol{A}^kalpha=0,, oldsymbol{A}^{k-1}alpha eq0. 那么,向量组alpha,oldsymbol{A}alpha,dots,oldsymbol{A}^{k-1}alpha线性无关(设a _ 0alpha+a _ 1oldsymbol{A}alpha+dots+a _ {k-1}oldsymbol{A}^{k-1}alpha=0,两边逐次以oldsymbol{A}作用,可分别得出从左到右每个系数都是0). I(alpha)=L(alpha,oldsymbol{A}alpha,dots,oldsymbol{A}^{k-1}alpha)是维数为k的不变子空间,称之为oldsymbol{A}的循环不变子空间,在基oldsymbol{A}^{k-1}alpha,dots,oldsymbol{A}alpha,alpha下,oldsymbol{A}限制在I(alpha)下矩阵为[ J= egin{bmatrix} 0 & 1 & & \ & 0 & ddots & \ & & ddots & 1 \ & & & 0 end{bmatrix}.]反过来,一个不变子空间的一组基varepsilon _ 1,dots,varepsilon _ k使oldsymbol{A}限制在其下的矩阵为J时,那么可以推出M是由varepsilon _ k生成的循环不变子空间.
要得到存在一组基使{幂零}线性变换在其下的矩阵为Jordan形矩阵,先要有一个基本事实:
Theorem 2. n维V存在一组基使oldsymbol{A}在其下矩阵成Jordan形矩阵的充要条件是,V可分解为oldsymbol{A}的循环不变子空间的直和: [V=I(alpha _ 1)oplus I(alpha _ 2)oplusdotsoplus I(alpha _ s).]2.2. 幂零线性变换的Jordan标准形本段均以M=V _ {lambda _ 0}记oldsymbol{A}的唯一特征值lambda _ 0=0对应的特征子空间. 任一alphain M,, oldsymbol{A}alpha=0.
Theorem 3. 设overline{alpha}=alpha+M为overline{V}=V/M中一非零元素,I(overline{alpha})是oldsymbol{A}在overline{V}内诱导变换的k维循环不变子空间,则:I(alpha)为oldsymbol{A}在V内一个k+1维循环不变子空间,即 I(alpha)=L(alpha,oldsymbol{A}alpha,dots,oldsymbol{A}^kalpha)且oldsymbol{A}^kalphain M.Theorem 4. 存在一组基,使在该组基下幂零线性变换oldsymbol{A}的矩阵成Jordan形矩阵.若oldsymbol{A}^{n-1} eq0,, oldsymbol{A}^n=0,则oldsymbol{A}称为循环幂零线性变换. 此时存在alpha使oldsymbol{A}^{n-1}alpha eq0,oldsymbol{A}^{n-1}alpha,dots,oldsymbol{A}alpha,alpha就成为V的一组基,在这组基下的矩阵为上文的J,这组基称为循环基.
由于对任意n阶矩阵A,E _ {i,i+1}A结果效果为将A的第i+1行上移覆盖掉第i行再将除i行外的所有行置为0,而J=sum E _ {i,i+1},故JA结果为把该方阵每行向上移一行,原第一行舍弃,最后一行置为0. 于是J^k相当于单位矩阵的1都往右上移k次.
证明:对定理theorem712,设oldsymbol{A}在某组基下的矩阵成Jordan形,由定理4.4.8,V可分解为不变子空间的直和:V=M _ 1oplusdotsoplus M _ s,且在M _ i内存在一组基varepsilon _ {i1},dots,varepsilon _ {in _ i},oldsymbol{A}| _ {M _ i}在其下的矩阵为上文J的形式的n _ i阶方阵,于是M _ i=I(varepsilon _ {in _ i}),V=I(varepsilon _ {1n _ 1})oplusdotsoplus I(varepsilon _ {sn _ s}). 反过来,如果有V=I(alpha _ 1)oplus I(alpha _ 2)oplusdotsoplus I(alpha _ s),在每个I(alpha _ i)内取一组基oldsymbol{A}^{n _ i-1}alpha _ i,dots,oldsymbol{A}alpha _ i,alpha _ i,则它们合并成为V的一组基,在此组基下oldsymbol{A}的矩阵就成Jordan形.
定理theorem713:I(overline{alpha})=L(overline{alpha},oldsymbol{A}overline{alpha},dots,oldsymbol{A}^{k-1}overline{alpha}). oldsymbol{A}^koverline{alpha}=overline{0},则overline{oldsymbol{A}^kalpha}=overline{0},oldsymbol{A}^kalphain M,从而oldsymbol{A}(oldsymbol{A}^kalpha)=0,而oldsymbol{A}^kalpha eq0,否则oldsymbol{A}^{k-1}alphain M,那么oldsymbol{A}^{k-1}overline{alpha}=overline{oldsymbol{A}^{k-1}alpha}=overline{0},与I(overline{alpha})的假设矛盾.
定理theorem714:由定理theorem712,只需要证明V可分解为oldsymbol{A}的循环不变子空间的直和就可以了. 为此对n作归纳法. n=1时,取基varepsilon,必有oldsymbol{A}varepsilon=lambda _ 0varepsilon,此时lambda _ 0作为特征值只能为0,故oldsymbol{A}的矩阵为一阶零矩阵,为Jordan形矩阵.
假设命题当维数小于n时成立,则当维数等于n时,若oldsymbol{A}=0,则显然成立,若oldsymbol{A} eq0,M=V _ {lambda _ 0}的维数至少为1,故dimoverline{V}=dim V-dim M