矩阵理论与方法已成为现代科技领域必不可少的工具,数值分析、微分方程、概率统计、力学、网络等学科与矩阵理论有着密切的联系。[1]对角矩阵可以认为是矩阵中最简单的一种,无论是计算它的乘积、逆矩阵、高次幂还是求特征值都特别方便。[2]矩阵的对角化问题是矩阵理论的一个重要内容,所谓把矩阵A对角化,就是寻求相似变换矩阵P,使P-1AP=Λ为对角矩阵。[3]一个n阶矩阵具备什么条件才能对角化?这是一个较复杂的问题,而对数量矩阵、上三角形矩阵、分块对角矩阵等一些特殊矩阵确有一些特殊的结论。笔者根据这些特殊矩阵的特点和性质,对这些特殊矩阵的对角化问题进行探讨和研究,得出了这些特殊矩阵能否对角化的条件和结论。
定理1 矩阵A与数量矩阵
证明 充分条件:设数量矩阵A=aE,因为存在可逆的单位矩阵E,使得E-1AE=A,即矩阵A与A相似,所以数量矩阵与数量矩阵相似。
必要条件:设矩阵A与数量矩阵B=bE相似,则存在可逆矩阵P,使得P-1AP=B=bE,两边取逆,得A=PbEP-1=bPEP-1=bE=B,所以A是数量矩阵。
由定理1可以得到以下结论:
推论1 n(n≥2) 阶非数量矩阵A能对角化的必要条件是A有不同的特征值。
推论2 如果n(n≥2) 阶矩阵A的特征值都相等,且A不是数量矩阵,则矩阵A不能对角化。
定理2[4] 如果n阶可逆矩阵A能对角化,那么A的逆矩阵A-1和A的伴随矩阵A*都能对角化。
证明 由于矩阵A能对角化,所以存在n阶可逆矩阵P,使得
因为矩阵A可逆,所以矩阵A的每个特征值λ1, λ2, …, λn都不等于0,对上式两边取逆,得
$ {\mathit{P}^{{\rm{ - 1}}}}{\mathit{A}^{{\rm{ - 1}}}}\mathit{P = }\left( {\begin{array}{*{20}{c}} {\mathit{\lambda }_1^{ - 1}}&{}&{}&{}\\ {}&{\mathit{\lambda }_2^{ - 1}}&{}&{}\\ {}&{}& \ddots &{}\\ {}&{}&{}&{\mathit{\lambda }_\mathit{n}^{ - 1}} \end{array}} \right), $ |
因此A的逆矩阵A-1也能对角化。
又因为A的伴随矩阵A*=|A|A-1,则由上式可得
$ \begin{array}{l} {\mathit{P}^{{\rm{ - 1}}}}{\mathit{A}^\mathit{*}}\mathit{P = }{\mathit{P}^{{\rm{ - 1}}}}\left| \mathit{A} \right|{\mathit{A}^{{\rm{ - 1}}}}\mathit{P = }\left| \mathit{A} \right|{\mathit{P}^{{\rm{ - 1}}}}{\mathit{A}^{{\rm{ - 1}}}}\mathit{P = }\\ \left( {\begin{array}{*{20}{c}} {\left| \mathit{A} \right|\mathit{\lambda }_1^{ - 1}}&{}&{}&{}\\ {}&{\left| \mathit{A} \right|\mathit{\lambda }_2^{ - 1}}&{}&{}\\ {}&{}& \ddots &{}\\ {}&{}&{}&{\left| \mathit{A} \right|\mathit{\lambda }_\mathit{n}^{ - 1}} \end{array}} \right)。\end{array} $ |
故A的伴随矩阵A*也能对角化。
定理3 如果n阶矩阵A能对角化,那么
(1) 矩阵A的幂Am也能对角化。
(2) 矩阵A的多项式φ(A)=a0E+a1A+…+amAm也能对角化。
证明 由于矩阵A能对角化,所以存在可逆矩阵P,使得
(1) 因为
所以矩阵A的幂Am也能对角化。
(2) 因为P-1φ(A)P=a0P-1EP+a1P-1AP+…+am(P-1AP)m
$ \begin{array}{l} = {a_{\rm{0}}}\left( {\begin{array}{*{20}{c}} 1&{}&{}&{}\\ {}&1&{}&{}\\ {}&{}& \ddots &{}\\ {}&{}&{}&1 \end{array}} \right) + {a_{\rm{1}}}\left( {\begin{array}{*{20}{c}} {{\lambda _{\rm{1}}}}&{}&{}&{}\\ {}&{{\lambda _{\rm{2}}}}&{}&{}\\ {}&{}& \ddots &{}\\ {}&{}&{}&{{\lambda _n}} \end{array}} \right) + \ldots + {a_m}\left( {\begin{array}{*{20}{c}} {\lambda _1^m}&{}&{}&{}\\ {}&{\lambda _2^m}&{}&{}\\ {}&{}& \ddots &{}\\ {}&{}&{}&{\lambda _n^m} \end{array}} \right)\\ = \left( {\begin{array}{*{20}{c}} {{a_0} + {a_1}{\lambda _1} + \ldots + {a_m}\lambda _1^m}&{}&{}&{}\\ {}&{{a_0} + {a_1}{\lambda _2} + \ldots + {a_m}\lambda _2^m}&{}&{}\\ {}&{}& \ddots &{}\\ {}&{}&{}&{{a_0} + {a_1}{\lambda _n} + \ldots + {a_m}\lambda _n^m} \end{array}} \right)。\\ \end{array} $ |
所以矩阵A的多项式φ(A)=a0E+a1A+…+amAm也能对角化。
定理4 如果n阶矩阵A能对角化,那么A的转置矩阵AT也能对角化。
证明 由于矩阵A能对角化,所以存在可逆矩阵P,使得
两边取转置,得
$ \begin{align} & \left( {{P}^{\rm{-}1}}AP \right)^{T}={{P}^{T}}{{A}^{T}}{{\left( {{P}^{\rm{-}1}} \right)}^{T}}={{P}^{T}}{{A}^{T}}{{\left( {{P}^{T}} \right)}^{\rm{-}1}} \\ & \rm{=}{{\left( \begin{matrix} {{\mathit{\lambda }}_{\rm{1}}} & {} & {} & {} \\ {} & {{\mathit{\lambda }}_{\rm{2}}} & {} & {} \\ {} & {} & \ddots & {} \\ {} & {} & {} & {{\mathit{\lambda }}_{\mathit{n}}} \\ \end{matrix} \right)}^{\mathit{T}}}\rm{=}\left( \begin{matrix} {{\mathit{\lambda }}_{\rm{1}}} & {} & {} & {} \\ {} & {{\mathit{\lambda }}_{\rm{2}}} & {} & {} \\ {} & {} & \ddots & {} \\ {} & {} & {} & {{\mathit{\lambda }}_{\mathit{n}}} \\ \end{matrix} \right)。\\ \end{align} $ |
令(PT)-1=Q,则PT=Q-1,由上式可得
$ {{\mathit{Q}}^{\rm{-1}}}{{\mathit{A}}^{\mathit{T}}}\mathit{Q=}\left( \begin{matrix} {{\mathit{\lambda }}_{\rm{1}}} & {} & {} & {} \\ {} & {{\mathit{\lambda }}_{\rm{2}}} & {} & {} \\ {} & {} & \ddots & {} \\ {} & {} & {} & {{\mathit{\lambda }}_{\mathit{n}}} \\ \end{matrix} \right)。$ |
故A的转置矩阵AT也能对角化。
推论3 如果矩阵A不能对角化,那么A的转置矩阵AT也不能对角化。
定理5 设n阶上三角形矩阵A=
(1) 矩阵A的主对角线上的元素aii(i=1, 2, …, n)互不相等,则A能对角化。
(2) 矩阵A的主对角线上的元素aii(i=1, 2, …, n)都相等,即a11=a22=…=ann,且元素aij(i<j)不全为零,则A不能对角化。
证明 (1) 由于A是上三角形矩阵,所以其主对角线上的元素aii(i=1, 2, …, n)就是矩阵A的所有特征值,而aii(i=1, 2, …, n)互不相等,所以矩阵A有n个不同的特征值,故A能对角化。
(2) 由已知条件知,矩阵A只有n个相等的特征值,而矩阵A不是数量矩阵,由定理1的推论可得,矩阵A不能对角化。
推论4 设n阶上三角形矩阵A=
两个都能对角化的上三角形矩阵的和矩阵却不一定能对角化。例如,上三角形矩阵A=
两个都不能对角化的上三角形矩阵的和矩阵却有可能能对角化。例如,上三角形矩阵A=
一个能对角化的上三角形矩阵和一个不能对角化的上三角形矩阵的和矩阵却有可能能对角化。例如,上三角形矩阵A=
定理5的条件只是充分条件,不满足定理5中条件的其他上三角形矩阵能否对角化,还是一个比较复杂的问题,需要具体情况具体分析,下面通过例题加以说明。
例1 证明上三角形矩阵A=
证明 由|A-λE|=(λ-1)3(λ-2)(λ-3)=0得矩阵A的特征值为λ1=λ2=λ3=1, λ4=2, λ5=3。
矩阵A能对角化的充分必要条件是对应三重特征值λ1=λ2=λ3=1, 有3个线性无关的特征向量,即方程组(A-E)x=0有3个线性无关的解,而系数矩阵
$ \mathit{A-E=}\left( \begin{matrix} 0 & 1 & 0 & 5 & 6 \\ 0 & 0 & 2 & 1 & 0 \\ 0 & 0 & 0 & 3 & 0 \\ 0 & 0 & 0 & 1 & 4 \\ 0 & 0 & 0 & 0 & 2 \\ \end{matrix} \right)\sim \left( \begin{matrix} 0 & 1 & 0 & 5 & 6 \\ 0 & 0 & 2 & 1 & 0 \\ 0 & 0 & 0 & 1 & 4 \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 \\ \end{matrix} \right) $ |
的秩R(A-E)=4,所以方程组(A-E)x=0只有一个线性无关的解,即矩阵A对应的三重特征值λ1=λ2=λ3=1, 没有3个线性无关的特征向量,故矩阵A不能对角化。
事实上,如果令A-E=
例1说明,只要矩阵A中的子矩阵
例2 证明上三角形矩阵A=
证明 由|A-λE|=(λ-1)3(λ-2)(λ-3)=0得矩阵A的特征值为λ1=λ2=λ3=1, λ4=2, λ5=3。因为方程组(A-E)x=0的系数矩阵
$ \mathit{A-E=}\left( \begin{matrix} 0 & 0 & 0 & 5 & 6 \\ 0 & 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 3 & 0 \\ 0 & 0 & 0 & 1 & 4 \\ 0 & 0 & 0 & 0 & 2 \\ \end{matrix} \right)\sim \left( \begin{matrix} 0 & 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 \\ \end{matrix} \right) $ |
的秩R(A-E)=2,所以矩阵A对应的三重特征值λ1=λ2=λ3=1, 有3个线性无关的特征向量,故矩阵A能对角化。
例2说明,只要矩阵A中的子矩阵
例3 证明上三角形矩阵A=
证明 由|A-λE|=(λ-1)2(λ-4)=0得,矩阵A的特征值为λ1=λ2=1,λ3=4,因为方程组(A-E)x=0的系数矩阵
$ \mathit{A-E}=\left( \begin{matrix} 0 & 2 & 3 \\ 0 & 3 & 5 \\ 0 & 0 & 0 \\ \end{matrix} \right)\sim \left( \begin{matrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \\ \end{matrix} \right) $ |
的秩R(A-E)=2,所以矩阵A对应的二重特征值λ1=λ2=1,只有一个线性无关的特征向量,故矩阵A不能对角化。
例4 证明上三角形矩阵A=
证明 由|A-λE|=(λ-1)2(λ-3)=0得,矩阵A的特征值为λ1=λ2=1,λ3=3,因为方程组(A-E)x=0的系数矩阵
$ \mathit{A-E}=\left( \begin{matrix} 0 & 2 & 3 \\ 0 & 2 & 3 \\ 0 & 0 & 0 \\ \end{matrix} \right)\sim \left( \begin{matrix} 0 & 2 & 3 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \\ \end{matrix} \right) $ |
的秩R(A-E)=1,所以矩阵A对应的二重特征值λ1=λ2=1,有两个线性无关的特征向量,故矩阵A能对角化。
例3和例4说明,虽然两个上三角形矩阵都有两个相等的特征值,但是一个能对角化,另一个却不能对角化。也就是说,像例3和例4中的矩阵能否对角化,没有一般规律可循。
定理6 如果矩阵Bs和Ct都能对角化,即Qs-1BsQs=
证明 已知Qs-1BsQs=Λs,Rt-1CtRt=Λt,令P=
$ \begin{align} & {{\mathit{P}}^{\rm{-1}}}\mathit{AP=}\left( \begin{matrix} \mathit{Q}_{\mathit{s}}^{-1} & {{0}_{\mathit{s}\times \mathit{t}}} \\ {{0}_{t\times s}} & \mathit{R}_{\mathit{t}}^{-1} \\ \end{matrix} \right)\left( \begin{matrix} {{\mathit{B}}_{\mathit{s}}} & {{0}_{\mathit{s}\times \mathit{t}}} \\ {{0}_{t\times s}} & {{\mathit{C}}_{\mathit{t}}} \\ \end{matrix} \right)\left( \begin{matrix} \mathit{Q} & {{0}_{\mathit{s}\times \mathit{t}}} \\ {{0}_{t\times s}} & \mathit{R} \\ \end{matrix} \right) \\ & =\left( \begin{matrix} \mathit{Q}_{\mathit{s}}^{-1}{{\mathit{B}}_{\mathit{s}}}\mathit{Q} & {{0}_{\mathit{s}\times \mathit{t}}} \\ {{0}_{t\times s}} & \mathit{Q}_{\mathit{s}}^{-1}{{\mathit{C}}_{\mathit{t}}}\mathit{Q} \\ \end{matrix} \right)=\left( \begin{matrix} {{\Lambda }_{\mathit{s}}} & {{0}_{\mathit{s}\times \mathit{t}}} \\ {{0}_{t\times s}} & {{\Lambda }_{\mathit{t}}} \\ \end{matrix} \right)。\\ \end{align} $ |
所以分块对角矩阵A=
推论5 如果矩阵A1, A2, …, As都能对角化,那么分块对角矩阵A=
定理6及推论5不仅给出了分块对角矩阵能对角化的条件,而且给出了将分块对角矩阵对角化的具体方法,这种方法大大减少了将分块对角矩阵对角化的计算工作量。
以上我们探讨和研究了数量矩阵、上三角形矩阵、分块对角矩阵等一些特殊矩阵的对角化问题,给出了这些特殊矩阵能否对角化的条件和结论。与此同时,也给出了将这些特殊矩阵对角化的具体方法,有些方法可以直接判断矩阵能否对角化,有些方法可以减少矩阵对角化的计算工作量。虽然我们仅仅研究了一些特殊矩阵的对角化问题,但是,这些方法和结论对于一般矩阵的对角化问题具有一定的借鉴作用。
[1] | 秦建国, 谢栋梁, 王静娜. 一类可以对角化的矩阵[J]. 郑州轻工业学院学报(自然科学版), 2013(4): 106–108. |
[2] | 徐新萍. 有关对角化问题综述[J]. 江苏教育学院学报(自然科学版), 2010(6): 45–46. |
[3] | 同济大学数学系. 线性代数[M]. 第6版. 北京: 高等教育出版社, 2016. |
[4] | 俱鹏岳. 浅谈特殊矩阵的对角化问题[J]. 西昌学院学报(自然科学版), 2013(6): 29–33. |