階数標準形の一意性・ブロック行列

階数標準形は一意的に定まります。つまり、行列 \(A\) を基本変形していくとき、どのような手順で変形しようとも、最終的な階数標準形は同じものになります。今後の証明や計算に便利なブロック行列も紹介しておきます。

階数標準形への基本変形

階数標準形への変形手順についてアルゴリズムをきちんと述べておきます。

階数標準形への基本変形(可能性)

任意の行列 \(A \in M_{m,n}(\mathbb K)\) は、以下の手順で基本変形を繰り返し階数標準形にできる。

  1. \(A=O\) なら終了
  2. \(A\neq O\) なら \(0\) でない \((i,j)\) 成分 \(a_{ij}\neq 0\) がある。この \(a_{ij}\) が \((1,1)\) 成分にくるように行と列を入れ替える。
  3. 第 \(1\) 行に \(a_{ij}^{-1}\) をかけることで \((1,1)\) 成分を \(1\) にする。$$\begin{pmatrix}1&*&\cdots&*\\ * \\ \vdots &&\huge *\\ *\end{pmatrix}$$
  4. \((1,1)\) 成分以外の第 \(1\) 列を全て \(0\) にするために、第 \(1\) 行を適当なスカラー倍して他の行たちに加える。
  5. \((1,1)\) 成分以外の第 \(1\) 行を全て \(0\) にするために、第 \(1\) 列を適当なスカラー倍して他の列たちに加える。
  6. 以下のようになるので、\(A’\) の部分を見て、\(A\) に今まで行った手順をもう一度繰り返す。$$\begin{pmatrix}1&0&\cdots&0\\0\\ \vdots &&\huge A’\\ 0\end{pmatrix}$$
具体例

\(A=\begin{pmatrix}2&-1&0&1\\2&-1&0&2\\3&-2&1&3\end{pmatrix}\) のとき
$$\begin{aligned}
&\begin{pmatrix}2&-1&0&1\\2&-1&0&2\\3&-2&1&3\end{pmatrix}\rightarrow
\begin{pmatrix}3&-2&1&3\\2&-1&0&2\\2&-1&0&1\end{pmatrix}\rightarrow
\begin{pmatrix}1&-2&3&3\\0&-1&2&2\\0&-1&2&1\end{pmatrix}\\\rightarrow
&\begin{pmatrix}1&0&0&0\\0&-1&2&2\\0&-1&2&1\end{pmatrix}\rightarrow
\begin{pmatrix}1&0&0&0\\0&1&-2&-2\\0&-1&2&1\end{pmatrix}\rightarrow
\begin{pmatrix}1&0&0&0\\0&1&-2&-2\\0&0&0&-1\end{pmatrix}\\\rightarrow
&\begin{pmatrix}1&0&0&0\\0&1&0&0\\0&0&0&-1\end{pmatrix}\rightarrow
\begin{pmatrix}1&0&0&0\\0&1&0&0\\0&0&-1&0\end{pmatrix}\rightarrow
\begin{pmatrix}1&0&0&0\\0&1&0&0\\0&0&1&0\end{pmatrix}
\end{aligned}$$

\(0\) でない \((i,j)\) 成分 \(a_{ij}\) を選ぶときはできるだけ \(0\) が多い行あるいは列から選ぶとよいです。また、\(1\) があるならそこを選ぶとよいです。

ブロック行列

\((m,n)\) 型で階数 \(r\) の階数標準形は対角線上に \(1\) が \(r\) 個並んだ形の行列である。これをブロック行列で表すと次のようになる。$$\begin{pmatrix} 1 & & & \\ & \ddots & & \\ & & 1 & & \\ & & & \Huge 0 \end{pmatrix}=
\begin{pmatrix}\huge E_r&\huge O_{r,n-r}\\ \huge O_{m-r,r}& \huge O_{m-r,n-r}\end{pmatrix}$$
\(E_r\) は \(r\) 次の単位行列、\(O_{k,l}\) は \((k,l)\) 型の零行列を表す。

零行列の型を省略すれば、次のようになる。$$\begin{pmatrix} 1 & & & \\ & \ddots & & \\ & & 1 & & \\ & & & \Huge 0 \end{pmatrix}=
\begin{pmatrix}\huge E_r&\huge O\\ \huge O& \huge O\end{pmatrix}$$

ブロック行列

\((m,n)\) 型行列 \(A\) を \(p-1\) 本の横線と\(q-1\) 本の縦線によって \(pq\) 個の区画に分ける。上から \(s\) 番目、左から \(t\) 番目の区画の行列を \(A_{st}\) と表す。このようにして、次のように行列を表記することを行列の区分けという。$$A=\begin{pmatrix}A_{11}&A_{12}&\cdots &A_{1q}\\A_{21}&A_{22}&\cdots &A_{2q}\\ \vdots & \vdots &&\vdots\\A_{p1}&A_{p2}&\cdots &A_{pq}\end{pmatrix}$$
区分けされたこの行列をブロック行列という。

具体例

$$\begin{aligned}
&A_{11}=\begin{pmatrix}1&2\\5&6\end{pmatrix}, 
A_{12}=\begin{pmatrix}3&4\\7&8\end{pmatrix}\\
\\
&A_{21}=\begin{pmatrix}9&10\end{pmatrix}, 
A_{22}=\begin{pmatrix}11&12\end{pmatrix}\end{aligned}$$とするとき、$$\left(
\begin{array}{cc|cc}
1&2&3&4\\
5&6&7&8\\ \hline
9&10&11&12
\end{array}
\right)
=\begin{pmatrix}A_{11}&A_{12}\\A_{21}&A_{22}\end{pmatrix}$$

ブロック行列の積

\(A\in M_{m,n}, B\in M_{n,l}\) をブロック行列で表すとき、ブロック行列のまま積 \(AB\) を計算できる。ただし、対応する区画の行列との積が計算できるように \(A,B\) の区分けの仕方に注意する必要がある。

具体例

$$
\begin{aligned}
&A_{11}=\begin{pmatrix}1&2\\5&6\end{pmatrix}, 
A_{12}=\begin{pmatrix}3&4\\7&8\end{pmatrix}, 
&&B_{11}=\begin{pmatrix}1&2\\4&5\end{pmatrix}, 
B_{12}=\begin{pmatrix}3\\6\end{pmatrix}\\
\\
&A_{21}=\begin{pmatrix}9&10\end{pmatrix}, 
A_{22}=\begin{pmatrix}11&12\end{pmatrix}, 
&&B_{21}=\begin{pmatrix}7&8\\10&11\end{pmatrix}, 
B_{22}=\begin{pmatrix}9\\12\end{pmatrix}\end{aligned}
$$とおけば、\((3,4)\) 型行列と \((4,3)\) 型行列の積が次のように計算できる。この場合、計算規則は \(2\) 次正方行列の積と同じになる。
$$\begin{aligned}
\left(
\begin{array}{cc|cc}
1&2&3&4\\
5&6&7&8\\ \hline
9&10&11&12
\end{array}
\right)
\left(
\begin{array}{cc|c}
1&2&3\\
4&5&6\\ \hline
7&8&9\\
10&11&12
\end{array}
\right)
&=\begin{pmatrix}A_{11}&A_{12}\\A_{21}&A_{22}\end{pmatrix}
\begin{pmatrix}B_{11}&B_{12}\\B_{21}&B_{22}\end{pmatrix}\\
&=\begin{pmatrix}A_{11}B_{11}+A_{12}B_{21}&A_{11}B_{12}+A_{12}B_{22}\\
A_{21}B_{11}+A_{22}B_{21}&A_{21}B_{12}+A_{22}B_{22}\end{pmatrix}\end{aligned}$$

具体例

$$
\vec{a}_{1}=\begin{pmatrix}1\\4\\7\end{pmatrix}, 
\vec{a}_{2}=\begin{pmatrix}2\\5\\8\end{pmatrix}, 
\vec{a}_{3}=\begin{pmatrix}3\\6\\9\end{pmatrix}
$$とおけば、\(3\) 次正方行列と \(3\) 項列ベクトルの積が次のように計算できる。この積は、ベクトルのスカラー倍の和と表せる。
$$\begin{aligned}
\left(
\begin{array}{c|c|c}
1&2&3\\
4&5&6\\
7&8&9
\end{array}
\right)
\left(
\begin{array}{c}
x_1\\ \hline
x_2\\ \hline
x_3
\end{array}
\right)
&=\begin{pmatrix}\vec{a}_{1}&\vec{a}_{2}&\vec{a}_{3}\end{pmatrix}
\begin{pmatrix}x_{1}\\x_{2}\\x_{3}\end{pmatrix}\\
\\
&=x_1\vec{a}_1+x_2\vec{a}_2+x_3\vec{a}_3
\end{aligned}
$$

具体例

$$
A=\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{pmatrix}, \vec{b}_{1}=\begin{pmatrix}b_{11}\\b_{21}\\b_{31}\end{pmatrix}, 
\vec{b}_{2}=\begin{pmatrix}b_{12}\\b_{22}\\b_{32}\end{pmatrix}, 
\vec{b}_{3}=\begin{pmatrix}b_{13}\\b_{23}\\b_{33}\end{pmatrix}
$$とおけば、\(3\) 次正方行列同士の積が次のように計算できる。
$$\begin{aligned}
\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{pmatrix}
\left(
\begin{array}{c|c|c}
b_{11}&b_{12}&b_{13}\\
b_{21}&b_{22}&b_{23}\\
b_{31}&b_{32}&b_{33}
\end{array}
\right)
&=A\begin{pmatrix}\vec{b}_{1}&\vec{b}_{2}&\vec{b}_{3}\end{pmatrix}\\
\\
&=\begin{pmatrix}A\vec{b}_1&A\vec{b}_2&A\vec{b}_3\end{pmatrix}
\end{aligned}
$$

問題

ブロック行列の考え方を用いて、次を証明せよ。ただし、\(A,B\) は \(n\) 次正方行列とする。$$
AB=E \Longrightarrow A^{-1}=B$$

(証明)
\(A\) を基本変形して、階数標準形にする。このとき \(1\) が並ぶ個数を \(r\) とおき、\(r<n\) と仮定する。$$A\longrightarrow \begin{pmatrix}E_r&O\\ O&O\end{pmatrix}$$

この変形で用いた「行・列」に関する基本変形たちをそれぞれ、基本行列の積 \(P,Q\) で表せば、次のように表せる。$$PAQ=\begin{pmatrix}E_r&O\\ O&O\end{pmatrix}$$

さて、仮定より、$$AB=E$$\(P,Q\) がもとより正則であることから、$$(PAQ)(Q^{-1}BP^{-1})=E$$ここで、\(Q^{-1}BP^{-1}\) と \(E\) にもブロック行列の考え方を適用して、$$
\begin{pmatrix}E_r&O\\ O&O\end{pmatrix}
\begin{pmatrix}X_{11}&X_{12}\\X_{21}&X_{22}\end{pmatrix}
=\begin{pmatrix}E_r&O\\ O&E_{n-r}\end{pmatrix}$$このとき、\(X_{11}\) が \(r\) 次正方行列、\(X_{22}\) が \(n-r\) 次正方行列になるように \(Q^{-1}BP^{-1}\) を区分けしている。(このようにブロック行列の対角線上の行列が、全て正方行列になるような区分けの仕方を対称な区分けという。\(E\) も対称な区分けをした。)

左辺の積を計算し、\((2,2)\) 区画にくる行列を考えれば、\(O\) になることが分かる。これは、右辺の同じ区画の行列 \(E_{n-r}\) と異なる。ゆえに矛盾である。

したがって、\(r<n\) ではなく、\(r=n\) だと分かる。ゆえに \(A\) は基本変形で単位行列 \(E\) にすることができ、\(A\) は正則であると言える。\(AB=E\) の両辺の左から \(A^{-1}\) をかければ、\(B=A^{-1}\) が言える。(証明終)

正方行列 \(A\) の逆行列の定義は本来、次の式でした。$$AB=BA=E \Longleftrightarrow B=A^{-1}$$ところが、上の問題によって次が成り立つことが分かりました。$$AB=E \Longleftrightarrow B=A^{-1}$$同様に、次も成り立つことが示せます。$$BA=E \Longleftrightarrow B=A^{-1}$$

この結果を用いて階数標準形の一意性を示しましょう。

階数標準形の一意性

階数標準形への基本変形(一意性)

\((m,n)\) 型行列 \(A\) の階数標準形は一意的に定まる。

すなわち、基本変形の手順によらず、到達する階数標準形 \(\begin{pmatrix}E_r&O\\ O&O\end{pmatrix}\) は各行列 \(A\) に対し、ただ一つに決まっている。

問題

階数標準形の一意性を示せ。

(証明)\(2\) 通りの基本変形を \(A\) に行う。このとき、異なる階数標準形が \(2\) つ得られたとする。$$A \longrightarrow \begin{pmatrix}E_r&O\\O&O\end{pmatrix}, A \longrightarrow \begin{pmatrix}E_s&O\\O&O\end{pmatrix}$$このとき、\(r<s\) としても一般性を失わない。

基本変形は可逆だから、この \(2\) つの階数標準形は互いに基本変形で到達する。$$\begin{pmatrix}E_r&O\\O&O\end{pmatrix} \longleftrightarrow \begin{pmatrix}E_s&O\\O&O\end{pmatrix}$$
このとき、基本変形たちを表す正則行列 \(P,\) \(Q\)を用いて、次のように表せる。$$P\begin{pmatrix}E_r&O\\O&O\end{pmatrix}Q=\begin{pmatrix}E_s&O\\O&O\end{pmatrix}$$
各行列を適当なブロック行列で表す。ただし、対称な区分けにしておく。
$$\begin{pmatrix}P_{11}&P_{12}\\P_{21}&P_{22}\end{pmatrix}
\begin{pmatrix}E_r&O\\O&O\end{pmatrix}
\begin{pmatrix}Q_{11}&Q_{12}\\Q_{21}&Q_{22}\end{pmatrix}
=\begin{pmatrix}E_s&O\\O&O\end{pmatrix}$$
ブロック行列の積を計算すると、$$
\begin{pmatrix}P_{11}Q_{11}&P_{11}Q_{12}\\P_{21}Q_{11}&P_{21}Q_{12}\end{pmatrix}
=\left(
\begin{array}{c|c}
E_r&O\\ \hline
O&\begin{array}{cc}E_{s-r}&O\\O&O\end{array}
\end{array}
\right)
$$どちらの区分け方も同じだから、各区画の行列同士は等しい。

\(P_{11}Q_{11}=E_r\) より、\(P_{11}\) は正則。したがって、\(P_{11}Q_{12}=O\) より、\(Q_{12}=O\) になる。よって、\(P_{21}Q_{12}=O\) となるが、これは \(P_{21}Q_{12}=\begin{pmatrix}E_{s-r}&O\\O&O\end{pmatrix}\) と矛盾する。ゆえに \(r=s\) である。

よって、階数標準形は一意的でなければならない。(証明終)

階数標準形の一意性が示せたので、ここで初めて行列の階数を厳密に定義することができます。

rank (階数)の定義

\((m,n)\) 型行列 \(A\) の一意的に定まる階数標準形が次の形であるとする。 $$\begin{pmatrix}E_r&O\\ O&O\end{pmatrix}$$このとき、\(r\) を \(A\) の階数といい、次のように表す。$$\text{rank}A=r$$

階数(rank)の性質を表す具体例

具体例
  • \(P \in M_m, Q \in M_n\) が正則行列ならば、$$\text{rank}(PAQ)=\text{rank}A$$

正則行列は基本行列の積ですから、ここで言っていることは、基本変形では階数(rank)が変わらないということです。

証明

(証明)\(\text{rank}(PAQ)=r,\) \(\text{rank}A=s\) とおく。\(PAQ,\) \(A\) をそれぞれ基本変形して階数標準形にすることを考えれば、正則な行列 \(P_1,\) \(Q_1,\) \(P_2,\) \(Q_2\) を用いて、$$P_1PAQQ_1=\begin{pmatrix}E_r&O\\O&O\end{pmatrix}, P_2AQ_2=\begin{pmatrix}E_s&O\\O&O\end{pmatrix}$$\(P_1P,\) \(QQ_1\) はどちらも正則行列だから基本行列の積だと思える。したがって、上の \(2\) 等式の右辺はどちらも \(A\) を基本変形してできる階数標準形であるから、階数標準形の一意性より、\(r=s.\)(証明終)

具体例
  • 任意の \(A \in M_{m,n}\) に対し、次が成り立つ。$$\text{rank}\begin{pmatrix}A&O\\O&O\end{pmatrix}=\text{rank}A$$

これは感覚的には明らかでしょう。

証明

(証明)\(\text{rank}A=r\) とおくと、ある正則な行列 \(P,\) \(Q\) を用いて \(PAQ=\begin{pmatrix}E_r&O\\O&O\end{pmatrix}\) が成り立つ。このとき、\(\begin{pmatrix}P&O\\O&E\end{pmatrix},\) \(\begin{pmatrix}Q&O\\O&E\end{pmatrix}\) はどちらも正則行列である。なぜならば、\(\begin{pmatrix}P^{-1}&O\\O&E\end{pmatrix},\)\(\begin{pmatrix}Q^{-1}&O\\O&E\end{pmatrix}\) はそれぞれに対する逆行列になるからである。正則行列は基本行列の積である。ここで$$\begin{pmatrix}P&O\\O&E\end{pmatrix}\begin{pmatrix}A&O\\O&O\end{pmatrix}\begin{pmatrix}Q&O\\O&E\end{pmatrix}=\begin{pmatrix}\begin{pmatrix}E_r&O\\O&O\end{pmatrix}&\huge O\\\huge O&\huge O\end{pmatrix}=\begin{pmatrix}E_r&O\\O&O\end{pmatrix}$$となる(ブロック行列の区分けを最後に変えた)ので、\(\text{rank}\begin{pmatrix}A&O\\O&O\end{pmatrix}=r.\)(証明終)

具体例
  • 任意の \(A \in M_{m,n}\) に対し、次が成り立つ。
    $$\text{rank}A\leq m, \text{rank}A\leq n$$

階数(rank)は行列の型によって制限されています。

証明

(証明)\(\text{rank}A=r\) とおくと、\(A\) の階数標準形は、\(\begin{pmatrix}E_r&O\\O&O\end{pmatrix}.\) この行列も \((m,n)\) 型だから、\(r \leq m,n\) でなければならない。(証明終)

具体例
  1. 任意の \(A \in M_{m,n}, B \in M_{n,p}\) に対し、次が成り立つ。
    $$ \text{rank}(AB) \leq \text{rank}A, \text{rank}(AB) \leq \text{rank}B$$
  2. \(m\neq n\) ならば、次を満たす \(A \in M_{m,n},\) \(B \in M_{n,m}\) は存在しない。$$AB=E_m, BA=E_n$$

この具体例によって次のことが分かります。

  1. 階数(rank)は他の行列との積をとると小さくなる傾向があります。
  2. 逆行列は正方行列にのみ考えられる概念です。(正方行列でなくとも一般逆行列というものを考えることはできるが、これはあまり使われない。)
証明
  1. \(\text{rank}A=r,\) \(\text{rank}B=s\) とおく。このとき、ある正則な行列 \(P_1,\) \(Q_1,\) \(P_2,\) \(Q_2\) を用いて、\(P_1AQ_1=\begin{pmatrix}E_r&O\\O&O\end{pmatrix},\) \(P_2BQ_2=\begin{pmatrix}E_s&O\\O&O\end{pmatrix}\) と表せる。ここで、\(Q_1^{-1}P_2^{-1}=\begin{pmatrix}X_{11}&X_{12}\\X_{21}&X_{22}\end{pmatrix}\) と区分けしておく。ただし、\(X_{11}\) が \((r,s)\) 型行列となるような区分けである。このとき、$$
    \begin{aligned}
    \text{rank}(AB)&=\text{rank}(P_1ABQ_2)\\
    \\
    &=\text{rank}(P_1AQ_1Q_1^{-1}P_2^{-1}P_2BQ_2) \\
    \\
    &=\text{rank}(
    \begin{pmatrix}E_r&O\\ O&O\end{pmatrix}
    \begin{pmatrix}X_{11}&X_{12}\\ X_{21}&X_{22}\end{pmatrix}
    \begin{pmatrix}E_s&O\\ O&O\end{pmatrix})\\
    \\
    &=\text{rank}\begin{pmatrix}X_{11}&O\\ O&O\end{pmatrix}\\
    \\
    &=\text{rank}X_{11}\leq r,s\\
    \\
    \end{aligned}
    $$
  2. \(m<n\) としても一般性を失わない。もし、条件を満たす \(A \in M_{m,n},\) \(B \in M_{n,m}\)が存在するならば、$$
    \begin{aligned}
    n&=\text{rank}(BA)\\
    \\
    &\leq \text{rank}B\\
    \\
    &\leq m
    \end{aligned}
    $$よって、矛盾が生じることが分かる。