Bij een lineaire afbeelding #L# van een #n#-dimensionale vectorruimte #V# naar zichzelf hoort een matrix #A=L_\alpha# zodra we een basis #\alpha# voor #V# gekozen hebben. Is #L_\beta# de matrix ten opzichte van een tweede basis #\beta# voor #V#, dan zijn #L_\alpha# en #L_\beta# geconjugeerd, dat wil zeggen: er bestaat een inverteerbare #(n\times n)#-matrix #T#, zodat #L_\beta=T^{-1}\,L_\alpha\,T#. De overgangsmatrix #T = {}_\alpha I_\beta# voldoet bijvoorbeeld.
We brengen in herinnering dat een matrix #A# diagonaliseerbaar als hij geconjugeerd is met een diagonaalmatrix, en dat niet alle matrices diagonaliseerbaar zijn. Hier bespreken we een normaalvorm die voor alle matrices gevonden kan worden. We beginnen met matrices waarvan de karakteristieke veelterm maar één wortel heeft.
Elke #(n\times n)#-matrix #A# met eigenwaarde #\lambda# en karakteristieke veelterm #(\lambda-x)^n# kan door conjugatie in Jordannormaalvorm (kortweg: Jordanvorm) gebracht worden; dat wil zeggen: er is een inverteerbare matrix #S# zodat
\[
S^{-1}AS=J=\left(\begin{array}{ccc} J_{i_1} & & \\ & \ddots & \\ & & J_{i_k}
\end{array}\right)
\] waarbij de #(i\times i)#-matrix #J_{i}# gelijk is aan
\[
J_{i}=\left(\begin{array}{cccc}\lambda & 1 & & \\ & \lambda & \ddots & \\
& & \ddots & 1\\ & & & \lambda
\end{array}\right)
\]en het Jordanblok ter grootte #i# bij eigenwaarde #\lambda# wordt genoemd.
Het aantal Jordanblokken #j_i# ter grootte #i# voldoet aan
\[j_i =2\,\dim{\ker{(A-\lambda\,I_n)^{i}}}-\dim{\ker{(A-\lambda\,I_n)^{i+1}}}-\dim{\ker{(A-\lambda\,I_n)^{i-1}}}\]
Stel dat #B# ook een #(n\times n)#-matrix is met eigenwaarde #\lambda# waarvan de karakteristieke veelterm #(\lambda-x)^n# is. Dan zijn #A# en #B# dan en slechts dan geconjugeerd als de aantallen Jordanblokken ter grootte #i# overeenkomen voor alle #i = 1,\ldots,n#.
Voor een diagonaliseerbare matrix hebben alle Jordanblokken grootte #1#.
Er kunnen meerdere Jordanblokken bij de eigenwaarde #\lambda# van dezelfde dimensie zijn. Het totale aantal Jordanblokken is gelijk aan de dimensie van de bijbehorende eigenruimte #E_\lambda#, de nulruimte #\ker{A-\lambda I}#.
Aan de Jordanvorm #J# van #A# zien we onmiddellijk wat de karakteristieke veelterm van de matrix #A# is: #\det(A-x\cdot I_n)=\det(J-x\cdot I_n)=(\lambda-x)^{n}#. Een eenvoudig voorbeeld wordt geleverd door de matrices #\matrix{0&0\\ 0&0}# en #\matrix{0&1\\ 0&0}#, die beide karakteristieke veelterm #x^2# hebben.
Voor het bepalen van de Jordanvorm bij #r# eigenwaarden hoeven we alleen de dimensies #e_{\lambda_s,i}# te bepalen van de nulruimten # \ker{(A-\lambda_s\cdot I_n)^i}#, waarbij #s=1,\ldots,r# en #i# loopt van #1# tot #\ell_s#, de multipliciteit van #\lambda_s# in de minimumveelterm, gelijk aan de kleinste index #i# waarvoor #e_{\lambda_s,i}# maximaal is.
Eerst leiden we de Jordannormaalvorm voor #A# af. Het is voldoende de stelling te bewijzen voor #\lambda = 0#. Want als dit bewezen is, dan passen we dat resultaat toe op #A-\lambda\,I_n# met eigenwaarde #0#. Bij de Jordanblokken die we dan vinden voor #A-\lambda\,I_n#, hoeven we alleen nog het scalaire veelvoud met #\lambda# van de identiteit op te tellen om de Jordanvorm voor #A# te vinden.
Laat #\ell# de graad van de minimumveelterm van #A# zijn. Dan is #\ell# het kleinste getal, zodat #A^\ell=0_n#. Voor elk positief geheel getal #r \le \ell# kiezen we een complement #U_{r}# van #\ker{A^{r-1}}+ \left(\im{A}\cap\ker{A^r}\right)# in #\ker{A^r}#. Dit betekent dat we de volgende directesomdecompositie hebben:
\[
\ker{A^r}=
\left (\ker{A^{r-1}} + \im{A}\cap \ker{A^{r}}\right) \oplus{U_r}
\]We beweren dat #V# de directe som is van de deelruimten #A^{j}U_{r}# voor #0 \le j \lt r \le \ell#.
Om dit in te zien, bewijzen we eerst dat #V# gelijk is aan de som #U# van de deelruimten #A^{j}U_{r}#. Daartoe stellen we achtereenvolgens voor iedere #i=\ell,\ell-1,\ldots,1# de volgende claim vast:
\[
\im{A} \cap \ker{A^{i}}
\subseteq \ker{A^{i-1}}+ U
\]Het geval #i=\ell# komt neer op de inclusie #\im{A}\cap\ker{A^\ell}\subseteq\ker{A^{\ell-1}}# die direct volgt uit #A\, A^{\ell-1} = A^\ell = 0_n#. Stel daarom #i \lt \ell# en neem aan dat de claim bewezen is voor #i+1,\ldots,\ell#.
Stel #\vec{v} \in \im{A}\cap \ker{A^i}#. Dan is er een vector #\vec{w}\in \ker{A^{i+1}}# zodanig dat #\vec{v} = A\vec{w}#. Uit de aanname volgt
\[\begin{array}{rcl}
\ker{A^{i+1}}&=&
\left (\ker{A^{i}} + \im{A}\cap \ker{A^{i+1}}\right)
\oplus{U_{i+1} }\\ &&\phantom{xx}\color{blue}{\text{definitie }U_{r}}\\ &\subseteq&
\ker{A^{i}}
+
\im{A}\cap\ker{A^{i+1}} +U\\&&\phantom{xx}\color{blue}{U_{i+1}\subseteq U}\\
&\subseteq& \ker{A^{i}} + U\\ &&\phantom{xx}\color{blue}{\text{aanname}}\end{array}
\]waaruit we concluderen dat #\vec{v} = A\vec{w} \in A(\ker{A^i})+A\,U\subseteq \ker{A^{i-1}} + U#. Hiermee hebben we de claim vastgesteld voor #i=\ell,\ldots,1#. Bijgevolg geldt voor elke #r\le\ell# \[\ker{A^r} = \left (\ker{A^{r-1}} + \im{A}\cap \ker{A^r}\right) \oplus {U_r}\subseteq \ker{A^{r-1}} + U\]
zodat
\[\begin{array}{rcl} V & = & \ker{A^\ell}\\ &&\phantom{xx}\color{blue}{A^\ell = 0_n}\\ & \subseteq & \ker{A^{\ell -1}}+U\\ &&\phantom{xx}\color{blue}{\text{claim}}\\&\vdots&\\ & \subseteq & \ker{A^{0}}+U\\ &&\phantom{xx}\color{blue}{\text{claim}}\\ & =& U\\ &&\phantom{xx}\color{blue}{\text{claim}}\\\end{array}\]Hiermee hebben we vastgesteld dat #V# de som is van de deelruimten #A^{j}U_{r}# voor #0 \le j \lt r \le \ell#.
Om te laten zien dat deze som een directe som is, moeten we nog nagaan dat de doorsnede van een summand #A^{j}U_{r}# met de som van alle andere summanden uitsluitend uit de nulvector bestaat. Dit volgt direct uit de volgende uitspraak:
Als #\sum_{j,r} A^{j}\vec{x}_{j,r} =\vec{0}#, waarbij #0\le j \lt r\le \ell# en #\vec{x}_{j,r}\in U_{r}#, dan geldt #\vec{x}_{j,r} = \vec{0}# voor alle #j, r#.
Immers, als, voor een willekeurige vector #\vec{x}_{j,r}# ongelijk aan de nulvector, het beeld #A^{j}\vec{x}_{j,r} # tot een som van andere summanden dan #A^{j}U_{r}# van #U# behoort, dan is er een niet-triviale lineaire combinatie als in deze uitspraak te vinden, wat tot een tegenspraak leidt met de aanname dat #\vec{x}_{j,r}# ongelijk aan de nulvector is.
Stel dat deze uitspraak niet waar is. Dan zijn er indices #j# en #r#, zodat #\vec{x}_{j,r}\ne\vec{0}#. Omdat #\vec{x}_{j,r}# doorsnede #\{\vec{0}\}# met #\ker{A^{r-1}}# heeft, geldt dan ook #A^{r-1}\vec{x}_{j,r}\ne\vec{0}#, en, omdat #j\lt r#, dus ook #A^{j} \vec{x}_{j,r}\ne\vec{0}#. Er is dus een maximale index #i\lt \ell#, zodat voor een of andere #r# geldt #A^{r-i}\vec{x}_{r-i,r}\neq \vec{0}#.
Bijgevolg is #A^{r-m}\vec{x}_{r-m,r}= \vec{0}# voor elke #r# en #m# met #m\gt i#. Daarom kan de gelijkheid in de aanname van de uitspraak herschreven worden als
\[\begin{array}{rcl}\vec{0}&=&\displaystyle\sum_{j,r} A^{j}\vec{x}_{j,r}\\ &&\phantom{xxx}\color{blue}{\text{gelijkheid in aanname}}\\&=&\displaystyle\sum_{r=1}^\ell\left(\sum_{j=0}^{r-1}A^{j}\vec{x}_{j,r}\right)\\ &&\phantom{xxx}\color{blue}{j\lt r}\\&=&\displaystyle\sum_{r=i}^\ell\left(\sum_{j=r-i}^{r-1}A^{j}\vec{x}_{j,r}\right)\\ &&\phantom{xxx}\color{blue}{A^{j}\vec{x}_{j,r}=\vec{0}\text{ voor elke }r\text{ en }j\text{ met }j\lt r- i}\\&=&\displaystyle\sum_{r=i}^\ell A^{r-i}\vec{x}_{r-i,r}+\sum_{r=i}^\ell\left(\sum_{j=r-i+1}^{r-1}A^{j}\vec{x}_{j,r}\right)\\ &&\phantom{xxx}\color{blue}{\text{eerste term van sommatie over }j\text{ afgezonderd}}\\&=&\displaystyle\sum_{r=i}^\ell A^{r-i}\vec{x}_{r-i,r}+\sum_{r=i}^\ell\sum_{m=1}^{i-1}A^{r-m}\vec{x}_{r-m,r}\\ &&\phantom{xxx}\color{blue}{\text{sommatie over }j\text{ herschreven als sommatie over }m}\end{array}\]Het rechter lid is gelijk aan de nulvector, dus moet gelden:
\[\sum_{r=i}^\ell A^{r-i}\vec{x}_{r-i,r}=-\sum_{r=i}^\ell\sum_{m=1}^{i-1}A^{r-m}\vec{x}_{r-m,r}\]Omdat #\vec{x}_{r-m,r}\in U_r\subseteq\ker{A^r}# geldt #A^{r-m}\vec{x}_{r-m,r}\in\ker{A^m}#. Omdat de maximale waarde van #m# in de sommatie gelijk is aan #i-1#, ligt het rechter lid van bovenstaande gelijkheid in #\ker{A^{i-1}}#. Hieruit volgt hetzelfde voor het linker lid:
\[
\sum_{r=i}^{\ell} A^{r-i}\vec{x}_{r-i,r} \in\ker{A^{i-1}}
\]Schrijf #\vec{y}= \sum_{r=i+1}^{\ell} A^{r-i-1}\vec{x}_{r-i,r}# en #\vec{x}=\sum_{r=i}^{\ell}A^{r-i}\vec{x}_{r-i,r}#, zodat\[\vec{x}-A\vec{y}=\vec{x}_{0,i}\]Uit #\vec{x}_{0,i}\in U_i\subseteq\ker{A^i}# en #\vec{x}\in\ker{A^{i-1}}# volgt \[\vec{0}=A^i\vec{x}_{0,i}=A^i(\vec{x}-A\vec{y})= A^i\vec{x}-A^{i+1}\vec{y}=-A^{i+1}\vec{y}\] zodat #\vec{y}\in\ker{A^{i+1}}# en #A\vec{y}\in\ker{A^i}#. Bovendien geldt duidelijk dat #A\vec{y}\in\im{A}#. We zien dus dat #\vec{x}_{0,i}# enerzijds in #U_i# zit en anderzijds te schrijven is als de som van een vector #\vec{x}# uit #\ker{A^{i-1}}# en een vector #-A\vec{y}# uit de doorsnede van #\im{A}# en #\ker{A^i}#:\[\vec{x}_{0,i}\in\left(\ker{A^{i-1}}+ \im{A} \cap\ker{A^i}\right)\cap U_i=\{ \vec{0}\}\]zoals volgt uit de definitie van #U_i#. We vinden dat #\vec{x}_{0,i} = \vec{0}# en #\vec{x} = A\vec{y}#. Hieruit volgt samen met #\vec{x}\in\ker{A^{i-1}}# dat #\vec{y}\in\ker{A^i}#. Door voor #\vec{y}# te redeneren als hierboven voor #\vec{x}# (met #i+1# in plaats van #i#), enzovoort, vinden we #\vec{x}_{1,i+1}=\cdots =\vec{x}_{\ell-i,\ell}=\vec{0}#. Maar dit spreekt de betekenis van #i# tegen.
We hebben laten zien dat #V# de directe som is van de deelruimten #A^{j}U_{r}#. Voor elke #r =\ell,\ell-1,\ldots,1# kiezen we nu een basis #\basis{\vec{v}_{r,1},\ldots,\vec{v}_{r,j_r}}# van #U_{r}#. Dan krijgen we #j_r# Jordanblokken #J_r# ten opzichte van de basis bestaande uit #A^{r-1}\vec{v}_{r,k}, A^{r-2}\vec{v}_{r,k}, \ldots, \vec{v}_{r,k}# voor #k=1,\ldots,j_r#. Door deze vectoren aaneen te schakelen voor #r=\ell, \ell-1, \ldots,1# krijgen we een basis van de hele vectorruimte waarop de matrix van #A# de vereiste vorm aanneemt.
Voor een bewijs van de formule schrijven we #e_i = \dim{\ker{(A-\lambda\,I_n)^i}}#. Een Jordanblok ter grootte #i# is gedefinieerd op een stel onafhankelijke vectoren in #\ker{(A-\lambda\,I_n)^i}#. In deze laatste deelruimte komt van elk Jordanblok dat grotere lengte heeft dan #i#, precies één basisvector. Dit aantal is #j_{i+1}+\cdots+j_k#. Bovendien zijn er in #\ker{(A-\lambda\,I_n)^i}# precies #e_{i-1}# basisvectoren bevat in #\ker{(A-\lambda\,I_n)^{i-1}}#. Er blijven #e_i-e_{i-1}-(j_{i+1}+\cdots+j_k)# basisvectoren over in #\ker{(A-\lambda\,I_n)^i}#, die elk tot een uniek Jordanblok ter grootte #i# behoren. We concluderen dat
\[j_i = e_i-e_{i-1}-(j_{i+1}+\cdots+j_k)\]Deze uitspraak is waar voor alle natuurlijke getallen #i#. In het bijzonder geldt
\[j_{i+1} = e_{i+1}-e_{i}-(j_{i+2}+\cdots+j_k)\]Toepassing van deze formules geeft
\[\begin{array}{rcl}j_{i} &=&e_i-e_{i-1}-(j_{i+1}+\cdots+j_k)\\ &&\phantom{xxx}\color{blue}{\text{formule voor }j_i}\\ &=&e_i-e_{i-1}-j_{i+1}-(j_{i+2}+\cdots+j_k)\\ &&\phantom{xxx}\color{blue}{j_{i+1} \text{ apart gezet}}\\ &=&e_i-e_{i-1}-(e_{i+1}-e_{i}-(j_{i+2}+\cdots+j_k))-(j_{i+2}+\cdots+j_k)\\ &&\phantom{xxx}\color{blue}{\text{formule voor }j_{i+1}}\\ &=&2e_i-e_{i-1}-e_{i+1}\\&&\phantom{xxx}\color{blue}{\text{vereenvoudigd}}\\\end{array}\]
Nu gaan we na waarom twee #(n\times n)#-matrices #A# en #B# waarvan de karakteristieke veelterm #(\lambda-x)^n# is voor zekere #\lambda#, dan en slechts dan geconjugeerd zijn als de aantallen Jordanblokken ter grootte #i# overeenkomen voor alle #i = 1,\ldots,n#. Vanwege het voorgaande weten we dat elk van de twee matrices geconjugeerd is met een Jordanvorm en dat de lijst van grootten van de bijbehorende Jordanblokken op volgorde na aan elkaar gelijk zijn. Twee Jordanblokken in een matrix kunnen verwisseld worden door conjugatie met een permutatiematrix, waarbij de basis van het ene blok verwisseld wordt met de basis van het andere; de bijbehorende permutatie wisselt de basisvectoren voor het ene Jordanblok om met die voor het andere Jordanblok. Zo doorgaande met verwisseling van Jordanblokken kunnen we er voor zorgen dat een Jordanvorm voor #A# door conjugatie met een permutatiematrix overgaat in een Jordanvorm voor #B#. Hiermee is vastgesteld dat, als #A# en #B# dezelfde aantallen Jordanblokken ter grootte #i# hebben voor alle #i = 1,\ldots,n#, ze geconjugeerd zijn.
Ten slotte merken we op dat #A# en #B# niet geconjugeerd zijn als een aantal Jordanblokken ter grootte #i# verschilt voor een #i#. Dit volgt uit het feit dat de getallen #j_i# in bovenstaande formules uitgedrukt zijn in termen van de dimensies van de kernen van #\left(A-\lambda\, I_n\right)^i#, getallen die niet veranderen als #A# door een geconjugeerde vervangen wordt.
We geven een alternatief bewijs voor de stelling door een basis #\alpha# te construeren ten opzichte waarvan #A# een Jordanvorm #J# aanneemt. We zullen zien dat de #n# basisvectoren van #\alpha# geheel bestaan uit gegeneraliseerde eigenvectoren van #A#. Dit is mogelijk omdat #\dim{E_\lambda^*}=n#, zoals bekend uit Gegeneraliseerde eigenruimte.
Een vector #\vec{a}# die voldoet aan #B^{r-1}\vec{a}\neq\vec{0}# en #B^r\vec{a}=\vec{0}# voor #B\equiv A-\lambda I# en een zeker natuurlijk getal #r# heet een gegeneraliseerde eigenvector van rang #r# met eigenwaarde #\lambda#. Een gewone eigenvector is dus een gegeneraliseerde eigenvector van rang #1#. De hoogste rang die een gegeneraliseerde eigenvector kan hebben, is gelijk aan de multipliciteit #\ell# van #\lambda# in de minimumveelterm, omdat alle gegeneraliseerde eigenvectoren zijn bevat in de gegeneraliseerde eigenruimte #E_\lambda^*=\ker{B^\ell}#.
De lineaire deelruimte \[E_{\lambda,r}^*\equiv\ker{B^r}\setminus\ker{B^{r-1}}+\{\vec{0}\}\] van #E_\lambda^*# bestaat uit de nulvector en alle gegeneraliseerde eigenvectoren van rang #r\in\{1,\ldots,\ell\}#. Merk op dat #E_{\lambda,1}^*=E_\lambda#. Eerder zagen we dat #e_{r-1}<e_r# voor #r=1,\ldots,\ell# waarin #e_r\equiv\dim{\ker{B^r}}#. Hieruit volgt #\ker{B^{r-1}}\subset\ker{B^r}# en dus dat de gegeneraliseerde eigenruimte de directe som is van de lineaire deelruimten van eigenvectoren van rang #1# tot en met #\ell#:\[E_\lambda^*=E_{\lambda,1}^*\oplus\cdots\oplus E_{\lambda,\ell}^*\] Bovendien geldt \[\begin{array}{rcll}\hat{e}_r&\equiv&\dim{E_{\lambda,r}^*}&\color{blue}{\text{definitie }\hat{e}_r}\\&=&\dim{\ker{B^r}\setminus\ker{B^{r-1}}}+\dim{\{\vec{0}\}}&\color{blue}{\text{definitie }E_{\lambda,r}^*}\\&=&\dim{\ker{B^r}}-\dim{\ker{B^{r-1}}}&\color{blue}{\ker{B^{r-1}}\subset\ker{B^r}\text{ en }\dim{\{\vec{0}\}}=0}\\&=&e_r-e_{r-1}&\color{blue}{\text{definitie }e_r}\end{array}\]zodat de dimensie #\hat{e}_r# van de lineaire deelruimte #E_{\lambda,r}^*# een positief natuurlijk getal is voor alle #r=1,\ldots,\ell#. Merk op dat #\hat{e}_1=e_1# gelijk is aan de meetkundige multipliciteit van #\lambda#. Bovenstaande bevindingen zijn consistent met het bekende resultaat hieronder:\[\begin{array}{rcl}\dim{E_\lambda^*}&=&\displaystyle\sum_{r=1}^\ell\dim{E_{\lambda,r}^*}\\&&\color{blue}{\text{bovenstaande ontbinding }E_\lambda^*=E_{\lambda,1}^*\oplus\cdots\oplus E_{\lambda,\ell}^*}\\&=&\displaystyle\sum_{r=1}^\ell\hat{e}_r\\&&\color{blue}{\text{definitie }\hat{e}_r}\\&=&\displaystyle\sum_{r=1}^\ell\left(e_r-e_{r-1}\right)\\&&\color{blue}{\hat{e}_r=e_r-e_{r-1}}\\&=&\displaystyle\sum_{r=1}^\ell e_r-\sum_{r=1}^\ell e_{r-1}\\&&\color{blue}{\text{sommatie gesplitst}}\\&=&\displaystyle\sum_{r=1}^\ell e_r-\sum_{r=0}^{\ell-1}e_r\\&&\color{blue}{\text{sommatie herschreven}}\\&=&e_\ell-e_0\\&&\color{blue}{\text{vereenvoudigd}}\\&=&e_\ell\\&&\color{blue}{e_0=\dim{\ker{B^0}}=\dim{\ker{I}}=\dim{\{\vec{0}\}}=0}\\&=&n\\&&\color{blue}{\text{bekend resultaat uit theorie}\textit{ Gegeneraliseerde eigenruimte}}\end{array}\]Dankzij de directesomontbinding kunnen we een basis #\alpha# voor #E_\lambda^*# vormen die volledig bestaat uit basisvectoren van #E_{\lambda,r}^*# voor #r=1,\ldots,\ell#. Ten opzichte van deze basis zal #A# een Jordanvorm #J# aannemen.
Een basisvector van #E_{\lambda,r}^*# is een gegeneraliseerde eigenvector #\vec{a}_r\neq\vec{0}# van rang #r#. Dit betekent dat #B^r\vec{a}_r=\vec{0}# en #B^i\vec{a}_r\neq\vec{0}# voor #i=0,\ldots,r-1#, immers \[\vec{a}_r\notin\ker{B^{r-1}}\supset\ker{B^{r-2}}\supset\ldots\supset\ker{B}\] Definieer #\vec{a}_{r-1}\equiv B\vec{a}_r#. Uit #\vec{a}_r\notin\ker{B}# volgt #\vec{a}_{r-1}\neq\vec{0}#. Uit #\vec{a}_r\in\ker{B^r}# volgt #B^{r-1}\vec{a}_{r-1}=B^r\vec{a}_r=\vec{0}# zodat #\vec{a}_{r-1}\in\ker{B^{r-1}}#. Uit #\vec{a}_r\notin\ker{B^{r-1}}# volgt #B^{r-2}\vec{a}_{r-1}=B^{r-1}\vec{a}_r\neq\vec{0}# zodat #\vec{a}_{r-1}\notin\ker{B^{r-2}}#. Tezamen betekent dit #\vec{a}_{r-1}\in\ker{B^{r-1}}\setminus\ker{B^{r-2}}\subset E_{\lambda,r-1}^*#. Voor elke basisvector #\vec{a}_r# uit #E_{\lambda,r}^*# bestaat er dus een basisvector #\vec{a}_{r-1}# uit #E_{\lambda,r-1}^*#. Hierdoor zitten er minstens zoveel basisvectoren in #E_{\lambda,r-1}^*# als in #E_{\lambda,r}^*# zodat \[\hat{e}_r\geq\hat{e}_{r+1}\quad\text{ voor }r=1,\ldots,\ell-1\]Het volgende plaatje maakt dit duidelijk:
\[\begin{array}{|ccc|}\hline\phantom{X}&\ker{B^3}&\phantom{X}\\ \phantom{X}& \begin{array}{|ccccc|}\hline\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\ker{B^2}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}& \begin{array}{|ccccccc|}\hline \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\ker{B}&\phantom{X}&\phantom{X}&\phantom{X}\\\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\\hline \end{array} &\phantom{X}&\phantom{X}\\\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\ \phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}&\phantom{X}\\\hline \end{array}&\phantom{X}\\\phantom{X}&\phantom{X}&\phantom{X}\\\hline\end{array}\]
De dimensies van de kernen #\ker{B^r}# nemen toe met #r#, maar de groeisnelheid van deze dimensies blijft gelijk of neemt af met #r#.
Nu gaan we de basis #\alpha# vormen ten opzichte waarvan #A# een Jordanvorm #J# aanneemt. Begin met een basisvector #\vec{a}_\ell\in E_{\lambda,\ell}^*#. Dankzij #\hat{e}_r\geq\hat{e}_{r+1}# bestaan er zeker basisvectoren \[B\vec{a}_\ell\in E_{\lambda,\ell-1}^*,\quad B^2\vec{a}_\ell\in E_{\lambda,\ell-2}^*,\quad\ldots,\quad B^{\ell-1}\vec{a}_\ell\in E_{\lambda,1}^*(=E_\lambda)\] die allemaal ongelijk aan de nulvector en lineair onafhankelijk van elkaar zijn omdat ze uit verschillende deelruimten komen die enkel de nulvector gemeen hebben. We kunnen de eerste #\ell# basisvectoren van #\alpha# als volgt kiezen:\[\alpha:\quad\basis{\vec{a}_1,\ldots,\vec{a}_\ell,\ldots}=\basis{B^{\ell-1}\vec{a}_\ell,B^{\ell-2}\vec{a}_\ell,\ldots,B^2\vec{a}_\ell,B\vec{a}_\ell,\vec{a}_\ell,\ldots}\]We zeggen dat dit gedeelte van de basis wordt gegenereerd door de gegeneraliseerde eigenvector #\vec{a}_\ell# van rang #\ell#. Ten opzichte van deze basis verschijnt het eerste Jordanblok in de linkerbovenhoek van de matrix #J#, zoals we hieronder aantonen.
De eerste kolom van #J# is het beeld onder #A# van de eerste basisvector #\vec{a}_1=B^{\ell-1}\vec{a}_\ell# van #\alpha#:\[\begin{array}{rcl}A\vec{a}_1&=&AB^{\ell-1}\vec{a}_\ell\\&=&(A-\lambda I)B^{\ell-1}\vec{a}_\ell+\lambda B^{\ell-1}\vec{a}_\ell\\&=&BB^{\ell-1}\vec{a}_\ell+\lambda B^{\ell-1}\vec{a}_\ell\\&=&B^\ell\vec{a}_\ell+\lambda B^{\ell-1}\vec{a}_\ell\\&=&\lambda B^{\ell-1}\vec{a}_\ell\\&=&\lambda\vec{a}_1\end{array}\]Het beeld onder #A# van de eerste basisvector van #\alpha# is dus gelijk aan #\lambda# maal de eerste basisvector. Dit betekent dat het #(1,1)#-element van #J# gelijk is aan #\lambda# terwijl de overige elementen in de eerste kolom van #J# gelijk aan nul zijn.
De #r#-de kolom van #J# is het beeld onder #A# van de #r#-de basisvector #\vec{a}_r=B^{\ell-r}\vec{a}_\ell# van #\alpha# voor #r=2,\ldots,\ell#:\[\begin{array}{rcl}A\vec{a}_r&=&AB^{\ell-r}\vec{a}_\ell\\&=&(A-\lambda I)B^{\ell-r}\vec{a}_\ell+\lambda B^{\ell-r}\vec{a}_\ell\\&=&BB^{\ell-r}\vec{a}_\ell+\lambda B^{\ell-r}\vec{a}_\ell\\&=&B^{\ell-r+1}\vec{a}_\ell+\lambda B^{\ell-r}\vec{a}_\ell\\&=&\vec{a}_{r-1}+\lambda\vec{a}_r\end{array}\]Dit betekent dat het #(r,r)#-element van #J# gelijk is aan #\lambda# en het element daarboven gelijk aan #1#, terwijl de overige elementen in de #r#-de kolom van #J# allemaal gelijk aan nul zijn.
De grootte van dit Jordanblok is #\ell#, dat wil zeggen, het Jordanblok is een #(\ell\times\ell)#-deelmatrix van #J#. Op dezelfde manier als hierboven kunnen we voor elke basisvector in #E_{\lambda,\ell}^*# een Jordanblok maken van grootte #\ell#. Het aantal Jordanblokken van grootte #\ell# is dus gelijk aan #j_\ell=\hat{e}_\ell=\dim{E_{\lambda,\ell}^*}#.
Nadat we #\hat{e}_\ell# Jordanblokken van grootte #\ell# hebben gemaakt, hebben we #\hat{e}_\ell# basisvectoren gebruikt uit #E_{\lambda,\ell-1}^*#. We kunnen dus nog maar #j_{\ell-1}=\hat{e}_{\ell-1}-\hat{e}_\ell# Jordanblokken van grootte #\ell-1# vormen.
Nadat we #\hat{e}_\ell# Jordanblokken van grootte #\ell# en #\hat{e}_{\ell-1}-\hat{e}_\ell# Jordanblokken van grootte #\ell-1# hebben gemaakt, hebben we \[\hat{e}_\ell+\left(\hat{e}_{\ell-1}-\hat{e}_\ell\right)=\hat{e}_{\ell-1}\] basisvectoren gebruikt uit #E_{\lambda,\ell-2}^*#. We kunnen dus nog maar #j_{\ell-2}=\hat{e}_{\ell-2}-\hat{e}_{\ell-1}# Jordanblokken van grootte #\ell-2# vormen.
Als we zo doorgaan, zien we dat we #j_r=\hat{e}_r-\hat{e}_{r+1}# Jordanblokken van grootte #r# kunnen vormen ten opzichte van de gedeelten van de basis die worden gegenereerd door eigenvectoren van rang #r#. Met #\hat{e}_r=e_r-e_{r-1}# vinden we\[\begin{array}{rcl}j_r=\hat{e}_r-\hat{e}_{r+1}=2e_r-e_{r-1}-e_{r+1}\end{array}\]Deze relatie geldt voor alle natuurlijke getallen #r# vanwege #e_0=0# en #e_\ell=e_{\ell+i}# voor alle natuurlijke getallen #i#.
Omdat we voor elk Jordanblok precies één vector uit #\ker{B}# hebben gebruikt, is het totale aantal Jordanblokken gelijk aan de meetkundige multipliciteit van #\lambda#:\[\begin{array}{rcll}\displaystyle\sum_{r=1}^\ell j_r&=&\displaystyle\sum_{r=1}^\ell\left(\hat{e}_r-\hat{e}_{r+1}\right)&\color{blue}{\text{bovenstaande formule}}\\&=&\displaystyle\sum_{r=1}^\ell\hat{e}_r-\sum_{r=1}^\ell\hat{e}_{r+1}&\color{blue}{\text{sommatie gesplitst}}\\&=&\displaystyle\sum_{r=1}^\ell\hat{e}_r-\sum_{r=2}^{\ell+1}\hat{e}_r&\color{blue}{\text{sommatie herschreven}}\\&=&\hat{e}_1-\hat{e}_{\ell+1}&\color{blue}{\text{sommatie uitgevoerd}}\\&=&\hat{e}_1&\color{blue}{\hat{e}_{\ell+1}=0}\\&=&e_1&\color{blue}{\hat{e}_1=e_1}\end{array}\]Bovendien kunnen we de multipliciteit #\ell# van #\lambda# in de minimumveelterm aflezen uit #J# als de grootte van het grootste Jordanblok. De matrix #A# is dus dan en slechts dan diagonaliseerbaar als #\ell=1#, in overeenstemming met de stelling Herkenning van diagonaliseerbaarheid aan de hand van de minimumveelterm voor het geval waarin #A# slechts één eigenwaarde heeft.
De deelruimte #U_r# met #r=1,\ldots,\ell# uit het bewijs bevat alle genererende basisvectoren van rang #r#.
Omdat de blokken bij een directesomdecompositie horen, is #n=\dim{V}# de som van de dimensies van de Jordanblokken. Dit betekent dat \[n = \sum_{i=1}^\ell i\cdot j_i\]waarin #\ell# de multipliciteit van #\lambda# in de minimumveelterm is. Enerzijds kan bovenstaande formule gebruikt worden als een verificatie van alle gevonden waarden van #j_i#. Anderzijds is de formule een sleutel tot de interpretatie van de aantallen #j_i# als een partitie van #n#, dat wil zeggen een manier om #n# te schrijven als een som van natuurlijke getallen. Hierbij geeft #j_i# het aantal termen in de som gelijk aan #i# aan. De volgorde van de termen is niet van belang.
De partitie \[n = \underbrace{1+1+\cdots+1}_{j_1\text{ termen}}+\underbrace{2+2+\cdots+2}_{j_2\text{ termen}}+\cdots\]bepaalt de Jordannormaalvorm #J # bij #\lambda# met langs de diagonaal #j_1# Jordanblokken ter grootte #1#, vervolgens #j_2# Jordanblokken ter grootte #2#, en zo voorts. Hierdoor is de Jordannormaalvorm bij #\lambda# uniek bepaald (op de volgorde van de Jordanblokken, en dus op conjugatie met een permutatiematrix, na). Omdat twee #(n\times n)#-matrices #A# en #B# met dezelfde karakteristieke veelterm #(\lambda-x)^n# dan en slechts dan geconjugeerd zijn als de aantallen Jordanblokken #j_i# van grootte #i# overeenkomen voor alle #i=1,\ldots,n#, is het aantal conjugatieklassen gelijk aan het aantal mogelijke partities van #n#.
We passen deze resultaten toe op de matrix van een lineaire afbeelding #L:V\to V# beperkt tot elk van haar gegeneraliseerde deelruimten. De informatie over de Jordanblokken bepaalt de conjugatieklasse van matrices bij #L# uniek.
Stel dat #V# een vectorruimte is van eindige dimensie #n#, dat #L:V\to V# een lineaire afbeelding is en dat de karakteristieke veelterm #p_L(x)# van #L# een product is van lineaire factoren:
\[p_L(x) = (\lambda_1-x)^{k_1}\cdot(\lambda_2-x)^{k_2}\cdots (\lambda_r-x)^{k_r}\]
waarbij #\lambda_1,\ldots,\lambda_r# onderling verschillend zijn.
Dan zijn er unieke getallen \[j_{\lambda_s,i}\phantom{xxx} \text{ met }\phantom{xxx} s=1,\ldots,r\phantom{xx}\text{ en }\phantom{xx} i = 1,\ldots,k_s\] zodat de matrix van de beperking van #L# tot de gegeneraliseerde eigenruimte bij #\lambda_s# ten opzichte van een geschikt gekozen basis een Jordannormaalvorm heeft met #j_{\lambda_s,i}# blokken ter grootte #i#.
Een lineaire afbeelding #M:V\to V# heeft dan en slechts dan dezelfde matrix als #L# ten opzichte van een geschikt gekozen basis voor #V# als ze dezelfde eigenwaarden heeft als #L# en dezelfde grootten #j_{\lambda_s,i}# (voor #i=1,\ldots,k_s#) van Jordanblokken bij elke eigenwaarde #\lambda_s# (voor #s=1,\ldots,r#).
Hiermee is het conjugatieprobleem opgelost voor complexe vectorruimten, want dan is elke veelterm een product van lineaire factoren. In het reële geval kan de karakteristieke veelterm kwadratische factoren hebben met niet-reële complexe wortels. Dit geval wordt later besproken.
Volgens de directesomdecompositie kunnen we #V# schrijven als de directe som van de gegeneraliseerde eigenruimten # E_\lambda^*#, waarbij #\lambda# de wortels #\lambda_1,\ldots,\lambda_r# van #p_L(x)# doorloopt. Omdat #E_\lambda^*# invariante deelruimten zijn van #V# onder #L# en omdat de volgorde ervan onder conjugatie met een permutatie naar een willekeurige andere volgorde omgezet kan worden, kunnen we ons beperken tot het vinden en bestuderen van de Jordannormaalvorm voor elk van #\lambda_1,\ldots,\lambda_r#. Het resultaat voor #L# beperkt tot elk van de gegeneraliseerde deelruimten volgt uit bovenstaande stelling De Jordanvorm bij één eigenwaarde.
De informatie over de grootten van de Jordanblokken volstaat om de minimumveelterm vast te leggen: Als #\ell_s# het maximum is van de grootten #j_{\lambda_s,i}# (voor #i=1,\ldots,k_s#) van de Jordanblokken bij eigenwaarde #\lambda_s# (voor #s=1,\ldots,r#), dan is
\[m_A(x) = \prod_{s=1}^r (x-\lambda_s)^{\ell_s}\]
Om de conjugatieklasse van een complexe vierkante matrix vast te leggen, kunnen we dus een tabel gebruiken waarin voor elke eigenwaarde de grootten van de bijbehorende Jordanblokken worden beschreven. Om de uniciteit van de Jordannormaalvorm te garanderen zouden we de Jordanblokken die voorkomen langs de diagonaal in de Jordannormaalvorm moeten ordenen. Toch maken we ons hier niet druk om, omdat we weten dat elke volgorde in elke andere volgorde omgezet kan worden door middel van een permutatiematrix en omdat eenvoudig na te gaan is of tabellen met eigenwaarden en grootten van bijbehorende Jordanblokken onderling gelijk zijn.
Voor de conjugatieklasse van een complexe #(n\times n)#-matrix #A# hebben we nu dus een goede karakterisatie gevonden: de eigenwaarden #\lambda# met de aantallen #j_{\lambda,i}# van de Jordanblokken ter grootte #i# voor elke #i# bij elke eigenwaarde #\lambda# bepalen de conjugatieklasse uniek.
Deze gegevens zijn equivalent met de dimensies #e_{\lambda,i}# van de kernen van #(A-\lambda\cdot I_n)^i#. We hebben al gezien dat de aantallen #j_{\lambda,i}# uit de dimensies #e_{\lambda,i}# volgen dankzij de formule\[j_{\lambda,i}=2e_{\lambda,i}-e_{\lambda,i-1}-e_{\lambda,i+1}\]
Andersom is eenvoudig in te zien dat
\[e_{\lambda,i} = e_{\lambda,i-1}+j_{\lambda,i}+j_{\lambda,i+1}+\cdots+j_{\lambda,\ell}\]
waarbij #\ell# de multipliciteit van #\lambda# in de minimumveelterm #m_A(x)# van #A# is.
Voor de interpretatie in termen van Jordannormaalvorm zijn de getallen #j_{\lambda,i}# nuttig. Voor berekeningen zijn de getallen #e_{\lambda,i}# iets gunstiger: enerzijds volgen ze direct uit de bepaling van dimensies van de kernen (of beelden) van lineaire afbeeldingen, anderzijds vormen ze een strikt stijgende rij die stopt bij de index #\ell#:\[e_{\lambda,1}\lt e_{\lambda,2}\lt\cdots \lt e_{\lambda,\ell} = e_{\lambda,\ell+1}=\cdots=\dim{E_\lambda^*}\]
Bekijk de matrix \[ A = \matrix{3 & 0 & 0 & -1 \\ -1 & 2 & 1 & 2 \\ 0 & 2 & 1 & -1 \\ 0 & -1 & 1 & 3 \\ } \]De karakteristieke veelterm van deze matrix is gelijk aan # \left(x-3\right) \left(x-2\right)^3 #. De eigenwaarden van #A# zijn dus #2# en #3#.
Welke van onderstaande matrices is een Jordannormaalvorm van #A#?
#\text{Jordannormaalvorm voor }A=# #\matrix{2 & 1 & 0 & 0 \\ 0 & 2 & 1 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 3 \\ }#
Omdat de multipliciteit van #2# in de karakteristieke veelterm gelijk is aan #3#, is de dimensie van de gegeneraliseerde eigenruimte #E_{2}^*# gelijk aan # {3}#. Omdat de multipliciteit van #3# in de karakteristieke veelterm gelijk is aan #1#, is de dimensie van de gegeneraliseerde eigenruimte #E_{3}^*# gelijk aan # 1#.
Om de grootte van de Jordanblokken te bepalen, berekenen we eerst de dimensies van #\ker{(A-\lambda\,I_4)^i}# voor de eigenwaarden #\lambda = 2#, # 3# en #i=1,2#. Als #i\ge 3#, dan is deze dimensie gelijk aan #3# voor #\lambda = 2# en als #i\ge 1# dan is deze dimensie gelijk aan #1# voor #\lambda = 3#.
\[\begin{array}{l|r}\text{deelruimte}\phantom{i}&\text{dimensie}\\
\hline
\ker{(A-2\,I_4)^{3}}& 3\\
\ker{(A-2\,I_4)^{2}}&2\\
\ker{A-2\,I_4}&1\\
\ker{A-3\,I_4}&1\\
\hline
\end{array}\]Volgens stelling
De Jordanvorm bij één eigenwaarde zijn de aantallen #j_1#, #j_2#, #j_3# Jordanblokken van #A# bij eigenwaarde #2# ter grootte #1#, #2#, respectievelijk #3# als volgt te bepalen (niet alle stappen zijn nodig omdat de dimensie #3# van de gegeneraliseerde eigenruimte al bereikt is na de eerste stap):
\[\begin{array}{rcrcl}
j_3 &=&
2\dim{\ker{(A-2 I_4)^{3}}}-\dim{\ker{(A-2 I_4)^{4}}}-\dim{\ker{(A-2 I_4)^{2}}}&=&1\\
j_2 &=&
2\dim{\ker{(A-2 I_4)^{2}}}-\dim{\ker{(A-2 I_4)^{3}}}-\dim{\ker{(A-2 I_4)^{1}}}&=&0\\
j_1 &=&
2\dim{\ker{(A-2 I_4)}}-\dim{\ker{(A-2 I_4)^{2}}}-\dim{\ker{I_4}}&=&0\\
\end{array}\]Net zo vinden we dat alleen het aantal Jordanblokken ter grootte #1# ongelijk aan nul is bij eigenwaarde #3#. We concluderen dat #A#
- op de gegeneraliseerde eigenruimte bij #2# precies één Jordanblok ter grootte #3# heeft,
- op de gegeneraliseerde eigenruimte bij #3# precies één Jordanblok ter grootte #1# heeft.
Vanwege de overeenkomst in grootte van de Jordanblokken, concluderen we dat #A# een Jordanvorm heeft gelijk aan \[\matrix{2 & 1 & 0 & 0 \\ 0 & 2 & 1 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 3 \\ }\]