Voordat we normaalvormen voor reële matrices behandelen die een karakteristieke veelterm hebben met niet-reële wortels, gaan we nader in op het uitbreiden van een reële vectorruimte naar een complexe en de vraag hoe de oorspronkelijke reële vectorruimte weer terug te vinden is uit de complex vectorruimte.
Laat #V# een reële vectorruimte zijn. Bekijk de verzameling
\[V_{\mathbb{C} }= V + \ii V\]
bestaande uit alle vectoren van de vorm #\vec{x}+\ii\vec{y}#, waarbij #\vec{x}# en #\vec{y}# vectoren zijn van #V#, en de optelling formeel is (dus ook gezien kan worden als het stel #\rv{\vec{x},\vec{y}}#). Dit is een complexe vectorruimte als het voorzien wordt van de volgende bewerkingen:
\[\begin{array}{rclcl}\text{scalaire vermenigvuldiging}&:&(a+b\ii)(\vec{x}+\ii\vec{y}) &=&(a\cdot\vec{x}-b\cdot\vec{y})+\ii(b\cdot\vec{x}+a\cdot\vec{y})\\ \text{vectoroptelling}&:&(\vec{x}+\ii\vec{y}) +(\vec{u}+\ii\vec{v})&=&(\vec{x}+\vec{u})+\ii(\vec{y}+\vec{v})\end{array}\] We noemen dit de uitbreiding van #V# tot een complexe vectorruimte.
De afbeelding #\sigma : V_{\mathbb{C} }\to V_{\mathbb{C} }# gedefinieerd door #\sigma(\vec{x}+\ii\vec{y}) = \vec{x}-\ii\vec{y}# voor \(\vec{x},\vec{y}\) in #V# heet complexe conjugatie. Deze afbeelding is halflineair / semi-lineair, wat betekent dat, voor alle complexe getallen #\lambda# en #\mu# en alle vectoren #\vec{u}# en #\vec{w}# van #V_{\mathbb{C} }# geldt
\[\sigma(\lambda\cdot\vec{u}+\mu\cdot\vec{w}) = \overline{\lambda}\cdot\sigma(\vec{u}) +\overline{\mu}\cdot\sigma(\vec{w})\] waarbij #\overline{\lambda}# de complex geconjugeerde van #\lambda# aangeeft.
Als #\alpha# een basis is voor #V#, dan is #\alpha# ook een basis voor #V_{\mathbb{C} }#. In het bijzonder hebben #V# en #V_{\mathbb{C} }# gelijke dimensie.
Als #A# een reële #(n\times n)#-matrix is, dan is #L_A# op te vatten als een lineaire afbeelding #V\to V#, waarbij #V=\mathbb{R}^n# of #V = \mathbb{C}^n#. In het geval #V=\mathbb{R}^n# is de afbeelding #\left(L_A\right)_{\mathbb C}# gelijk aan de afbeelding #L_A: \mathbb{C}^n\to \mathbb{C}^n# van het tweede geval. Er is dus weinig verwarring tussen de interpretatie van #L_A# als een lineaire afbeelding met een reële vectorruimte als domein en als een lineaire afbeelding op een complexe vectorruimte.
Het feit dat #\sigma# semi-lineair is, volgt uit de volgende twee berekeningen, waarbij we #\Re(\vec{x}+\ii\vec{y})=\vec{x}# en #\Im(\vec{x}+\ii\vec{y}) =\vec{y}# schrijven voor \(\vec{x},\vec{y}\) in #V#:
\[\begin{array}{rcl} \sigma(\vec{u}+\vec{w}) &=& \sigma( \Re(\vec{u})+\ii \Im(\vec{u})+\Re(\vec{w})+\ii\Im(\vec{w}) )\\&=& \sigma( \Re(\vec{u})+\Re(\vec{w})+\ii(\Im(\vec{u})+\Im(\vec{w}) ))\\&=&\Re(\vec{u})+\Re(\vec{w})-\ii(\Im(\vec{u})+\Im(\vec{w}) )\\&=&\Re(\vec{u})-\ii\Im(\vec{u})+\Re(\vec{w})-\ii\Im(\vec{w}) \\ &=& \sigma(\vec{u}) +\sigma(\vec{w})\\ \\ \sigma(\lambda\cdot\vec{u}) &=& \sigma( (\Re\lambda+\ii\Im\lambda)(\Re(\vec{u})+\ii \Im(\vec{u})) )\\&=& \sigma( \Re\lambda\cdot\Re(\vec{u}) -\Im\lambda\cdot\Im(\vec{u})+\ii (\Im\lambda\cdot\Re(\vec{u}) +\Re\lambda\cdot \Im(\vec{u})))\\ &=&\Re\lambda\cdot\Re(\vec{u}) -\Im\lambda\cdot\Im(\vec{u})-\ii (\Im\lambda\cdot\Re(\vec{u}) +\Re\lambda\cdot \Im(\vec{u}))\\&=&(\Re\lambda-\ii\Im\lambda)\cdot(\Re(\vec{u}) -\ii \Im(\vec{u}))\\ &=& \overline{\lambda}\cdot \sigma(\vec{u}) \end{array}\]
Bij de term complexe conjugatie ligt verwarring op de loer: complexe conjugatie van de elementen van de matrix \[A = \matrix{2+3\ii&0\\ 0&2-3\ii}\] levert \[\sigma(A) = \matrix{2-3\ii&0\\ 0&2+3\ii}\] terwijl conjugatie over #\mathbb{C}# van #A# een matrix van de vorm #T\,A\,T^{-1}# oplevert waarbij #T# een inverteerbare #(2\times2)#-matrix is. De tweede bewerking noemen we daarom nadrukkelijk niet 'complexe conjugatie'. In het bijzondere geval waar #T # de permutatiematrix is bij de permutatie #[1,2]#, geven de twee bewerkingen voor bovenstaande matrix #A# overigens hetzelfde resultaat.
Om een complexe vectorruimte als een reële ruimte te zien is geen uitbreiding nodig:
Een complexe vectorruimte #W# is op te vatten als een reële vectorruimte door beperking van scalairen. Dit betekent dat we alleen de reële getallen van #W# als scalairen zien. We schrijven #\left.W\right|_{\mathbb{R}}# om deze reële vectorruimte aan te geven.
Laat #V# een reële vectorruimte zijn. Na beperking van scalairen voor #W = V_{\mathbb{C} }# wordt de semilineaire afbeelding complexe conjugatie #\sigma:W\to W# een lineaire afbeelding #\left.W\right|_{\mathbb{R}}\to\left.W\right|_{\mathbb{R}}# met de eigenschap dat #V# de eigenruimte van #\sigma# bij eigenwaarde #1# is en #\ii V# de eigenruimte van #\sigma# bij eigenwaarde #-1#.
Als #\alpha# een basis is voor #W#, dan is #\alpha\cup\ii\alpha# een basis voor #\left.W\right|_{\mathbb{R}}#. In het bijzonder is de dimensie van #\left.W\right|_{\mathbb{R}}# twee maal zo groot als de dimensie van #W#.
Als we met een reële vectorruimte #V# beginnen, de scalairen uitbreiden om \(V_{\mathbb{C} }\) te verkrijgen en we vervolgens de scalaire beperken, dan krijgen we de reële vectorruimte \(U = \left.V_{\mathbb{C} }\right|_{\mathbb{R} }\) waar #V# weliswaar een deelruimte van is, maar waarvan de dimensie tweemaal die van #V# is. De vraag hoe we #V# hieruit weer terug vinden, kan op verschillende manieren beantwoord worden. De uitspraak over #\sigma# geeft één methode: de minimumveelterm van #\sigma # is gelijk aan #x^2-1#, zodat
\[U = \ker{C-I_U}\oplus\ker{C+I_U},\phantom{xxx}\text{ waarbij }\phantom{xxx} V =\ker{C-I_U} \]
De andere term in de directe som is #\ker{C+I_U} = \ii V#.
Als #L:V\to V#, dan bepaalt #L # een unieke lineaire afbeelding #L_{\mathbb{C}}:V_{\mathbb{C} }\to V_{\mathbb{C} }#. Deze afbeelding commuteert met #C#, zodat #V = \ker{C-I_U}# invariant is onder #L_{\mathbb{C}}#. Verder is de beperking van #L_{\mathbb{C}}# tot #V# gelijk aan #L#. Omdat de karakteristieke veelterm van #L_{\mathbb{C}}# een product van lineaire factoren is, kunnen we een basis #\alpha# voor #V_{\mathbb{C} }# vinden, zodat de matrix #\left(L_{\mathbb{C}}\right)_\alpha# een Jordanvorm heeft. Met behulp van het reële deel en imaginaire deel van deze basis zullen we een basis #\beta# van #V# vinden zodat #L_\beta = \left(\left.L_{\mathbb{C}}\right|_V\right)_{\beta}# een vorm heeft die zeer dicht bij de bekende Jordannormaalvorm komt.
Bekijk de diagonaalmatrix \[A = \matrix{\lambda&0\\ 0&\overline{\lambda}}\] waarbij #\lambda # een niet-reëel complex getal is en #\overline\lambda# de complex geconjugeerde van #\lambda # is. Deze matrix is geconjugeerd met de reële matrix \[B = \matrix{\Re\lambda & -\Im\lambda\\ \Im\lambda & \Re\lambda}\] Dit volgt direct uit het feit dat de karakteristieke veeltermen van #A# en van #B# beide gelijk zijn aan #x^2-2\Re\lambda \cdot x+\lambda\cdot\overline\lambda#, want twee #(2\times2)#-matrices met twee dezelfde (onderling verschillende) eigenwaarden zijn altijd geconjugeerd.
Als we van de matrix #B# uitgaan, dan zullen we na bepaling van complexe eigenwaarden de diagonaalvorm #A# vinden.
Andersom kunnen we, uitgaande van #A# als hierboven, als volgt een reële matrix geconjugeerd met #A# (zoals #B#) vinden: we zoeken een 2-dimensionale reële deelruimte #V# van #\left.{\mathbb{C}^2}\right|_{\mathbb{R}}# die door #A# invariant gelaten wordt. Dit komt neer op het bepalen van een inverteerbare #(2\times2)#-matrix #T=(t_{ij})#, zodat #V# opgespannen wordt door de kolomvectoren #T(\vec{e}_1)# en #T(\vec{e}_2)#. De matrix van #L_A# ten opzichte van de basis #\basis{\matrix{t_{11}\\ t_{21}},\matrix{t_{12}\\ t_{22}}}# voor #V# moet reële elementen hebben. Deze matrix is #T^{-1}AT#, zodat de complex geconjugeerde #\sigma(T^{-1}AT)# van deze matrix gelijk moet zijn aan #T^{-1}AT#. Verder is de complex geconjugeerde #\sigma(A)# van #A# geconjugeerd met #A# via #P=\matrix{0&1\\ 1&0}#. Hiermee gaan we aan de slag om een oplossing te vinden voor #T#:
\[\begin{array}{rcl}\sigma(T^{-1}AT)&=&T^{-1}AT\\ &&\phantom{xxx}\color{blue}{\text{deze matrix moet reële elementen hebben}}\\ \sigma(T^{-1})\sigma(A)\sigma(T)&=&T^{-1}AT\\ &&\phantom{xxx}\color{blue}{\text{complexe conjugatie van som en product is }}\\&&\phantom{xxx}\color{blue}{\text{som en product van complexe conjugatie}}\\ \sigma(T^{-1})PAP^{-1}\sigma(T)&=&T^{-1}AT\\ &&\phantom{xxx}\color{blue}{\sigma(A) = PA P^{-1}}\\ \left(T\sigma(T^{-1})P\right)A&=&A\left(T\sigma(T^{-1})P\right)\\&&\phantom{xxx}\color{blue}{\text{ van links met }T\text{ vermenigvuldigd}}\\ &&\phantom{xxx}\color{blue}{\text{ van rechts met }\sigma(T)^{-1}P\text{ vermenigvuldigd}} \\ T\sigma(T^{-1})P&=&I_2\\&&\phantom{xxx}\color{blue}{\text{dit is voldoende voor een oplossing (niet noodzakelijk)}}\\ T &=&P\sigma(T)\\&&\phantom{xxx}\color{blue}{\text{ van rechts met }P^{-1}\sigma(T)\text{ vermenigvuldigd; }P^{-1} = P}\\\matrix{t_{11}&t_{12}\\ t_{21}& t_{22}} &=&\matrix{\overline{t_{21}}&\overline{t_{22}}\\ \overline{t_{11}}& \overline{t_{12}}}\\&&\phantom{xxx}\color{blue}{T=(t_{ij})\text{ ingevuld en matrixvermenigvuldiging uitgewerkt}}\\T &=& \matrix{t_{11}&{t_{12}}\\\overline{t_{11}}& \overline{t_{12}}}\\&&\phantom{xxx}\color{blue}{\text{ oplossing voor }t_{21},\ t_{22}\text{ ingevuld}}\\ T &=& \matrix{1&\ii\\ 1&-\ii}\\&&\phantom{xxx}\color{blue}{\text{ oplossing }t_{11}=1,\ t_{12}=\ii\text{ gekozen zodat }T^{-1}\text{ bestaat}}\\T^{-1}A\,T &=&\dfrac{1}{2\ii} \matrix{\ii&\ii\\ 1&-1}\matrix{\lambda&0\\ 0&\overline{\lambda}} \matrix{1&\ii\\ 1&-\ii}\\ &=&\dfrac{1}{2}\matrix{\lambda+\overline{\lambda}&\ii({\lambda}-\overline\lambda)\\ \ii(\overline{\lambda}-\lambda)&\lambda+\overline{\lambda}} \\&=&\matrix{\Re\lambda&-\Im\lambda\\\Im\lambda&\Re\lambda}\\ &=& B\end{array}\]Hiermee hebben we de conjugator #T# gevonden die #A# met #B# conjugeert.
Zoals we later zullen zien, is het mogelijk om in elke conjugatieklasse van reële #(n\times n)#-matrices een unieke matrix te vinden, uitgaande van de complexe Jordannormaalvorm. Maar met de stelling hieronder is eenvoudig na te gaan wanneer twee reële #(n\times n)#-matrices geconjugeerd zijn, namelijk wanneer ze als complexe matrices geconjugeerd zijn.
Als twee reële #(n\times n)#-matrices geconjugeerd zijn over #\mathbb{C}#, dan zijn ze ook geconjugeerd over #\mathbb{R}#.
Stel dat twee #(n\times n)#-matrices #A# en #B# geconjugeerd zijn over #\mathbb{C}#. Dan is er een complexe inverteerbare matrix #T# zodat \(B = T^{-1}\,A\,T\). Na vermenigvuldiging van links met #T# aan beide zijden geeft dit \[A\,T =T\,B\]Schrijf #T = K +\ii \cdot L#, waarbij #K=\Re T# en #L = \Im T# het reële en imaginaire deel zijn van #T#. Dan geldt \[A\,K = K\,B\phantom{xxx}\text{ en }\phantom{xxx}A\,L = L\,B\]dus
\[A\,(K+x\cdot L) =(K+x\cdot L) \,B\phantom{xxx}\text{ voor elk getal }\phantom{xx}x\]
Het is dus voldoende om het bestaan van een reëel getal #x# af te leiden waarvoor #K+x\cdot L# inverteerbaar is. Bekijk daartoe de determinant #\det(K+x\cdot L)# als functie van #x#. Omdat #K# en #L# reëel zijn, is dit een veeltermfunctie van graad #n# in #x# met reële coëfficiënten. Aangezien \(K+\ii\cdot L=T\) inverteerbaar is, geldt #\det(K+\ii\cdot L)\ne0# zodat de veeltermfunctie niet de nulfunctie is. De veeltermfunctie heeft dus hoogstens #n# nulpunten, zodat er een reële waarde van #x# moet zijn, waarvoor #\det(K+x\cdot L)\ne0#, zodat #K+x\cdot L# een reële inverteerbare matrix is. Hiermee is het feit bewezen.
In het complexe geval weten we al dat twee #(n\times n)#-matrices dan en slechts dan geconjugeerd zijn als ze dezelfde Jordannormaalvorm hebben. De onderhavige stelling vertelt ons dat dit ook voldoende is om vast te stellen of twee reële #(n\times n)#-matrices geconjugeerd zijn. Het bewijs van de stelling laat zien hoe, als dit het geval is, een reële conjugerende matrix #S# gevonden kan worden uitgaande van een complexe conjugerende matrix #T#. Het vinden van de Jordanvorm bestaat uit het vinden van een geschikte basis voor #V#; de complexe conjugerende matrix #T# bestaat uit de kolommen die bij die basis behoren.
Zo kunnen we voor elk tweetal #(n\times n)#-matrices bepalen of ze geconjugeerd zijn en zelfs een conjugerende matrix aanwijzen. De reële Jordanvorm van zo'n matrix, die we hierna behandelen, is (op permutatie van de Jordanblokken na) een unieke matrix uit de conjugatieklasse van #A#.
Bekijk de #(2\times2)#-matrix \[A = \matrix{0 & -5 \\ 1 & 2 \\ }\]De minimumveelterm van #A# is gelijk aan de karakteristieke veelterm:
\[m_A(x) = p_A(x) =x^2-2 x+ 5\]De wortels van deze veelterm zijn #1-2 \complexi# en #2 \complexi+1#. De bijbehorende eigenvectoren zijn respectievelijk #\matrix{5 \\ 2 \complexi-1 \\ }# en # \matrix{5 \\ -2 \complexi-1 \\ }#. De matrix #A# is dus geconjugeerd met de complexe diagonaalmatrix \[ D = \matrix{1-2 \complexi &0\\ 0& 2 \complexi+1}\] De bijbehorende coördinatentransformatie is \[T = \matrix{5 & 5 \\ 2 \complexi-1 & -2 \complexi-1 \\ }\] zodat \( T^{-1} \, A\, T = D\).
De matrices #T# en #D# zijn niet-reëel. Als we #L_A#, #L_D# en #L_T# opvatten als lineaire transformaties van #\mathbb{C}^2#, dan spannen de eigenvectoren (de kolommen van #T#) elk een invariante complexe deelruimte van #\mathbb{C}^2# op van dimensie #1#. Door van de eerste eigenvector, #\matrix{5 \\ 2 \complexi-1 \\ }#, het reële en imaginaire deel te nemen, vinden we een basis voor de oorspronkelijke reële vectorruimte #\mathbb{R}^2# ten opzichte waarvan #L_A# een reële matrix heeft. Bepaal die matrix.
#\matrix{1 & -2 \\ 2 & 1 \\ }#
Door beperking van scalairen kunnen we de lineaire afbeelding #L_A:\mathbb{C}^2\to \mathbb{C}^2# opvatten als lineaire afbeelding #\left.\left(L_D\right)\right|_{\mathbb{R}}:U\to U#, waarbij #U =\left.\mathbb{C}^2\right|_{\mathbb{R}}#.
Als basis voor #V# kiezen we het reële en complexe deel van de eigenvector #\matrix{5 \\ 2 \complexi-1 \\ }# bij eigenwaarde #1-2 \complexi#:
\[\Re \matrix{5 \\ 2 \complexi-1 \\ } = \matrix{5 \\ -1 \\ } \phantom{xxx}\text{ en }\phantom{xxx} \Im \matrix{5 \\ 2 \complexi-1 \\ } =\matrix{0 \\ 2 \\ }\] De bijbehorende overgangsmatrix is #S = \matrix{5 & 0 \\ -1 & 2 \\ } #. De matrix van #A# ten opzichte van deze basis is
\[\begin{array}{rcl} {S}^{-1}\,A\,S &=& {\matrix{{{1}\over{5}} & 0 \\ {{1}\over{10}} & {{1}\over{2}} \\ }}\, \matrix{0 & -5 \\ 1 & 2 \\ }\, \matrix{5 & 0 \\ -1 & 2 \\ }\\
&=& \matrix{1 & -2 \\ 2 & 1 \\ }\end{array}\]
Als we met de eigenvector van #2 \complexi+1# werken in plaats van de eigenvector van #1-2 \complexi#, dan krijgen we de overgangsmatrix #\overline{S} = \matrix{5 & 0 \\ -1 & -2 \\ }#. De matrix van #A# ten opzichte van de bijbehorende basis is
\[\begin{array}{rcl} {\overline{S}}^{-1}\,A\,\overline{S} &=& {\matrix{{{1}\over{5}} & 0 \\ -{{1}\over{10}} & -{{1}\over{2}} \\ }}\, \matrix{0 & -5 \\ 1 & 2 \\ }\, \matrix{5 & 0 \\ -1 & -2 \\ }\\
&=& \matrix{1 & 2 \\ -2 & 1 \\ }\end{array}\]Zoals de notatie met de streep boven #S# suggereert, is deze basis de complex geconjugeerde van de kolommen van #S#.
De matrices #{S}^{-1}\,A\,S# en #{\overline{S}}^{-1}\,A\,\overline{S}# zijn geconjugeerd door middel van #\matrix{0&1\\ 1&0}#:
\[ \matrix{1 & 2 \\ -2 & 1 \\ } =\matrix{0&1\\ 1&0} \matrix{1 & -2 \\ 2 & 1 \\ } \matrix{0&1\\ 1&0} = \matrix{0&1\\ 1&0}^{-1} \matrix{1 & -2 \\ 2 & 1 \\ } \matrix{0&1\\ 1&0}\] De matrices #S^{-1} A S# en #{\overline{S}}^{-1}\,A\,\overline{S}# zijn de reële #(2\times2)#-matrices ten opzichte van de basis #\basis{1,\ii}# die horen bij complexe vermenigvuldiging met respectievelijk #1-2 \complexi# en #2 \complexi+1#.