We hebben gezien dat een lineaire afbeelding #L# van een eindigdimensionale reële of complexe vectorruimte #V# naar zichzelf niet altijd diagonaliseerbaar is, zelfs niet als #V# complex is. Het probleem is dat de dimensie van de eigenruimte van #L# met betrekking tot een wortel van de karakteristieke veelterm kleiner kan zijn dan de multipliciteit van die wortel in #p_L(x)#. Denk aan #V = \mathbb{R}^2# en #L=L_A# voor #A=\matrix{0&1\\ 0&0}# met karakteristieke veelterm #p_L(x) = x^2#. De wortel #0# heeft multipliciteit #2# en de dimensie van de eigenruimte van #L# bij eigenwaarde #0# is #1#.
We behandelen dit tweede probleem in twee stappen. Eerst wijzen we een invariante deelruimte van #V# aan die groter kan zijn dan de eigenruimte bij een gegeven wortel #\lambda# van de karakteristieke veelterm, maar waarop de beperking van #L# tot die deelruimte een karakteristieke veelterm heeft die een macht van #x-\lambda# is. Later geven we een basis voor die deelruimte aan waarop de restrictie van #L# dicht bij een diagonaalvorm komt.
Laat #V# een vectorruimte zijn, #L:V\to V# een lineaire afbeelding, en #\lambda# een eigenwaarde van #L#. De gegeneraliseerde eigenruimte van #L# met betrekking tot #\lambda# is de deelruimte \(E_\lambda^*\) bestaande uit alle vectoren #\vec{v}# van #V# waarvoor een natuurlijk getal #k# bestaat, zodat #(L-\lambda\, I_V)^k(\vec{v}) = \vec{0}#. Deze deelruimte is invariant onder #L#.
Om na te gaan dat de gegeneraliseerde eigenruimte inderdaad een lineaire deelruimte van #V# is, merken we eerst op dat #\vec{0}# tot \(E_\lambda^*\) behoort. Verder, als #\vec{v}# in \(E_\lambda^*\) ligt dan is er volgens de definitie een geheel getal #k# zodat #(L-\lambda\, I_V)^k(\vec{v}) = \vec{0}#. Als #\alpha# een scalar is, dan geldt \[ (L-\lambda\, I_V)^k(\alpha \vec{v}) = \alpha (L-\lambda\, I_V)^k(\vec{v}) =\alpha\,\vec{0} = \vec{0}\] zodat ook \(\alpha\, \vec{v}\) tot \(E_\lambda^*\) behoort. Laat ten slotte #\vec{w}# ook een vector in \(E_\lambda^*\) zijn. Dan is er een natuurlijk getal #\ell#, zodat #(L-\lambda\, I_V)^\ell(\vec{w}) = \vec{0}#. Nu geldt voor #m=\max(k,\ell)# \[\begin{array}{rcl}(L-\lambda\, I_V)^m(\vec{v}+\vec{w})& =& (L-\lambda\, I_V)^m(\vec{v})+(L-\lambda\, I_V)^m(\vec{w})\\&&\phantom{xxx}\color{blue}{(L-\lambda\, I_V)^m\text{ is een lineaire afbeelding}}\\& =& (L-\lambda\, I_V)^{m-k}(L-\lambda\, I_V)^{k}(\vec{v})+(L-\lambda\, I_V)^{m-\ell}(L-\lambda\, I_V)^{\ell}(\vec{w})\\&&\phantom{xxx}\color{blue}{\text{samenstelling van lineaire afbeeldingen herschreven}}\\ & =& (L-\lambda\, I_V)^{m-k}(\vec{0})+(L-\lambda\, I_V)^{m-\ell}(\vec{0})\\&&\phantom{xxx}\color{blue}{\text{ keuze van }k,\, \ell }\\ &=&\vec{0}+\vec{0} \\&&\phantom{xxx}\color{blue}{(L-\lambda\, I_V)^n\text{ is een lineaire afbeelding}}\\ &&\phantom{xxx}\color{blue}{\text{voor alle }n\in\mathbb{N}\text{ inclusief }n=0}\\ &=& \vec{0}\end{array}\]waaruit volgt dat \(\vec{v}+\vec{w}\) bevat is in \(E_\lambda^*\).
Hiermee is aangetoond dat \(E_\lambda^*\) een lineaire deelruimte is van #V#.
Om de invariantie van \(E_\lambda^*\) onder #L# te bewijzen, laten we #\vec{v}# een willekeurige vector in \(E_\lambda^*\) zijn, en tonen we aan dat #L(\vec{v})# ook tot \(E_\lambda^*\) behoort. Uit de definitie van \(E_\lambda^*\) volgt dat er een natuurlijk getal #k# is, zodat \((L - \lambda\, I_V)^k(\vec{v}) = \vec{0}\). Dus #\vec{v}# behoort tot #\ker{(L - \lambda\, I_V)^k}#. Omdat #M = (L - \lambda\, I_V)^k# met #L# commuteert, kunnen we stelling Invariantie van kern en beeld onder commuterende lineaire afbeeldingen toepassen om te zien dat #\ker{M}# invariant onder #L# is, zodat #L(\vec{v})# tot \(E_\lambda^*\) behoort, zoals te bewijzen was.
Als #V = \mathbb{R}^2# en #L=L_A# voor #A=\matrix{0&1\\ 0&0}#, dan is #0# de enige wortel van de karakteristieke veelterm #p_L(x) = x^2#. De eigenruimte #E_0# van #L# bij #0# wordt opgespannen door de standaardbasisvector #\rv{1,0}# en is dus een echte deelruimte van #V#, maar de gegeneraliseerde eigenruimte #E_0^*# van #L# bij #0# valt samen met #V#.
In het eindigdimensionale geval is de dimensie van de gegeneraliseerde eigenruimte van #\lambda# gelijk aan de multipliciteit van #\lambda# in de karakteristieke veelterm van #L#:
Stel dat #V# een eindigdimensionale vectorruimte is en dat #L:V\to V# een lineaire afbeelding is, zodat #\lambda# een wortel is van de karakteristieke veelterm #p_L(x)#.
- Als #\lambda# multipliciteit #\ell# heeft in de minimumveelterm #m_L(x)#, dan is \(E_\lambda^* =\ker{(L-\lambda\, I_V)^{\ell}}\).
- Als #\lambda# multipliciteit #k# heeft in #p_L(x)#, dan is \(E_\lambda^* =\ker{(L-\lambda\, I_V)^k}\) en geldt \( \dim{E_\lambda^*} = k\).
- Schrijf #e_i= \dim{\ker{L-\lambda\,I_V)^i}}# zodat #e_\ell=k#. De rij #e_1,e_2,e_3,\ldots,e_{\ell}# is strikt stijgend.
Laat #\ell# de multipliciteit van #\lambda# in de minimumveelterm #m_L(x)# zijn. Uit de definitie van gegeneraliseerde deelruimte is duidelijk dat \(\ker{(L-\lambda\, I_V)^{\ell}}\) in \(E_\lambda^* \) bevat is. Stel dat #\vec{w}# een vector in \(E_\lambda^* \) is. Dan is er een natuurlijk getal #m#, zodat #\vec{w}# tot \(\ker{(L-\lambda\, I_V)^{m}}\) behoort. We laten zien dat we #m\le \ell# kunnen kiezen. Stel #m\gt\ell#. Omdat #\ell# de multipliciteit van #\lambda# in #m_L(x)# is, kunnen we de minimumveelterm ontbinden als
\[m_L(x) = (x-\lambda)^{\ell}\cdot c(x)\]waarbij #c(x)# een veelterm is met #c(\lambda)\ne0#. In het bijzonder geldt
\[\gcd\left((x-\lambda)^m,m_L(x)\right) = (x-\lambda)^{\ell}\]Het uitgebreide algoritme van Euclides geeft veeltermen #a(x)# en #b(x)# die voldoen aan
\[a(x)\cdot (x-\lambda)^m+b(x)\cdot m_L(x) = (x-\lambda)^{\ell}\]Vullen we #L# in in alle veeltermen van deze gelijkheid, dan vinden we, dankzij het feit dat #m_L(L)=0#,
\[a(L)\, (L-\lambda\,I_V)^m = (L-\lambda\,I_V)^{\ell}\]
zodat uit \(\vec{w}\in \ker{(L-\lambda\, I_V)^m}\) volgt \[(L-\lambda\,I_V)^{\ell}(\vec{w}) = a(L)\left( (L-\lambda\,I_V)^m(\vec{w}) \right) = a(L)(\vec{0}) = \vec{0}\] Hieruit blijkt dat #\vec{w}# tot \(\ker{(L-\lambda\, I_V)^{\ell}}\) behoort, zodat \(\ker{(L-\lambda\, I_V)^{\ell}}\) samenvalt met \(E_\lambda^* \). Dit bewijst de eerste uitspraak.
Omdat #k\ge \ell# volgt de gelijkheid \(E_\lambda^* =\ker{(L-\lambda\, I_V)^k}\) van de tweede uitspraak direct uit de eerste. We laten nog zien dat \( \dim{E_\lambda^*} = k\). Redenerend voor #k# en #p_L(x)# als hierboven voor #\ell# en #m_L(x)# vinden we een veelterm #d(x)# met #d(\lambda)\ne0#, zodat\[p_L(x) = (x-\lambda)^k\cdot d(x)\] Volgens Invariante directe som hebben we de volgende directesomdecompositie van #V# in deelruimten die invariant zijn onder #L#:\[V = \ker{(L-\lambda\,I_V)^k}\oplus \ker{d(L)}\]We hebben al gezien dat de eerste summand gelijk is aan \(E_\lambda^*\). Vanwege de stelling determinanten van enkele speciale matrices is de karakteristieke veelterm #p_L(x)# het product van de karakteristieke veeltermen van #L# beperkt tot elke summand. De karakteristieke veelterm van #L# beperkt tot \(E_\lambda^*\) heeft de vorm #(x-\lambda)^t#, waarbij #t=\dim{E_\lambda^*}#, omdat de minimumveelterm een deler van #(x-\lambda)^k# is. Anderzijds is #x-\lambda# geen deler van de karakteristieke veelterm van #L# beperkt tot #\ker{d(L)}#, want de bijbehorende minimumveelterm deelt #d(x)# en #d(\lambda)\ne0#. We concluderen dat #k=t#, zodat #k=\dim{E_\lambda^*}#.
Wat betreft de derde uitspraak: het is duidelijk dat #e_i\le e_{i+1}# omdat #\ker{(L-\lambda\,I_V)^i}# bevat is in #\ker{(L-\lambda\,I_V)^{i+1}}#. Om te bewijzen dat #e_i\lt e_{i+1}# als #i\lt\ell#, veronderstellen we dat #e_i=e_{i+1}#. We beweren dat hieruit volgt dat #e_i=e_{i+m}# voor elk natuurlijk getal #m#. Voor #m=1# volgt dit uit de veronderstelling. We maken gebruik van volledige inductie om dit voor alle #m# te bewijzen. Laat daartoe #m\gt 1# en stel dat #e_i=e_{i+m-1}# (dit is de inductiehypothese). Als #\vec{v}# in #\ker{(L-\lambda\,I_V)^{i+m}}# ligt, dan is \[(L-\lambda\,I_V)^{i+m-1}\left((L-\lambda\,I_V)\vec{v}\right) = (L-\lambda\,I_V)^{i+m}(\vec{v})=\vec{0}\] zodat #\left(L-\lambda\,I_V\right)\vec{v} # in #\ker{(L-\lambda\,I_V)^{i+m-1}}# ligt. Omdat #e_i=e_{i+m-1}# en #\ker{(L-\lambda\,I_V)^i}# bevat is in #\ker{(L-\lambda\,I_V)^{i+m-1}}#, geldt #\ker{(L-\lambda\,I_V)^i}=\ker{(L-\lambda\,I_V)^{i+m-1}}#. Dit betekent dat #\left(L-\lambda\,I_V\right)\vec{v}# in #\ker{\left(L-\lambda\,I_V\right)^i}# ligt, zodat #\vec{v}# in #\ker{\left(L-\lambda\,I_V\right)^{i+1}}# ligt. Maar #\ker{\left(L-\lambda\,I_V\right)^{i+1}}= \ker{\left(L-\lambda\,I_V\right)^i}#, dus #\vec{v}# ligt zelfs in #\ker{\left(L-\lambda\,I_V\right)^i}#. We hebben hiermee afgeleid dat #\ker{(L-\lambda\,I_V)^{i+m}} =\ker{\left(L-\lambda\,I_V\right)^i}#, en dus #e_{i+m}=e_i#.
Uit de net bewezen bewering volgt dat als #e_i=e_{i+1}#, ook #e_m=e_i# voor alle #m\gt i#, zodat #e_i=e_\ell = \dim{E^*_\lambda}#. Omdat #\ell# het kleinste natuurlijke getal is dat voldoet aan #e_\ell= \dim{E^*_\lambda}#, volgt dat #e_i=e_{i+1}# alleen geldt voor #i\geq\ell# en dus dat #e_1\lt e_2\lt \cdots\lt e_{\ell-1}\lt e_\ell #, zoals te bewijzen was.
De strikt stijgende rij #e_1,e_2,e_3,\ldots,e_{\ell}# laat zien dat
\[\ker{L-\lambda\,I_V}\subset\ker{\left(L-\lambda\,I_V\right)^{2} }\subset\cdots\subset\ker{\left(L-\lambda\,I_V\right)^{\ell} }\]
een rij van steeds groter wordende invariante deelruimten is. De eerste deelruimte is de eigenruimte van #L# met betrekking tot #\lambda#, de laatste deelruimte is de gegeneraliseerde eigenruimte #E_\lambda^*#. In het bijzonder geldt #e_1\ge1# en is #e_{\ell}# de exponent van #\lambda - x# in de karakteristieke veelterm van #L#. De ongelijkheden suggereren een methode om de exponent #\ell# van #x-\lambda# in de minimumveelterm te berekenen: bepaal achtereenvolgens de getallen #e_i#, voor #i=1,2,\ldots# totdat #e_i=e_{i+1}#. Dan is #i= \ell#.
De getallen #e_i=\dim{\ker{L-\lambda\,I_V)^i}}# hangen niet af van een basis voor #V#. Met andere woorden, voor geconjugeerde #(n\times n)#-matrices #A# en #B# zijn de getallen #\dim{\ker{(B-\lambda\cdot I_n)^i}}# gelijk aan #\dim{\ker{(A-\lambda\cdot I_n)^i}}#. Later zal blijken dat deze informatie de conjugatieklasse van #A# uniek bepaalt; dat wil zeggen: als voor een #(n\times n)#-matrix #B# de waarden #\dim{\ker{(B-\lambda_i\cdot I_n)^{k_i}}}# gelijk zijn aan #\dim{\ker{(A-\lambda_i\cdot I_n)^{k_i}}}# voor alle eigenwaarden #\lambda_i# met multipliciteit #k_i#, dan zijn #A# en #B# geconjugeerd.
De multipliciteit van de eigenwaarde #\lambda# als nulpunt van de karakteristieke veelterm, dat wil zeggen: bovenstaand getal #k#, heet de algebraïsche multipliciteit van #\lambda# in #L#. De dimensie van #E_\lambda# wordt vaak de meetkundige/geometrische multipliciteit van #\lambda# in #L# genoemd.
Bekijk de matrix \[ A = \matrix{4 & 0 & -1 & 0 \\ 4 & 5 & -6 & -3 \\ 3 & 1 & -1 & -2 \\ -3 & -1 & 4 & 6 } \] De karakteristieke veelterm van deze matrix is gelijk aan # \left(x-4\right)^2\cdot \left(x-3\right)^2 #. De eigenwaarden van #A# zijn dus #3# en #4#.
Bepaal een basis voor de gegeneraliseerde eigenruimte van #A# bij eigenwaarde # 3#.
#\text{basis voor }E_{3}^*=# #\basis{ \matrix{-1 \\ 0 \\ 0 \\ -1 \\ } , \matrix{0 \\ -1 \\ -1 \\ 1 \\ } } #
Omdat de multipliciteit van # 3 # in de karakteristieke veelterm gelijk is aan #2#, is de gegeneraliseerde eigenruimte #E_{3}^*# gelijk aan #\ker{(A-3 \,I_4)^{2}}#.
De voor de hand liggende methode om een basis voor #\ker{(A-3 \,I_4)^{2}}# te bepalen is de volgende: Door te kwadrateren vinden we
\[ (A-3 \,I_4)^{2} = \matrix{-2 & -1 & 3 & 2 \\ 3 & 1 & -4 & -3 \\ 1 & 0 & -1 & -1 \\ -4 & -1 & 5 & 4 \\ }\] Vervolgens berekenen we de kern van deze lineaire afbeelding door het stelsel vergelijkingen \((A-3\,I_4)^{2} (\vec{x}) = \vec{0}\) op te lossen. Zo vinden we de volgende basis van \(\ker{(A-3 \,I_4)^{2}}\):
\[\basis{ \matrix{-1 \\ 0 \\ 0 \\ -1 \\ } , \matrix{0 \\ -1 \\ -1 \\ 1 \\ } } \] We kunnen ook de stelling
Invariante directe som gebruiken, die stelt dat de gevraagde basis ook een basis van #\im{(A-4 \,I_4)^2 }# is. Deze deelruimte wordt opgespannen door de kolommen van de matrix \[(A-4 \,I_4)^2 = \matrix{-3 & -1 & 5 & 2 \\ -5 & -2 & 8 & 3 \\ -5 & -2 & 8 & 3 \\ 2 & 1 & -3 & -1 \\ }\] Door uitdunning vinden we dat de volgende kolommen een basis voor \(\ker{(A-3 \,I_4)^{2}}\) vormen: \[\basis{\cv{ -3 \\ -5 \\ -5 \\ 2 } , \cv{ -1 \\ -2 \\ -2 \\ 1 } } \]