Een kwadratische vorm op een vectorruimte is op te vatten als een homogene tweedegraads veelterm in de coördinaten van een vector ten opzichte van een vast gekozen basis van de vectorruimte. Een gewone kwadratische veelterm is de som van een kwadratische vorm, een lineaire afbeelding en een constante functie.
De kwadratische veeltermfunctie #p# op #\mathbb{R}^3# bepaald door \[ p(x,y,z) = 2x^2 - 4xy+4xz-3y^2-3z^2+5x-7y+z-1\] kunnen we ook schrijven als \[p(x,y,z)= \matrix{x & y & z}\, \matrix{2&-2&2\\-2&-3&0\\ 2&0&-3}\, \matrix{x\\ y\\ z} +\matrix{5&-7&1}\,\matrix{x\\ y\\ z} -1\]
De kwadratische veeltermfunctie #p# kan als volgt geschreven worden als functie van een kolomvector #\vec{x}#
\[ p(\vec{x}) =
\vec{x}^\top\, A\, \vec{x}+\vec{l}^\top\, \vec{x}+c
\]Hierbij is #A# een symmetrische matrix, #\vec{l}# een kolomvector en #c# een reëel getal. De uitdrukking \(\vec{l}^\top\, \vec{x}\) vatten we op als de het product van een #(1\times n)#-matrix met een #(n\times 1)#-matrix, die een reëel getal oplevert; het is dus een andere manier om het inproduct #\dotprod{\vec{l}}{\vec{x}}# op te schrijven. Net zo is \(\vec{x}^\top\, A\, \vec{x} \) gelijk aan het inproduct #\dotprod{\vec{x}}{(A\,\vec{x})}#.
Laat #\alpha =\basis{\vec{a}_1,\ldots ,\vec{a}_n}# een orthonormale basis van eigenvectoren van #A# zijn met eigenwaarden #\lambda_1, \ldots,\lambda_n#. Hierbij kiezen we de volgorde zó dat de eigenwaarden gelijk aan #0# achteraan staan. Er is dus een index #r\le n# met #\lambda_i\ne0 # voor #i\le r# en #\lambda_i=0# voor #i\gt r#. We geven de coördinaten van #\vec{x} = \rv{x_1, \ldots ,x_n}# ten opzichte van #\alpha# aan door #\vec{x}' = \rv{x_1',\ldots, x_n'}#. Het verband is dus
\[
\left(\,\begin{array}{c}
x_1\\ \vdots\\ x_n
\end{array}\,\right)=B\ \left(\,\begin{array}{c}
x_1'\\ \vdots\\ x_n'
\end{array}\,\right)
\]waarbij de kolommen van #B# de vectoren #\vec{a}_1,\ldots ,\vec{a}_n# zijn, zodat #B ={}_\varepsilon I_\alpha#. In termen van vectoren:
\[
\vec{x} =B\, \vec{x}'
\]Substitutie in het functievoorschrift voor #p(\vec{x})# geeft
\[\begin{array}{rcl}p(\vec{x}) &=& (\vec{x}' )^\top B^\top\,A\,B\,\vec{x}'
+\vec{l}^\top\,B\,\vec{x}'+c\\&=&( \vec{x}' )^\top\, D\,\vec{x}'
+(\vec{l}\,')^\top\,\vec{x}'+c\\ &=&
\lambda_1x_1'^2+\cdots + \lambda_nx_n'^2+l_1'x_1'+\cdots +l_n'x_n'+c\end{array}
\]Hierbij is #D=B^\top\,A\,B# de #(n\times n)#-diagonaalmatrix met de eigenwaarden #\lambda_1,\ldots,\lambda_n# op de diagonaal en wordt #\vec{l}\,'# gegeven door
\[
\vec{l}\,' =\left(\vec{l}^\top\, B \right)^\top=B^\top\,\vec{l}
\]De componenten van #\vec{l}\,'# zijn dus de #\alpha#-coördinaten van de vector #\vec{l}#.
Als #i\leq r#, dan kunnen we de lineaire term met #x_i'# wegwerken door middel van kwadraatafsplitsen. Hier voeren we dit proces uit met behulp van translaties: Laat #\vec{a}# een kolomvector in #\mathbb{R}^n# zijn, en schrijf \[\vec{x}\,'' = T_{-\vec{a}}(\vec{x}')\] zodat #\vec{x}\,' = \vec{x}\,''+\vec{a}#. Invullen van deze uitdrukking voor #\vec{x}\,' # in #p(\vec{x}) # geeft
\[\begin{array}{rcl}p(\vec{x}) &=&
\left(\vec{x}\,''+\vec{a}\right)^\top \,D\,(\vec{x}\,''+\vec{a})
+(\vec{l}\,')^\top\,(\vec{x}\,''+\vec{a})+c\\ &&\color{blue}{\vec{x}\,' = \vec{x}\,''+\vec{a}\text{ ingevuld in }p(\vec{x})=(\vec{x}' )^\top\, D\,\vec{x}'
+(\vec{l}\,')^\top\,\vec{x}'+c}\\&=&
(\vec{x}\,'')^\top \,D\,\vec{x}\,''+(\vec{x}\,'')^\top\,D\,\vec{a}+\vec{a}^\top\,D\,\vec{x}\,''+\vec{a}^\top\, D \, \vec{a}
+(\vec{l}\,')^\top\,\vec{x}\,''+(\vec{l}\,')^\top\,\vec{a}+c\\&&\color{blue}{\text{haakjes uitgewerkt}}\\&=&
(\vec{x}\,'')^\top \,D\,\vec{x}\,''+\left(\vec{a}^\top\,D^\top\,\vec{x}\,''\right)^\top+\vec{a}^\top\,D\,\vec{x}\,''+\vec{a}^\top\, D \, \vec{a}
+(\vec{l}\,')^\top\,\vec{x}\,''+(\vec{l}\,')^\top\,\vec{a}+c\\&&\color{blue}{\text{rekenregel }\left(\vec{a}^\top\,D^\top\,\vec{x}\,''\right)^\top=(\vec{x}\,'')^\top\,D\,\vec{a}}\\&=&
(\vec{x}\,'')^\top \,D\,\vec{x}\,'' +2\vec{a}^\top\,D\,\vec{x}\,''+\vec{a}^\top\, D \, \vec{a}
+(\vec{l}\,')^\top\,\vec{x}\,''+(\vec{l}\,')^\top\,\vec{a}+c\\&&\color{blue}{D^\top=D\text{ en }\left(\vec{a}^\top\,D\,\vec{x}\,''\right)^\top=\vec{a}^\top\,D\,\vec{x}\,''\text{ want dit is een scalar}}\\ &=&
(\vec{x}\,'')^\top \,D\,\vec{x}\,''+\left(2D\,\vec{a}+\vec{l}\,'\right)^\top\,\vec{x}\,''+c'\\&&\color{blue}{\text{herschreven met }c' = \vec{a}^\top\, D \, \vec{a} +(\vec{l}\,')^\top\,\vec{a}+c}\end{array}
\]Om de termen lineair in #x_i# met #i\le r# weg te werken, kiezen we \[\vec{a} = -\frac12\cdot D' \vec{l}\,'\] waarbij #D'# de diagonaalmatrix met #\lambda_i^{-1}# als #i#-de diagonaalelement voor #i\le r# en verder alleen nullen. Dus op het deel loodrecht op de kern van #D# is #D'# de inverse van #D#, en
\[\vec{a}^\top=-\frac12 \cdot \rv{\lambda_1^{-1}l_1',\ldots,\lambda_r^{-1}l_r',0,\ldots,0}\]
Het resultaat is
\[\begin{array}{rcl}p(\vec{x}) &=&
(\vec{x}\,'')^\top \,D\,\vec{x}\,'' +\left(\vec{l}\,''\right)^\top \,\vec{x}\,''+c'\end{array}
\]waarbij #\vec{l}\,''# de vector is met nullen in de eerste #r# coördinaten en #l_i''=l_i'# voor #i=r+1,\ldots,n#.
Als #\vec{l}\,''=\vec{0}#, dan is het functievoorschrift voor #p# als gewenst, namelijk als in het tweede geval met #l_{r+1} = c'#. Om dit in te zien kiezen we #L = B\,T_{\vec{a}}#, zodat #\vec{x}=L\, (\vec{x}\,'')# en
\[p(L(\vec{x}\,'')) = p(\vec{x}) = (\vec{x}\,'')^\top \,D\,\vec{x}\,'' +l_{r+1}\]Vervangen we het argument #\vec{x}\,''# aan beide zijden door #\vec{x}#, dan vinden we de vereiste formule.
Veronderstel daarom dat #\vec{l}\,''# niet gelijk is aan de nulvector. We zullen in de rest van het bewijs kijken naar isometrieën van #\mathbb{R}^n# die de eerste #r# coördinaten vast houden. Ze laten dus de volgende lineaire deelruimte invariant: \[W = \linspan{\vec{e}_1,\ldots,\vec{e}_r}^\perp=\linspan{\vec{e}_{r+1},\ldots,\vec{e}_n}\]Omdat de eerste #r# coördinaten van #\vec{l}\,''# gelijk aan nul zijn, ligt deze vector in #W#.
Schrijf #l_{r+1} = \norm{\vec{l}\,''}#. Er is een orthogonale afbeelding #S:\mathbb{R}^n\to\mathbb{R}^n# die elke vector in #W^\perp=\linspan{\vec{e}_1,\ldots,\vec{e}_r}# vast houdt en #l_{r+1}\vec{e}_{r+1}# overvoert in #\vec{l}\,''#. Een voorbeeld is de loodrechte spiegeling #S = S_{l_{r+1}\vec{e}_{r+1}-\vec{l}\,''}#. Omdat #S# orthogonaal is, laat ze volgens eigenschap 5 van orthogonale afbeeldingen ook #W# invariant, zodat voor een willekeurige vector #\vec{y}# in #\mathbb{R}^n# geldt:\[\begin{array}{rcll}S\,D\,\vec{y}&=&S\,D\left(\vec{w}+\vec{m}\right)&\color{blue}{\text{directesomdecompositie met }\vec{w}\in W\text{ en }\vec{m}\in W^\perp}\\&=&S\,D\,\vec{m}&\color{blue}{\vec{w}\in W=\ker{D}}\\&=&D\,\vec{m}&\color{blue}{D\,\vec{m}\in W^\perp\text { en }S\text{ houdt }W^\perp\text{ vast}}\\&=&D\left(S\,\vec{w}+\vec{m}\right)&\color{blue}{S\,\vec{w}\in W=\ker{D}}\\&=&D\,S\left(\vec{w}+\vec{m}\right)&\color{blue}{\vec{m}\in W^\perp\text{ en }S\text{ houdt }W^\perp\text{ vast}}\\&=&D\,S\,\vec{y}&\color{blue}{\vec{y}=\vec{w}+\vec{m}}\\\end{array}\] Hieronder gebruiken we dit resultaat in de vorm #S^{-1}\,D=D\,S^{-1}#. Schrijf \[\vec{x}\,''' = S^{-1}\vec{x}\,''\] Dan geldt # \vec{x}\,''' = \vec{x}\,''# voor alle #\vec{x}''# in #W^\perp#, zodat \[\begin{array}{rcl}p(\vec{x}) &=&
(\vec{x}\,'')^\top \,D\,\vec{x}\,'' +\left(\vec{l}\,''\right)^\top \,\vec{x}\,''+c'\\&&\color{blue}{\text{eerder gevonden formule}}\\&=&
(\vec{x}\,'')^\top\left(S^{-1}\right)^\top\,S^{-1}\,D\,\vec{x}\,'' +\left(\vec{l}\,''\right)^\top\left(S^{-1}\right)^\top\,S^{-1} \,\vec{x}\,''+c'\\&&\color{blue}{\left(S^{-1}\right)^\top\,S^{-1}=I_n\text{ omdat }S\text{ orthogonaal is}}\\&=&
(S^{-1}\vec{x}\,'')^\top\,\,D\,\left(S^{-1}\vec{x}\,''\right)+\left(S^{-1}\vec{l}\,''\right)^\top \,(S^{-1}\vec{x}\,'')+c'\\&&\color{blue}{\text{rekenregel }\left(X\,Y\right)^\top=Y^\top\,X^\top\text{ en }S^{-1}\,D=D\,S^{-1}}\\&=&
(\vec{x}\,''')^\top \,D\,\vec{x}\,''' +\left(l_{r+1}\vec{e}_{r+1}\right)^\top \,\vec{x}\,'''+c'\\&&\color{blue}{\vec{x}\,''' = S^{-1}\vec{x}\,''\text{ en }S\left(l_{r+1}\vec{e}_{r+1}\right)=\vec{l}\,''}\end{array}
\]Ten slotte kiezen we de vector #\vec{b} = c'\cdot l_{r+1}^{-1}\,\vec{e}_{r+1}# en schrijven we \[\vec{x}\,'''' = T_{-\vec{b}}\,\vec{x}\,''' \] zodat #\vec{x}\,''' = \vec{x}\,'''' - \vec{b}# en
\[\begin{array}{rcl}p(\vec{x}) &=&(\vec{x}\,''')^\top \,D\,\vec{x}\,''' +\left(l_{r+1}\vec{e}_{r+1}\right)^\top \,\vec{x}\,'''+c'\\&&\color{blue}{\text{formule hierboven}}\\&=&(\vec{x}\,''''- \vec{b})^\top \,D\,\left(\vec{x}\,''''- \vec{b}\right)+\left(l_{r+1}\vec{e}_{r+1}\right)^\top \,(\vec{x}\,''''-\vec{b})+c'\\&&\color{blue}{\vec{x}\,''' = \vec{x}\,'''' - \vec{b}}\\&=& (\vec{x}\,'''')^\top \,D\,\vec{x}\,'''' +\left(l_{r+1}\vec{e}_{r+1}\right)^\top \,\vec{x}\,''''-\left(l_{r+1}\vec{e}_{r+1}\right)^\top \,\vec{b}+c'\\&&\color{blue}{\vec{b}^\top\,D=\vec{0}^\top\text{ en }D\,\vec{b}=\vec{0}\text{ omdat }\vec{b}\in W=\ker{D}}\\&=& (\vec{x}\,'''')^\top \,D\,\vec{x}\,'''' +\left(l_{r+1}\vec{e}_{r+1}\right)^\top \,\vec{x}\,''''-c'\left(l_{r+1}\vec{e}_{r+1}\right)^\top \, l_{r+1}^{-1}\vec{e}_{r+1}+c'\\&&\color{blue}{\vec{b} = c'\cdot l_{r+1}^{-1}\,\vec{e}_{r+1}\text{ ingevuld}}\\&=& (\vec{x}\,'''')^\top \,D\,\vec{x}\,'''' +l_{r+1}\cdot \vec{e}_{r+1}^\top \,\vec{x}\,''''\\&&\color{blue}{\text{laatste twee termen vallen tegen elkaar weg dankzij keuze voor }\vec{b}}\\&=& (\vec{x}\,'''')^\top \,D\,\vec{x}\,''''+l_{r+1}\cdot {x''''}_{r+1}\end{array}
\]Dit laat zien dat we op de functieregel van het eerste geval uitkomen.
We laten nog zien waarom het resultaat ook in het eerste geval geformuleerd kan worden als in de stelling. Alle transformaties samenstellend, zien we dat #K= B\,T_{\vec{a}}\,S\,T_{\vec{b}}# een isometrie is die voldoet aan #\vec{x} = K(\vec{x}\,'''')#:
\[\vec{x} = B\, \vec{x}\,' = B\,T_{\vec{a}}\vec{x}\,''=B\,T_{\vec{a}}\,S\,\vec{x}\,''' = B\,T_{\vec{a}}\,S\,T_{\vec{b}}\,\vec{x}\,''''=K(\vec{x}\,'''')\]Vullen we dit in in het functievoorschrift van #p#, dan vinden we
\[p(K(\vec{x}\,'''')) = (\vec{x}\,'''')^\top \,D\,\vec{x}\,'''' +l_{r+1}\cdot {x''''}_{r+1}\]Vervangen we ten slotte #\vec{x}\,''''# door #\vec{x}#, dan komen we uit op
\[\begin{array}{rcl}p(K(\vec{x})) &=& \vec{x}^\top \,D\,\vec{x} +l_{r+1}\cdot {x}_{r+1}\\ & =& \displaystyle\sum_{i=1}^r l_i\cdot x_i^2 +l_{r+1}\cdot x_{r+1}\end{array}\]
De standaardvorm is niet uniek. De volgorde van de diagonaalelementen van #A# is bijvoorbeeld niet vastgelegd (hoewel we de diagonaalelementen in het algemeen ordenen naar afnemende absolute waarde) en de coëfficiënt van de lineaire term met #x_{r+1}# kan met #-1# vermenigvuldigd worden.