We zagen dat een stelsel vergelijkingen geschreven kan worden als een matrixvergelijking . Als de rang van de coëfficiëntenmatrix gelijk is aan de rang van de aangevulde matrix , dan heeft het stelsel een oplossing .
Het enige alternatief is dat de rang van de coëfficiëntenmatrix kleiner is dan de rang van de aangevulde matrix. In dat geval bestaat er geen oplossing. We gaan nu na hoe we de best mogelijke benadering voor een oplossing kunnen vinden. Met andere woorden, we gaan op zoek naar een vector waarvoor de afstand tussen en het beeld onder van de benaderende oplossing geminimaliseerd wordt.
Laat een -matrix zijn en een vector in .
- De vergelijking met onbekende heeft een oplossing.
- Elke oplossing van deze vergelijking geeft een beste benadering voor de vergelijking in de zin dat minimaal is voor onder alle vectoren van .
Als de -matrix rang heeft, kunnen we deze beste benadering eenvoudig vinden. Dan is de matrix namelijk inverteerbaar, zodat we de volgende procedure kunnen uitvoeren:
- Bereken en .
- Bereken de inverse van .
- Nu wordt gegeven door .
- Nu wordt gegeven door .
Dat de eis van de rang essentieel is, wordt duidelijk als we kijken naar het volgende voorbeeld De matrix wordt gegeven door Deze matrix is niet inverteerbaar want zijn determinant is gelijk aan .
Deze stelling is vooral nuttig wanneer het stelsel geen oplossing heeft. Als dit stelsel wel een oplossing heeft, is deze oplossing dezelfde als die van , dus in dit geval zou de kleinste kwadratenmethode onnodige moeite opleveren.
Bekijk het strijdige stelsel
Dat dit stelsel geen oplossing heeft, is snel duidelijk. De laatste vergelijking geeft , in combinatie met de eerste geeft dit . Als we dit invullen in de tweede vergelijking krijgen we echter . We kunnen dus geen oplossing vinden, en gaan op zoek naar de beste benadering. Hiervoor schrijven we het stelsel eerst om naar de matrixvergelijking met
We berekenen en .
De inverse van de matrix wordt gegeven door
We kunnen nu de vector berekenen:
Deze vector wordt door de matrix afgebeeld op de vector , die gegeven wordt door
Een klassieke toepassing van de kleinste kwadratenmethode heeft een statistisch karakter. Stel dat een aantal punten , met , een stel punten in het -vlak is. Het lineaire regressie probleem vraagt naar een lijn die deze verzameling punten in het geheel het best benadert. De lijn die de beste benadering zal gaan vormen, beschrijven we door voor nader te bepalen reële getallen en . We zijn dus op zoek naar de oplossing voor en van het stelsel
Dit geeft ons dus in matrixvorm
De kleinste kwadratenmethode geeft een antwoord hierop.
We kunnen voor dit stelsel net als in het andere voorbeeld gewoon eenvoudig de beste benadering berekenen. Dezelfde methode werkt voor het vinden van de beste hogeregraadse benadering, die de vorm heeft. De matrixvergelijking wordt dan
Deze methode beperkt zich niet tot veeltermen. Ook exponentiële functies kunnen geconstrueerd worden aan de hand van een dergelijke methode. Dit kan bijvoorbeeld zijn toepassingen vinden binnen het modelleren van de groei van populaties.
Het vinden van een functie, zij het een veelterm of een andere functie, die het best een dergelijke puntenwolk benadert, heet ook wel het vinden van de kleinste kwadratenfit.
Dezelfde methode als lineaire regressie werkt ook voor het vinden van de beste benadering van een stel punten voor in het -vlak door middel van de grafiek van een veeltermfunctie van hogere graad. Als we nemen, dan wordt de overeenkomstige matrixvergelijking In feite werkt deze methode voor andere functies dan veeltermen. Exponentiële functies worden bijvoorbeeld vaak gebruikt bij het modelleren van de groei van een bevolking.
De vergelijking noemen we ook wel de normaalvergelijking van de matrixvergelijking .
We zullen beide onderdelen bewijzen, beginnend met de eerste.
1. Laat een -matrix zijn en een vector uit . We beweren dat . Het is duidelijk dat , zodat we om de bewering te bewijzen alleen hoeven na te gaan dat . Stel daartoe dat behoort tot . Dan geldt Omdat het inproduct positief-definiet is, volgt hieruit , dat wil zeggen: behoort tot . Hiermee is de bewering vastgesteld.
We zullen nu bewijzen dat . Omdat duidelijk is, volstaat het om de inclusie te bewijzen. Dit volgt uit de volgende afleiding: Hiermee hebben we de inclusie afgeleid. Volgens de eigenschappen van de loodrechte ruimte geldt dan ook De vector behoort tot . Er is dus een vector , zodat . Dit bewijst de eerste uitspraak.
2. Stel dat een oplossing is van de vergelijking . We beweren dat dan de orthogonale projectie van op is. Om dit in te zien, berekenen we Dit laat zien dat loodrecht staat op het beeld van . De vector behoort tot en is dus de loodrechte projectie van op . Dit betekent dat van alle beelden van vectoren onder het dichtst bij de vector ligt. Daarom levert de beste benadering voor een oplossing van de vergelijking .
De methode heet kleinste kwadratenmethode naar aanleiding van lineaire regressie in het vlak, waarbij het probleem is om bij een gegeven stel punten een lijn te vinden die het stel punten zo goed mogelijk beschrijft als onderdeel van de grafiek van een lineaire functie. De oplossing is de lijn waarvoor de som over de kwadraten van alle verticale afstanden van de gegeven punten tot de lijn minimaal is.
Vind de kleinste kwadratenoplossing van de volgende vergelijking:
Om de kleinste kwadratenbenadering voor dit probleem te vinden, lossen we op, met:
We berekenen en : en
De coëfficiëntenmatrix die correspondeert met is:
Rijreductie geeft:
Dus,
Omdat de matrix inverteerbaar is, hadden we ook de kleinste kwadratenoplossing kunnen berekenen door te inverteren en de bekende berekeningen uit te voeren zoals deze in de theorie zijn gegeven.