Sannolikhet & Statistik

Back to All Courses

Lesson 7

Punktskattning

Punktskattning används för att uppskatta ett värde på en okänd parameter. Beroende på vad denna parameter representerar finns det olika metoder för att få det mest optimala värdet. Det finns med andra ord situationer där en viss teknik kan vara av preferens före annan beroende på vad som ska beräknas.

Allmänt fall

Den mest allmänna definitionen av punktskattning är att vi har en parameter som är en funktion av utfall där detta stickprov av värden kommer från de stokastiska variablerna som har en sannolikhetsfördelning som är beroende av parametern . Själva uppskattningen av betecknas . Denna uppskattning är genom det ett utfall från den stokastiska variabeln också kallad stickprovsvariabeln.


För att sammanfatta detta kortfattat:

  • är en okänd parameter som ska uppskattas.

  • är en S.V.

  • är ett tal, den uppskattning av och ett utfall av .

Uppskattning av väntevärde

Vid en skattning av väntevärdet är den mest optimala uppskattningen det aritmetiska medelvärdet . Detta uttrycks som





där är varje utfall i den givna serien av utfall som väntevärdet ska skattas.

Uppskattning av varians och standardavvikning

Anta nu att variansen och standardavvikningen är okänd. Vid skattning av variansen används formeln för stickprovsvariansen





Notera formeln kräver att man vet värdet på som motsvarar skattningen av väntevärdet. Av denna anledning kräver formel att man först har utfört skattningen av väntevärdet innan.


Standardavvikningen beräknas som genom samma uppskattning fast roten ur:





Exercise

Vid en undersökning hur långt människor går per dag ges följande mätdata (km)



skatta väntevärdet och standardavvikelsen hos fördelningen som mätdatan kommer från.

Solution

Vi antar att varje mätdata kommer från oberoende stokastiska variabler och använder det aritmetiska medelvärdet för att skatta väntevärdet.






Vi skattar nu även standardavvikningen:








Uppskattning genom Maximum-likelihood

ML-metoden är en allmän metod för att skatta okända parametrar och fungerar genom att skapa en likelihood-funktion där skattningsvärdet motsvarar det högsta värde som antar. Förutsatt att de stokastiska variablerna vars fördelning beror av är oberoende definieras Likelihood-funktionen som:





Exercise

Efter en observation av oberoende händelseförlopp ges följande mätdata:





Sannolikhetsfunktionen ges av . Skatta genom Maximum-likelihood metoden.

Solution

Vi använder oss av och får:







Vi söker nu maxvärdet av . Vanligtvis när man vill hitta maximipunkten bör funktionen dervieras, sättas lika med noll, få ut nollpunkterna och sedan använda sig av teckenschema för att få fram maxvärdet. Men i detta fall gör vi ett steg innan som vi kan kalla för logaritm-tricket.


Anledningen till att vi använder denna är att en logaritmering inte påverkar var maxvädet befinner sig i x-led samtidigt som funktionen vi vill derivera förenklas betydligt. Vi kallar den nya funktionen där .





Vi fortsätter därefter med att förenkla genom lite logaritmregler






Så! Istället för att derivera är det bara att derivera som är betydligt enklare.


Vi deriverar




samt sätter för at hitta rötterna och undersöker med teckenschema och får fram att maxvädet är .


Detta ger att .

Uppskattning genom Minsta-kvadrat

MK-metoden är ytterligare en allmän metod för att utföra skattningar av okända parametrar. Vi har den okända parameter som vi vill skatta och en funktion där dess lägsta värdet motsvarar skattningen . Vi har åter igen de stokastiska variablerna vars fördelning beror av . Funktionen definieras av formeln:




där motsvarar väntevärdet för den respektive stokastiska variabeln, det vill säga, .

Exercise

Liknande uppgift som ovan, vi har mätdatan





och sannolikhetsfunktionen . Skatta nu genom Minsta-kvadrat metoden.

Solution

För att kunna ovanstående formel för och måste vi först beräkna , det vill säga väntevärdet för sannolikhetsfunktionen. För att underlätta beräkningar tar vi en titt i ev. formelblad och ser att sannolikhetsfunktionen är en -fördelning. Med denna information vet vi dessutom från KTHs formelblad att väntevärdet för funktionen motsvarar .


Väntevärdet kan inte beräknas som vanligt med och vi nöjer därför oss med att det är givet i formelbladet.


Vi använder nu formeln för och får:






Avslutningsvis deriverar vi, får och använder teckendiagram för att hitta det minsta värdet för som är . Detta ger att .