Lesson 7

Normalfördelningen och CGS

30

Beteckning: XN(μ,σ) X \in N( \mu , \sigma )


Normalfördelningen förekommer i vanligt tal i två former:

  • Allmänna normalfördelning

  • Standardiserad normalfördelning

Den standardiserade versionen är en förenkling av den allmänna. Båda kommer till stor användning inom sannolikhetsteorin som vi snart kommer att upptäcka. I allmänhet är normalfördelningen utan tvekan den viktigaste sannolikhetsfördelningen i hela sannolikhetsteorin.


Den normalfördelningen beror på två parametrar, μ \mu och σ \sigma som representerar fördelningens väntevärde respektive standardavvikning. Detta ger att om XX är en normalfördelad S.V gäller följande:



E(X)=μ,V(X)=σ2,D(X)=σ E(X)= \mu, \, \, V(X) = {\sigma}^{2}, \, \, D(X) = \sigma



Den standardiserade versionen har bestämda värden för dessa parametrar, μ=0 \mu=0 och σ=1\sigma = 1 . Detta gör att den standardiserade normalfördelningens beteckning blir XN(0,1)X \in N( 0 , 1 ) .

Den standardiserade normalfördelningen

Beteckning: XN(0,1)X \in N( 0 , 1 )


Formeln för den standardiserade normalfördelningen ges av täthets- och fördelningsfunktionen:



fX(x)=φ(x)=12πex22,FX(x)=Φ(x)=12πxet22dt{ f }_{ X }\left( x \right) =\varphi \left( x \right) =\frac { 1 }{ \sqrt { 2\pi } } { e }^{ -\frac { { x }^{ 2 } }{ 2 } }, \, \, \, \, \, { F }_{ X }\left( x \right) =\Phi \left( x \right) = \frac { 1 }{ \sqrt { 2\pi } } \int _{ -\infty }^{ x }{ { e }^{ -\frac { { t }^{ 2 } }{ 2 } }dt }



Notera ovan att den standardiserade normalfördelningens täthets- och fördelningsfunktion har egna beteckningar, φ(x)\varphi \left( x \right) respektive Φ(x)\Phi \left( x \right) som används flitigt då den standardiserade versionen är ytterst viktigt trots förenklingen.


Som tidigare nämnt är μ\mu och σ \sigma normalfördelningens väntevärde respektive standardavvikning vilket ger att den standardiserade normalfördelningens vändevärde E(X)=0E(X)=0 och standardavvikning D(X)=1D(X)=1 .


Kvantiler


Tack vare den standardiserade normalfördelningens användbarhet har även kvantilbeteckningar med förberäknade värden införts för att underlätta beräkningar.


Kvantiler kan förklaras som ett värde λα{\lambda}_{\alpha} på den standardiserade normalfördelningens x-axeln där arean till höger om detta värde är α\alpha och motsvarar α\alpha -kvantilen så att P(X>λα)=αP(X > {\lambda}_{\alpha}) = \alpha .


Alpha motsvarar arean och sannolikheten i den standardiserade normalfördelningen


Allmänna normalfördelningen

Beteckning: XN(μ,σ) X \in N( \mu , \sigma )


Formeln för den allmänna normalfördelningen kan enklast uttryckas med hjälp av den standardiserade normalfördelningens täthets- och fördelningsfunktion med en minmal förändring. Denna förändring gör den allmänna formen beroende av μ\mu och σ\sigma .


fX(x)=1σφ(xμσ),FX(x)=Φ(xμσ){ f }_{ X }\left( x \right) =\frac { 1 }{ \sigma } \varphi \left( \frac { x-\mu }{ \sigma } \right) , \, \, \, \, \, { F }_{ X }\left( x \right) =\Phi \left( \frac { x-\mu }{ \sigma } \right)


Detta utvecklas sedan till den fullständiga formeln för den allmänna normalfördelningen:


fX(x)=1σ2πe(xμ)22σ2,FX(x)=1σ2πxe(tμ)22σ2dt{ f }_{ X }\left( x \right) =\frac { 1 }{ \sigma \sqrt { 2\pi } } { e }^{ -\frac { { \left( x-\mu \right) }^{ 2 } }{ 2{ \sigma }^{ 2 } } } , \, \, \, \, \, { F }_{ X }\left( x \right) =\frac { 1 }{ \sigma \sqrt { 2\pi } } \int _{ -\infty }^{ x }{ { e }^{ -\frac { { \left( t-\mu \right) }^{ 2 } }{ 2{ \sigma }^{ 2 } } }dt }


Som tidigare nämnt motsvarar μ\mu väntevärdet och σ\sigma standardavvikelsen. För att förtydliga hur normalfördelningen beror av parametrarna kan vi ta en titt på illustrationen nedan. Den vänstra bilden visar två normalfördelningar med samma väntevärde men olika standardavvikelser. Det rödmarkaderade fördelningen har en lägre standardavvikelse, ett lägre värde på σ\sigma än den mera tillplattade fördelningen . Detta gör att den rödmarkerade fördelningen blir spetsigare och mindre utspridd.



I den högra grafen ser vi två fördelningar som dessutom skiljer i väntevärde μ\mu . Den rödmarkerade fördelningen som har ett högre väntevärde än den tillplattade blir därmed förskjuten i x-led till det område det tilldelade väntevärdet finns.


Centrala gränsvärdessatsen

Detta område är bland det viktigaste i hela sannolikhetskursen. Det kommer på alla tentor och flera gånger på olika uppgifter ibland.


Centrala gränsvärdessatsen är en väldigt förbryllande sats som säger att om vi har ett tillräckligt högt antal oberoende S.V med samma fördelning kan summan av dessa variabler approximeras till en normalfördelning.


Mera formellt uttryckt: Om vi har en följ S.V. X1,X2,,Xn{X}_{1}, {X}_{2}, \dots , {X}_{n} som är likafördelade och oberoende och Y=X1+X2++XnY = {X}_{1} + {X}_{2} + \dots + {X}_{n} gäller approximativt YN(nμ,σn)Y \in N(n \mu, \sigma \sqrt{n} ) .


Exercise

På en godiskiosk anländer sötsugna studenter för at köpa karameller. Antag att tiden mellan ankomster är oberoende, likafördelade s.v. med väntevärdet 88 minuter och standardavvilkelsen 44 minuter.


Beräkna antalet studenter nn som anländer från 13:3013:30 till 15:3015:30 så att sannolikheten att det kommer nn studenter eller fler under den angivna tidsperioden är 15%15\% . Nedan återfinns även en tabell som kan komma till användning.


α\alpha0.150.100.050.025
λα{\lambda}_{\alpha}1.03651.28161.64491.960

Solution

Vi vill mäta tiden mellan ankomsterna för antalet sötsugna studenter nn . Detta innebär detta att de S.V. som mäter tiden mellan ankomsterna är X1,X2,,Xn{X}_{1}, {X}_{2}, \dots , {X}_{n} . Den angivna tidsperioden är 22 timmar som motsvarar 120120 minuter och väljer att räkna i minuter så att varje S.V. Xi{X}_{i} motsvarar tiden i minuter mellan varje ankomst.


Istället för att räkna på nn antal olika S.V räknar vi numera på den totala tid Y=X1+X2++XnY={X}_{1} + {X}_{2} + \dots + {X}_{n} som det tar för nn studenter att anlända. Sannolikheten för att det kommer nn personer eller fler ges av tidsjämförelsen P(Y120)P(Y \le 120) .


Sannolikheten att det kommer nn studenter eller fler är ekvivalent med sannolikheten att den totala tiden för studenternas ankomst YY understiger eller motsvarar 120120 minuter. Detta ger oss att P(Y120)=0.15P(Y \le 120)=0.15


Vi antar nu att YY är approximativt normalfördelad så att



YN(nμ,σn)=YN(8n,4n). Y \in N(n \mu , \sigma \sqrt{n}) = Y \in N(8n, 4 \sqrt{n}) .



Detta ger oss att



P(Y120)=0.15Φ(1208n4n)=0.15P(Y \le 120) =0.15 \, \, \Rightarrow \, \, \Phi \left( \frac { 120-8 n }{ 4 \sqrt{n} } \right)=0.15



och avslutningen ekvationen



1208n4n=λ0.15=1.0365\frac{120-8n}{4\sqrt{n}}=-{\lambda}_{0.15}=-1.0365



Vi löser ut nn och får svaret n17n\approx 17 personer.


Comments

Lina Ljungqvist

Finns det något "miniräknar-hack" för att lösa ut n?

Christian Abdelmassih

Tyvärr inte, miniräknartricksen funkar bara när input-parametrarna är givna. I detta fall hade vi t.ex kunnat räkna ut 0.150.15 i raden ovan med enkelhet om vi haft nn . Nu är fallet bakvänt.

Anna-Mona J Vuitton

jag förstår inte hur n löses ut...

Ariel Blomqvist Rova

Hahaha :) Sanning.

Omar Ali

Knas

Martin Lindberg

Tjipp! I fördelningsfunktionen finns här både variablerna x & t. Ska det vara så? Eller har tryckfelsdino varit framme?

Christian Abdelmassih

@martinlindberg: Japp det ska vara det! tt är bara en variabel som används för integrationen för att xx redan är upptagen. På wikipedia hittar du samma formel :)

Klara Bergman

Varför blir lambda negativ i ekvationen?

Christian Abdelmassih

Om du tar en titt i tabellsamlingen i tabell 2 så ser du att P(X>λα)=αP(X>{\lambda}_{\alpha})=\alpha . I vårt fall är sannolikheten omvänd P(Y120)P(Y \le 120) och därför behöver lägga till ett minustecken. Men ja, jag håller med om att det inte framgick i svaret. Ska uppdatera det inom kort :)

Mollie Wejdenstolpe

Jag förstår att P(Y≤120)=Φ( ​120-8n/4√ ​n​​ )=0.15. Och att P(X>λ ​α ​​ )=α, och i vårt fall är α=0.15, vilket innebär att vi kan sätta dem lika med varandra: P(Y≤120)= P(X>λ ​α ​​), men vad händer sedan? Hur får vi det innanför Φ att vara lika med -λ ​α?

Christian Abdelmassih

@mollie: Om du tar en titt i tabellsamlingen på tabell 1 så ser du att argumentet för Φ är xx och om vi sedan tittar i tabell 2 så ser du att det xx mäter i förra tabellen motsvaras av λα{\lambda}_{\alpha} i den andra tabellen. Med det sagt så letar vi efter punkten där arean α=0.15\alpha=0.15 är som naturligt blir $${\lambda}_{0.15}$$ fast med ett minus.