Lesson 3

Sannolikhetslärans tre funktioner

40

Inledning

Denna lektion går igenom tre funktioner som har en central del i sannolikhetsläran. De två första av dessa beskriver likartade saker i olika domäner, ena för den diskreta och den andra för den kontinuerliga domänen. Den tredje är ett en förlängning av de båda och kan appliceras på båda domänerna.


En del utfallsvärden av stokastiska variabler förekommer vanligen oftare än andra. I verkligheten är det väldigt sällan att samtliga utfall av en händelse inträffar med lika stor sannolikhet. Allt är inte ett tärningskast under ideella förhållanden. Av denna anledning är det viktigt att inse att det finns olika sannolikhetsfördelningar som beskriver hur sannolikheten är fördelad över utfallen. Denna fördelning varierar beroende på typen av händelse.


Innan man kan beskriva sannolikhetsfördelningar är det viktigt att veta om utfallsrummet är diskret eller kontinuerligt. Om den är diskret används beskrivs fördelningen med sannolikhetsfunktionen medan om den är kontinuerlig beskrivs den med täthetsfunktionen.

Sannolikhetsfunktion

För att kunna beskriva sannolikhetsfördelningar myntas ett begrepp unikt för det diskreta fallet: Sannolikhetsfunktionen pX(x) { p }_{ X }\left( x \right) . Med denna funktion given går det att se hur sannolikheten beror på utfallsvärden där värdet på sannolikhetsfunktionen ger sannolikheten att det värdet uppstår, därmed P(X=x)=pX(x)P\left( X=x \right) ={ p }_{ X }\left( x \right) .


För att knyta an till tidigare exempel med tärningskast visar det sig att ett tärningskast under ideella förhållanden inte beror på utfallsvärdet alls, sannolikheten är alltid 16\frac { 1 }{ 6 } oavsett vilket värde tärningen visar. För utfallet 22 skrivs blir alltså sannolikheten pX(2)=P(X=2)=16{p}_{X}(2)=P(X=2)=\frac { 1 }{ 6 } . Fördelningen är alltså väldigt platt och jämnt fördelad över utfallen.


Säg att tärningen har ett fabriksfel och är obalanserad kommer detta ge en annan sannolikhetsfördelning vilket resulterar i att en del värden uppträder oftare än andra. För att kunna visualisera sannolikhetsfunktionen i såna fall kan man tänka sig ett antal staplar, en för varje utfallsvärde, där varje stapels area representerar sannolikheten för dess utfallsvärde. För en obalanserad tärning med störst chans att få 3,43,4 och därefter 2,52,5 och minst chans att få 1,61,6 kan sannolikhetsfördelningen illustreras såhär


Arean av den markerade stapeln motsvarar sannolikheten


Om vi skulle beräkna pX(3)=P(X=3){p}_{X}(3)=P(X=3) skulle alltså det ge oss arean för den markerade stapeln.

Exercise

Vi har den diskreta sannolikhetsfördelningen som ges av sannolikhetsfunktionen


pX(x)=0.150.85x1{p}_{X}(x)=0.15*{0.85}^{x-1}


Beräkna sannolikheten P(X=2X=3)P(X=2 \cup X=3) .

Solution

P(X=2X=3)P(X=2 \cup X=3) är sannolikheten för att vi får ett utfall med värdet 22 eller 33 beräknar vi varje utfalls sannolikhet att uppstå och adderar deras sannolikheter därefter, alltså P(X=2X=3)=pX(2)+pX(3)P(X=2 \cup X=3) = {p}_{X}(2) + {p}_{X}(3) . Vi får att


pX(2)=0.150.8521=0.150.85=0.1275{p}_{X}(2)=0.15*{0.85}^{2-1}=0.15*0.85=0.1275


pX(3)=0.150.8531=0.150.7225=0.1084{p}_{X}(3)=0.15*{0.85}^{3-1}=0.15*0.7225=0.1084


Detta ger oss


P(X=2X=3)=0.1275+0.1084=0.2359 eller 23.59%P(X=2 \cup X=3)=0.1275+0.1084=0.2359 \, \text{ eller } \,23.59 \, \%


Vidare till nästa funktion som gäller för det kontinuerliga fallet - Täthetsfunktionen!


Täthetsfunktion

För det kontinuerliga utfallsrum och stokastiska variabler används täthetsfunktionen fX(x){ f }_{ X }\left( x \right) för att beskriva sannolikhetsfördelningen. Täthetsfunktionen mäter sannolikhetsdensiteten alltså hur tätpackad sannolikheten är under angivet område. I detta fall är sannolikheten arean under funktionen. Detta betyder två saker.


För det första kan vi inte längre tänka att ett specifikt utfall aa har en sannolikhet P(X=a)P(X=a) . Anledningen till det är att ett specifikt utfall är en punkt och arean under en punkt är noll.


Arean under a är noll


Vi måste istället tänka att vi vill mäta sannolikheten för ett intervall aXba \le X \le b av utfallsvärden där vi integrerar över detta intervall för att ta reda på arean och sannolikheten.


Mellan a och b omsluts arean som motsvarar sannolikheten



Sambandet mellan täthetsfunktion och sannolikhet blir därför



P(aXb)=abfX(x)dxP(a \le X \le b) =\int_{ a }^{ b }{ {f}_{X}(x) dx }



Avslutningsvis kommer vi prata om en ytterligare funktion som också används för att beräkna sannolikhet för intervall av utfall, dock för både det diskreta och kontinuerliga fallet.


Exercise

Vi har den kontinuerliga sannolikhetsfördelningen


fX(x)={0.3e0.3x,x>00,x<0{ f }_{ X }(x)=\begin{cases} 0.3 { e }^{ -0.3 x },\quad x>0 \\ 0, \quad \quad \, \, \, \, \quad x<0 \end{cases}


Beräkna P(2<X4)P( 2 < X \le 4)

Solution

Då vi xx inom intervallet är över noll vet vi att fX(x)=0.3e0.3x{ f }_{ X }(x)=0.3 { e }^{ -0.3 x } . För att ta reda på sannolikheten integrerar vi med 22 som undre gräns och 44 som övre gräns. Att det står 2<X2 < X i intervallet spelar ingen roll och kan antas som 2X2 \le X . Detta så arean under en punkt är noll. Vi beräknar integralen



P(2X4)=24fX(x)=0.3e0.3xdx=[e0.3x]24=0.2476P(2 \le X \le 4) =\int_{ 2 }^{ 4 }{ { f }_{ X }(x)=0.3 { e }^{ -0.3 x } dx }={ \left[ -{ e }^{ -0.3 x }\right] }_{ 2 }^{ 4 }=0.2476



som också motsvarar 24.76%24.76 \, \% .


Fördelningsfunktion

Fördelningsfunktionen skrivs FX(x){ F }_{ X }\left( x \right) är ännu en funktion som beskriver sannolikhetsfördelningar genom intervall. Formellt beskrivs fördelningsfunktionen som P(<Xx)=FX(x)P(-\infty < X \le x)={ F }_{ X }\left( x \right) . Med detta utgår fördelningsfunktionen med att värdet xx är den övre gränsen för intervallet.



Diskreta fallet


För diskreta sannolikhetsfördelningar med sannolikhetsfunktionen pX(k){p}_{X}(k) blir fördelningsfunktionen FX(x){F}_{X}(x) summan av de pX(ki){p}_{X}({k}_{i}) som intervallet omfattar. Anledningen till att vi infört ett kk är för att xx numera är den övre gränsen för intervallet medan kk är värdet på stokastiska variabeln XX . Fördelningsfunktionen beskrivs alltså i det diskreta fallet som



P(<Xx)=FX(x)=kxpX(k)P\left( -\infty < X \le x \right)={ F }_{ X }\left( x \right) =\sum _{ k \, \le \, x }{ p_{ X }\left( k \right) }



För att jämföra med det tidigare illustration av tärningskast skulle FX(3){F}_{X}(3) motsvara



Summan av de staplar som högst har utfallsvärdet 3



Detta då FX(3)=k3pX(k)=pX(1)+pX(2)+pX(3){F}_{X}(3) = \sum _{ k \, \le \, 3 }{ p}_{ X }(k)={p}_{X}(1) + {p}_{X}(2) + {p}_{X}(3) .



Kontinuerliga fallet


För det kontinuerliga fallet beskrivs fördelningsfunktionen FX(x){ F }_{ X }\left( x \right) enklast som integralen av täthetsfunktionen fX(t){f}_{X}(t) med xx som övre gräns. Alltså



P(<Xx)=FX(x)=xfX(t)dtP\left( -\infty < X \le x \right)= { F }_{ X }\left( x \right) =\int _{ -\infty }^{ x }{ { f }_{ X }\left( t \right) dt }



I detta fall är tt värdet på den stokastiska variabeln XX och xx den övre gräns på integralen. Detta kan då illustreras som


Sannolikheten P(X ≤ x) blir en integral med x som övre gräns


Comments

profile/avatar/default
Enzito
breskriver

Typo :)

Christian Abdelmassih

Tack! Det är nu rättat 🙂

Erik Dahlström

Varför gör man skillnad på fördelningsfunktion och täthetsfunktion om de fungerar likadant matematiskt?

Christian Abdelmassih

Om du tittar lite längre ned under Kontinuerliga fallet ser du att FX(x){F}_{X}(x) beror på fX(t){f}_{X}(t) . Detta är för att täthetsfunktionen inte ger sannolikhet, det ger sannolikhetsdensitet. För att beräkna sannolikheten måste man integrera över täthetsfunktionen som just fördelningsfunktionen gör!

profile/avatar/default
Adamkhayyami

Vrf används inte räkningen P(AUB)=P(A)+P(B)-P(AnB)? Borde det inte finnas ett -P(X=2nX=3) också?

Ariel Blomqvist Rova

Ã?verlag tycker jag det är very nice att du har med de tre funktionerna. Jag typ hoppade dom förra gången eftersom det nästan aldrig explicit frågas efter dom på tentorna. Känner dock nu att dom hjälper mig att förstå andra saker bättre!

Christian Abdelmassih

Awesome man! Det handlar mest om att förstå concepten, vilken som används när osv.

Lukas Daxbio Frösslund

Hur vet vi att sannolikheterna ska adderas? Dvs att de är disjunkta?

Christian Abdelmassih

@lukasdaxbiofrsslund: Det har inte riktigt med disjunktering. Då vi bara har en s.v. XX så kan den bara uppta ett värde åt gången. Vi undrar vad sannolikheten PP är då X=2X=2 eller då X=3X=3. Alltså borde vi addera deras sannolikheter.

Lukas Daxbio Frösslund

Förstår! Tack :)