Lesson 6

Väntevärden, linjärtransform & Stora talens lag

38

Väntevärde

Av alla värden i utfallsrummet finns det ofta en del som händelsen oftare resulterar i. Väntevärdet är det förväntade utfallsvärdet borde ligga i närheten av och inte det värde som det är högst sannolikhet att bli. Som exempel tar vi en titt på illustrationerna nedan.


Sannolikhetsfördelningarna har båda väntevärdet 2


Väntevärdet kan jämföras med ett objekts tyngdpunkt och beräknas lite olika beroende på om man befinner sig i den kontinuerliga eller diskreta domänen. Väntevärdet tas med hänsyn till stokastiska variabler tex XX betecknas E(X)E(X) . Formel för väntevärdet är:




E(X)={xfX(x)dx,kontinuerlig s.v.kkpX(k),diskret s.v.E(X) = \begin{cases} \int _{ -\infty }^{ \infty }{ x{ f }_{ X }\left( x \right) dx } \, \, , \, \quad \text{kontinuerlig s.v.} \\ \sum _{ k }^{ }{ kp_{ X }\left( k \right) \, \, , \, \, \, \quad \text{diskret s.v.} } \end{cases}



Men för att definiera ett intervall av de förväntade värdena som bör uppstå räcker det inte med väntevärdet självt.

Varians och standardavvikelse

Så som ovanstående illustration visar kan väntevärdet ge en ganska skev uppfattning om sannolikhetsfördelningen. Till detta används två spridningsmått som är väldigt lika, varians och standarsavvikelse.


Variansen V(X)V(X) beräknas genom:



V(X)=E(X2)E2(X)V(X) = E({X}^{2})-{E}^{2}(X)



När variansen är beräknad är det möjligt att ta fram standardavvikelsen med enkelhet genom:


D(X)=V(X)D(X)=\sqrt{V(X)}



Exercise

En s.v. XX har täthetsfunktionen fX(x)=2x2,0x1{f}_{X}( x)=2{x}^{2}\, \, , \, \, 0\le x\le 1 . Beräkna väntevärdet och standarvvikelsen.

Solution

Vi beräknar variansen genom V(X)=E(X2)E2(X)V(X) = E({X}^{2})-{E}^{2}(X) och börjar med att beräkna väntevärdet



E(X)=01x2x2dx=201x3dx=214=0.5E(X)=\int _{ 0 }^{ 1 }{ x* } 2{ x }^{ 2 }dx=2\int _{ 0 }^{ 1 }{ { x }^{ 3 } } dx=2*\frac { 1 }{ 4 } =0.5



för att sedan få fram E2(X)=0.52=0.25{ E }^{ 2 }(X)={ 0.5}^{ 2 } =0.25 . Vi fortsätter därefter med



E(X2)=01x2fX(x)dx=01x22x2dxE({ X }^{ 2 })=\int _{ 0 }^{ 1 }{ { x }^{ 2 }{ f }_{ X }(x)dx } =\int _{ 0 }^{ 1 }{ { x }^{ 2 }* } 2{ x }^{ 2 }dx


E(X2)=201x4dx=20.2=0.4E({ X }^{ 2 })=2\int _{ 0 }^{ 1 }{ { x }^{ 4 } } dx=2*0.2 =0.4


Avslutningsvis beräknar vi väntevärdet och standardavvikningen



V(X)=E(X2)E2(X)=0.40.25=0.15V(X)=E({ X }^{ 2 })-{ E }^{ 2 }(X)=0.4-0.25=0.15


D(X)=0.15=0.39D(X)=\sqrt { 0.15 } =0.39


Kovarians

Kovarians är det första beroendemåttet som undersöker beroendet mellan två stokastiska variabler. Säg att vi har variablerna XX och YY , då betecknas kovariansen som C(X,Y)C(X,Y) . Värdet på kovariansen ger ett mått på korrelationen, ju högre värde ju starkare relation. Formeln för kovariansen ges av



C(X,Y)=E(XY)E(X)E(Y)C(X,Y)=E(XY)-E(X)E(Y)



Det är väldigt viktigt att inse att korrelationsvärdet C(X,Y)=0C(X,Y)=0 innebär att XX och YY är okorrelerade. Däremot behöver detta nödvändigtvis inte innebära att de är oberoende. Om de däremot är korrelerade så måste de vara beroende.


Korrelationskoefficient

Korrelationskoefficienten ρ(X,Y)\rho(X,Y) är det andra beroendemåttet i kursen. Den kan betraktas som kovariansen utslagen över standardavvikningen som leder till att ρ\rho är begränsad mellan värdet 1-1 och 11 så att 1ρ(X,Y)1-1 \le \rho(X,Y) \le 1 . Korrelationskoefficienten ges av



ρ(X,Y)=C(X,Y)D(X)D(Y)\rho (X,Y)=\frac { C(X,Y) }{ D(X)D(Y) }



I denna mening kan korrelationskoefficienten betraktas som ett renare mått än kovariansen då det medför en tydligare tolkningsförmåga av det faktiska resultatet. Då ρ=0\rho=0 anses variablerna okorrelerade medan då ρ=1\vert \rho \vert=1 eller anses de vara korrelerade. Skillnaden mellan ρ=1\rho=1 och ρ=1\rho=-1 är att 11 motsvarar ett perfekt positivt linjär korrelation medan 1-1 motsvarar ett perfekt negativt linjär korrelation.

Linjärtransform

Säg att vi vill ta reda på väntevärdet av en sammansatt s.v. Z=g(X,Y)Z=g(X,Y) , då är det viktigt lära sig dela upp uppgiften i delproblem genom linjärtransform. Det finns regler för väntevärde, varians och standardavvikning och de är:


  • E(aX+bY+c)=aE(X)+bE(Y)+cE\left( aX+bY+c \right) =aE\left( X \right) +bE\left( Y \right) +c

  • V(aX+bY+c)=a2V(X)+b2V(Y)+2abC(X,Y)V\left( aX+bY+c \right) ={a}^{2}V\left( X \right) +{b}^{2}V\left( Y \right) +2abC\left( X,Y \right)

  • D(aX+b)=aD(X)D\left( aX+b \right) = \vert a \vert D\left( X \right)


Exercise

De s.v. XX och YY har standardavvikelserna 44 och 66 respektive. Deras kovarians är 22 . Beräkna V(4XY42)V( 4X-Y-42) .

Solution

Vi har att:

  • D(X)=4D(X)=4

  • D(Y)=6D(Y)=6

  • C(X,Y)=2C(X,Y)=2

Vi börjar med att dela upp variansutrycket



V(4XY42)=42V(X)+(1)2V(Y)+24(1)C(X,Y)V(4X-Y-42)={ 4 }^{ 2 }V(X)+{ (-1) }^{ 2 }V(Y)+2*4*(-1)*C(X,Y)


V(4XY42)=16V(X)+V(Y)16.V(4X-Y-42)=16V(X)+V(Y)-16.



Vi beräknar nu variansen genom de givna standardavvikelserna:


  • D2(X)=V(X)=42=16{D}^{2}(X)=V(X)={4}^{2}=16

  • D2(Y)=V(Y)=62=36{D}^{2}(Y)=V(Y)={6}^{2}=36


Avslutningsvis får vi


V(4XY42)=16V(X)+V(Y)16=1616+3616=276V(4X-Y-42)=16V(X)+V(Y)-16=16*16+36-16=276



Stora talens lag

Stora talens lag lyder: Om vi har en följd S.V. X1,X2,,Xn{X}_{1}, {X}_{2}, \dots , {X}_{n} som är oberoende med har samma sannolikhetsfördelning och väntevärde μ\mu kommer medelvärdet av dessa X1+X2++Xnn\frac {{X}_{1}+ {X}_{2} + \dots + {X}_{n}}{n} att närma sig väntevärdet μ\mu så att X1+X2++Xnnμ\frac { { X }_{ 1 }+{ X }_{ 2 }+\dots +{ X }_{ n } }{ n } \rightarrow \mu förutsatt att antalet variabler nn är tillräckligt stort.


Som ett exempel kan vi tänka oss att vi har en korthög med 1010 kort från 11 till 1010 som vi drar ett kort från, antecknar resultatet, och lägger tillbaka kortet samt blandar kortleken. Säg att vi gör denna dragning ett stort antal gånger, till exempel 100100 gånger. Vid ett sådant antal dragningar så kommer stora talens lags effekter visa sig.


Om varje enstaka dragning betraktas som en S.V. Xi{X}_{i} är väntevärdet densamma för samtliga alla variabler, och därmed, alla dragningar så att E(Xi)=5.5E({X}_{i})=5.5 .


Stora talens lag säger att om vi gör denna dragning tillräckligt många gånger kommer medelvärdet av dragningarna att närma sig väntevärdet, i detta fall 5.55.5 , oavsett vad korten faktiskt visar vid dragningen!

Comments

Karolin Valaszkai

Om s.v. X & Y är oberoende är kovariansen 0 pga. om oberoende är E(XY)=E(X)*E(Y), right? Kan vara bra att tillägga :)

Fredrik Dahl

väntevärdet?

Fredrik Dahl

varians menar ni?

profile/avatar/default
Peter Bohman

Hur ser det ut ifall vi har D(aX+Yb+c) ? mvh

profile/avatar/default
Peter Bohman

Tusen tack!

Christian Abdelmassih

Standardavvikningen av en summa av stokastiska variabler med respektive koefficienter D(aX+bY+c)D(aX+bY+c) kan tyvärr inte uttryckas i termer av DD . Den närmaste man kan komma till det är att uttrycka D(aX+bY+c)D(aX+bY+c) är i termer av VV , det vill säga D(aX+bY+c)=V(aX+bY+c)D(aX+bY+c)=\sqrt{V(aX+bY+c)} . Hope that helps!

Niklas Kamateros

@ChristianAbdelmassih: Succé. tack så hemskt mycket för att det fixades så snabbt :) Trevlig kväll!

Christian Abdelmassih

Haha, ingen fara! Skriv gärna om det är något mer och lycka till på tentan :)

Erik Dahlström

Vad händer om fX(x) är, t.ex. 2x^5? Blir det 2x^7 eller 2x^10 då?

Christian Abdelmassih

Just precis det blir 2x72{x}^{7}

Erik Dahlström

Ahaaa. Jag fattade det först som att i E(X^2) så kvadreras uttrycket, så det skulle bli 2x^10... Då förstår jag varför du skrivit x^2 * uttrycket (för att vara tydlig?).

Christian Abdelmassih

Just precis! :)

Erik Dahlström

Va, kan du förklara igen? Om E(XY) = E(X)E(Y) så står det ju att C(X,Y) = E(X)E(Y) - E(X)E(Y) = 0?

Christian Abdelmassih

Efter att ha tittat i tidigare anteckningar från kursen och googlat visar det sig att en räknar ut E(XY)E(XY) genom en dubbelintegral på en täthetsfunktion för två variabler (se wiki under Non-multiplicativity) . Med tanke på att ingen sådan funktion introduceras i kursen borde nog E(XY)E(XY) vara given i uppgiften!