Gruppeøvelser i statistikk

Oppgave 9
1. Forklar hva vi mener med et konfidensintervall. Ta utgangspunkt i den binomiske situasjonen.
Om vi gjentar et forsøk mange ganger, vil et 95% konfidensintervall si at andelen konfidensintervall (basert på en estimert sannsynlighet) som inneholder den sanne populasjonsverdien p er 95%.

Binomisk situasjon: X ~ bin(n, p)
Konfidensintervall: p^ +- 1.96 * sqrt(p^(1-p^)/n) hvor sqrt(p^(1-p^)/n) er den estimerte standardfeilen.

Del 1
1. Gjør de beregningene som er nødvendige for å finne de feilmarginene som er oppgitt over.
Feilmarginene her vil si 1.96 * standardfeilene for et 95% konfidensintervall. Leser av partibarometer og får p^ = 0.297 for Ap og 0.250 for Høyre. Vi finner standardfeil ved Sp = sqrt(p^(1-p^)/n) hvor n er 721. Vi får Sp(Ap) ~= 0.017. 0.017 * 1.96 ~= 0.033. Sp(H) ~= 0.016. 0.016 * 1.96 ~= 0.032

2. Hva skal vi mene med øvre og nedre grense for partitilslutning? Gjør de beregningene som er nødvendig for å finne øvre og nedre grense for Arbeiderpartiet og Høyre. Hva synes du om overskriften til NRK: Dårlig måling for Støre: Ap under 30 prosent
Med øvre og nedre grense mener vi konfidensintervall. Formelen for et 95% konfidensintervall er p^ +- 1.96 * Sp. Vi får for Ap: 0.297 +- 0.033. For høyre får vi: 0.250 +- 0.032. Sannsynligheten for at den sanne oppslutningen for Ap er over 30% er nesten like stor som at den er under. Litt misvisende overskrift.

3. Kan vi bruke tilnærmingen til normalfordelingen i de beregningene vi gjør her? Hvor er det vi bruker den i våre beregninger?
Vi bruker antagelsen når vi regner ut feilmargin og konfidensintervall (øvre/nedre partigrense). Vi kan bruke tilnærmingen pg.a. sentralgrenseteoremet. np og nq er > 5.

Del 2
4. Gi en begrunnelse for at en skulle vente en binomisk fordeling med samme p hvis risikoen for spontanabort var den samme for hver kvinne.

  1. Kvinnene er uavhengig fra hverandre
  2. Vi kan måle om hendelsen spontanabort inntreffer
  3. Sannsynligheten for spontanabort er samme og konstant for hver kvinne

5. Hvilken andel av det totale antallet graviditeter har resultert i spontanabort?
p^ = ((28 + 14 + 15 + 24) = 81) / (70 * 4 = 280) ~= 0.29

6. Beregn et 95% konfidensintervall for andelen spontanaborter. Forklar med ord hva denne betyr. Kan vi bruke tilnærmingen til normalfordelingen her?
p^ ~= 0.29
Sp ~= 0.027
Feilmargin ~= 0.053
95% KI: (0.24, 0.34)
Vi tolker det slik at intervallet (0.24, 0.34) har en 95% for å inneholde den sanne populasjonsverdien p.

Vi kan bruke tilnærming pg.a. sentralgrenseteorem og np & nq > 5.

7. Hvis den binomiske sannsynligheten p settes lik denne andelen, beregn da de forventede antall kvinner med henholdsvis 0, 1, 2, 3 og 4 aborter. Sammenlign med den observerte fordelingen over. Diskuter eventuelle avvik.
(4 0): 0.254 * 70 = 17.78
(4 1): 0.415 * 70 = 29.05
(4 2): 0.254 * 70 = 17.78
(4 3): 0.069 * 70 = 4.83
(4 4): 0.007 * 70 = 0.49

Fra tabellen:
(4 0): 24
(4 1): 28
(4 2): 7
(4 3): 5
(4 4): 6

Vi ser at de forventede tallene vi får ikke stemmer så godt overens med tallene vi observerer. Dette kan tyde på at fordelingen vi har ikke er binomisk og at f.eks. p ikke er lik for alle kvinner.

Oppgave 10
1. Hva er sannsynligheten for at en (tilfeldig valgt) pasient med metabolsk syndrom har hjerte- og karsykdom. Finn et konfidensintervall for denne andelen.
p^ = 29/198 ~= 0.146
Sp ~= 0.025
95% KI: (0.097, 0.195)

2. Beregn differansen i andelen med hjerte- og karsykdom for dem med og uten metabolsk syndrom. Beregn også konfidensintervallet for differansen. Dette må du regne ut for hånd!
p^1 = 0.146
p^2 = 8/73 ~= 0.110
RD = 0.146 – 0.110 = 0.036

Regner ut konfidensintervall:
Finner felles standardfeil Sf = sqrt((p^1 * (1 – p^1) / n1) + (p^2 * (1 – p^2) / n2)) ~= 0.044
95% konfidensintervall er gitt ved: RD +- 1.96 * Sf
Vi får konfidensintervall (-0.05, 0.12).

3. Beregn relativ risiko (RR), med konfidensintervall.
RR = 0.146 / 0.110 ~= 1.33

95% konfidensintervall for RR er definert ved RR * e^(+- 1.96 * SRR) hvor SRR = sqrt(1/29 + 1/8 – 1/198 – 1/73) ~= 0.375. Da får vi konfidensintervall (0.64, 2.77).

4. Beregn også odds ratio (OR), med konfidensintervall.
OR = (29/169) / (8/65) ~= 1.39

95% konfidensintervall for OR er definert ved OR * e^(+- 1.96 * SOR) hvor SOR = sqrt(1/29 + 1/8 + 1/169 + 1/65) ~= 0.425. Da får vi konfidensintervall (0.60, 3.20).

5. Du har i pkt. 2, 3 og 4 beregnet tre alternative mål for effekten som metabolsk syndrom har på hjerte- og karsykdom. Hvilket av disse ville du bruke hvis du skal presentere dette for en gruppe lekfolk?
Alle effektmålene har egne styrker. I denne sammenhengen ville jeg valgt RR eller RD da disse er lettere å forstå. Vi får at en pasient med metabolsk syndrom er ~33% (1.33) mer eksponert for hjerte- og karsykdom. RD forteller oss at den reelle forskjellen er ~3.6%.

6. Sett opp nullhypotesen for å studere om andelene med hjerte- og karsykdom er like for
dem med og uten metabolsk syndrom. Test nullhypotesen. Hvilken konklusjon finner
du?
Vi kan bruke Y-test og Chi-kvadrat-test.

Y-test:
Setter α-nivå = 0.05
H0: p1 = p2
HA: p1 != p2

p^1 ~= 0.146
p^2 ~= 0.110

Finner z-skår, altså Y = (p^1 – p^2) / sqrt(((1/n1)+(1/n2))*p-(1-p-)) hvor p-, den gjennomsnittlige p, = (x1 + x2) / (n1 + n2). Vi får da Y ~= 0.77 som gir i tabellen 0.7794. P-verdi blir da 2*(1 – 0.7794) ~= 0.44. Dette er mye større enn 0.05. Vi kan ikke forkaste H0.

Chi-kvadrat-test:
H0: p1 = p2
HA: p1 != p2

Andel med metabolsk syndrom: 198/271 ~= 0.73
Forventet andel med metabolsk syndrom med hjerte- og karsykdom: 37*0.73 = 27.01
Forventet andel med metabolsk syndrom uten hjerte- og karsykdom: 234*0.73 = 170.82

Andel uten metabolsk syndrom: 73/271 ~= 0.27
Forventet andel uten metabolsk syndrom med hjerte- og karsykdom: 37*0.27 = 9.99
Forventet andel uten metabolsk syndrom med hjerte- og karsykdom: 234*0.27 = 63.18

Vi regner ut teststørrelse X^2:
X^2 = (29 – 27.01)^2 / 27.01 + (169 – 170.82)^2 / 170.82 + (8 – 9.99)^2 / 9.99 + (65 – 63.18)^2 / 63.18 ~= 0.61

Antall frihetsgrader: (kolonner – 1) * (rader – 1) = 1
For α-nivå 0.05 har vi en verdi 3.84. Fordi teststørrelsen vi fant er mye mindre enn 3.84, kan vi ikke forkaste H0.

Oppgave 11
1. Bruk tabellen til å undersøke om andelen med hjerte- og karsykdom avhenger av om personen er overvektig eller ikke. Sett opp en nullhypotese og test den.
Vi kan bruke Y-test og Chi-kvadrat-test.

Y-test:
Setter α-nivå = 0.05
H0: p1 = p2
HA: p1 != p2

p^1 ~= 0.19
p^2 ~= 0.060

Finner z-skår, altså Y = (p^1 – p^2) / sqrt(((1/n1)+(1/n2))*p-(1-p-)) hvor p-, den gjennomsnittlige p, = (x1 + x2) / (n1 + n2). Vi får da Y ~= 6.32 som gir i tabellen > 0.9998. P-verdi blir da < 2*(1 – 0.9998) ~= 0.0004. Dette er mye mindre enn 0.05. Vi kan med god sikkerhet forkaste H0.

Chi-kvadrat-test:
H0: p1 = p2
HA: p1 != p2

Andel med overvekt: 312/994 ~= 0.31
Forventet andel med overvekt med hjerte- og karsykdom: 100*0.31 = 31
Forventet andel med overvekt uten hjerte- og karsykdom: 894*0.31 = 277.14

Andel uten overvekt: 682/994 ~= 0.69
Forventet andel uten overvekt med hjerte- og karsykdom: 100*0.69 = 69
Forventet andel uten overvekt med hjerte- og karsykdom: 894*0.69 = 616.86

Vi regner ut teststørrelse X^2:
X^2 = (60 – 31 )^2 / 31 + (40 – 69)^2 / 69 + (252 – 277.14)^2 / 277.14 + (642 – 616.86)^2 / 616.86 ~= 42.62

Antall frihetsgrader: (kolonner – 1) * (rader – 1) = 1
For α-nivå 0.05 har vi en verdi 3.84. Fordi teststørrelsen vi fant er mye større enn 3.84, kan vi med god sikkerhet forkaste H0.

2. Bruk differansen i andelen med hjerte- og karsykdom som effektmål for effekten av overvekt på hjerte- og karsykdom. Finn et estimat for effekten og lag et konfidensintervall (for hånd!).
p^1 ~= 0.19
p^2 ~= 0.060
RD = 0.19 – 0.060 = 0.13

Regner ut konfidensintervall:
Finner felles standardfeil Sf = sqrt((p^1 * (1 – p^1) / n1) + (p^2 * (1 – p^2) / n2)) ~= 0.024
95% konfidensintervall er gitt ved: RD +- 1.96 * Sf
Vi får konfidensintervall (0.083, 0.18).

3. Bruk relativ risiko som effektmål. Beregn den og finn et konfidensintervall for den.
RR = 0.19 / 0.060 ~= 3.17

95% konfidensintervall for RR er definert ved RR * e^(+- 1.96 * SRR) hvor SRR = sqrt(1/60 + 1/40 – 1/312 – 1/682) ~= 0.19. Da får vi konfidensintervall (2.18, 4.60).

4. Bruk odds ratio som effektmål, beregn den og finn konfidensintervallet.
OR = (60/252) / (40/642) ~= 3.82

95% konfidensintervall for OR er definert ved OR * e^(+- 1.96 * SOR) hvor SOR = sqrt(1/60 + 1/40 + 1/252 + 1/642) ~= 0.22. Da får vi konfidensintervall (2.48, 5.88).

5. Les inn tabellen over i SPSS. Lag variabelnavn, variabel labels og value labels og
presenter selve tabellen.
Kommer senere

6. Beregn RR, OR med tilhørende konfidensintervall ved å bruke SPSS.
Kommer senere

7. Hvordan vil du presentere sammenhengen mellom overvekt og hjerte- og karsykdom, og hvordan vil du konkludere om sammenhengen mellom overvekt og hjerte- og karsykdom?
Alle effektmålene har egne styrker. I denne sammenhengen ville jeg valgt RR eller RD da disse er lettere å forstå. Vi får at en pasient med overvekt er ~317% (3.17) mer eksponert for hjerte- og karsykdom. RD forteller oss at den reelle forskjellen er ~13%. Vi ser at om H0 for RR = 1 og RD = 0, er ingen av disse inkludert i deres tilsvarende 95% konfidensintervall. Vi kan si med 95% sikkerhet at det er en betydelig sammenheng mellom overvekt og økt forekomst av hjerte- og karsykdom.


ForeleserSimon Lergenmuller

Ressurser
Oppgaver

Gruppeøvelser i statistikk

Oppgave 6
Symptomer som vedvarende hoste og blodtilblandet oppspytt kan være symptomer på lungekreft, og vi vil studere denne muligheten nærmere. I data fra Kreftregisteret finner vi at det i 1993 var fem tilfeller av lungekreft blant norske menn i alderen 30‐39 år. Befolkningstallet av menn i denne aldersgruppen var 325.000. Prevalensen av lungekreft vil omtrent være lik insidensen og kan derfor settes lik 5/325.000.

1. Vedvarende hoste kan være et symptom på lungekreft. Hvis slik hoste betraktes som en diagnostisk indikator, kan en anslå at sensitiviteten er 95%, mens spesifisiteten er 90%. Forklar hva disse tallene betyr i den konkrete sammenhengen vi har her.
Sensitivitet
Hva er sannsynlighet for at en syk pasient får positivt utslag på en test?
Sannsynligheten for at pasienten har hoste gitt lungekreft.

Spesifisitet
Hva er sannsynligheten for at en frisk pasient får negativt utslag på en test?
Sannsynligheten for at pasienten ikke har hoste gitt ikke lungekreft.

2. Beregn den positive prediktive verdi av hoste som symptom på lungekreft for en mann i alderen 30‐39 år. Forklar hva tallet betyr.
Sensitivitet: 0.95
Spesifisitet: 0.90
Vi bruker Bayes lov:
PPV = Sensitivitet * Prevalens / (Sensitivitet * Prevalens + (1 – Spesifisitet) * (1 – Prevalens)) = (0.95 * 5/325000) / ((0.95 * 5/325000) + (1 – 0.90) * (1 – 5/325000)) ~= 0.000146 = 0.00015 = 0.015%

PPV er sannsynligheten for at en positiv diagnose er riktig.

3. Sammenlign med prevalensen: hvor mye vil sannsynligheten for lungekreft være forøket når det foreligger vedvarende hoste?
PPV: Sannsynligheten for at pasienten har lungekreft gitt hoste, dvs. 0.015%. Prevalensen er 0.0015%. En pasient med vedvarende hoste er ti ganger mer sannsynlig å ha lungekreft.

4. Hvis det foreligger både vedvarende hoste og blodtilblandet oppspytt, og vi betrakter kombinasjonen som en diagnostisk indikator for lungekreft, vil sensitiviteten bli redusert til 90%, mens spesifisiteten øker til 99%. Forklar hvorfor det å innføre en kombinasjon av to symptomer, og forlange at begge skal være tilstede, generelt må forventes å føre til redusert sensitivitet og forøket spesifisitet.
Sensitiviteten i denne sammenhengen vil da være sannsynligheten for at en pasient med lungekreft har både vedvarende hoste og blodtilblandet oppspytt. Kriteriene er strengere og det er derfor færre pasienter som regnes med enn når vi bare behøvde en enkel indikator. På den andre siden er det flere som blir regnet med i spesifisiteten, da alle andre kombinasjoner enn begge symptomer havner i spesifisiteten (dvs. enten vedvarende hoste eller blodtilblandet oppspytt og ingen av delene vs. begge deler).

5. Hvis det i tillegg er kjent at pasienten røyker 20‐25 sigaretter per dag vil prevalensen være ti ganger så høy som det som ble benyttet ovenfor. Beregn nå den positive prediktive verdi. Hvor mye er den forøket i forhold til det du fant over? Bruk sensitivitet og spesifisitet fra pkt. 1.
Sensitivitet: 0.95
Spesifisitet: 0.90
Vi bruker Bayes lov:
PPV = Sensitivitet * Prevalens / (Sensitivitet * Prevalens + (1 – Spesifisitet) * (1 – Prevalens)) = (0.95 * (50/325000)) / ((0.95 * (50/325000)) + (1 – 0.90) * (1 – (50/325000))) ~= 0.00146 = 0.146% ~= 0.15%. Denne er 100 ganger større enn 0.0015%.

Oppgave 7
1. Forklar hva vi mener med en binomisk sannsynlighetsfordeling. Hvilke betingelser må være oppfylt for at variabel skal være binomisk fordelt?
ref
En suksessfordeling av binære utfall ved n forsøk.

  • Begivenhetene må være uavhengige
  • Begivenhetene må være binære (to utfall)
  • Sannsynlighetene for utfallene må være statiske

2. Diskuter hva vi mener med en statistisk nullhypotese og alternativhypotesen.
Ved hypotesetesting forsøker vi å bevise en alternativhypotese ved å falsifisere en (nøytral) nullhypotese. Nullhypotesen er en beskrivelse av en antatt virkelighet. Alternativhypotesen er en beskrivelse vi prøver å bevise er en bedre antagelse.

3. Sett opp en nullhypotese og en alternativhypotese for sannsynligheten p i en binomisk situasjon.
ref

4. Diskuter hva vi mener med en p-verdi. Hvordan regner vi ut en p-verdi i en binomisk situasjon?
ref

En (europeisk) rulett har 37 felter, som er nummerert 0 og 1 til 36. Feltet 0 har fargen grønn, 18 er røde og 18 er sorte. Croupieren (spillelederen) spinner hjulet og ruller en liten ball langs hjulet i motsatt retning. Hjulet er balansert slik at det er like sannsynlig å lande på alle feltene. Spillerne kan spille på alle kombinasjoner av tall og farger.

5. Hva er sannsynligheten for at kulen skal falle på rødt?
18/37

6. En spiller bestemmer seg for å spille 6 ganger. Han teller opp antall ganger kulen faller på rødt felt og kaller dette antallet for X. Hva slags sannsynlighetsfordeling har da X?
Binomisk fordeling

7. Spilleren observerer at det kommer rødt 6 ganger etter hverandre. Han betviler at spillet er rettferdig, og vil bruke sin statistiske kunnskap til å utføre en statistisk test før han bestemmer seg for å «avsløre» om spillet er urettferdig. Hva er den statistiske nullhypotesen og hva er alternativhypotesen han setter opp?
H0: P(R) = 18/37
H1: P(R) != 18/37 (i denne sammenheng P(R) > 18/37)

8. Spilleren baserer selve testen på antall ganger han får rødt, altså X, og velger å forkaste nullhypotesen når X er stor. Hva er p-verdien for testen han utfører?
P(6R) = (6 av 6) * (18/37)^6 * (19/37)^0 = (6!/6!) * (18/37)^6 ~= 0.013 = 1.3%. P-verdien er 1.3%. Dette er under det typiske signifikansnivået på 5% som vil si at vi kan forkaste H0.

9. Hvis spilleren hadde observert 5 røde, og ikke 6 som over, hva hadde p-verdien vært da?
P(5R) = (5 av 6) * (18/37)^5 * (19/37) = (6!/(5!)) * … ~= 0.084 = 8.4%. Dette er over det typiske signifikansnivået på 5% som vil si at vi ikke kan forkaste H0.

10. Basert på resultatet med 6 kuler på rad på rødt, vil du gå til ledelsen for kasinoet og fortelle dem at spillet deres er urettferdig?
Det kan jo godt være en tilfeldighet, men om det skjedde konsekvent ville jeg sagt ifra. Utvalget vårt (antall observasjoner) er for “øyeblikket” for lite til å konkludere med sikkerhet.

Oppgave 8
Vi vet at forhøyet kolesterol er en risikofaktor for hjertesykdom. Det kan derfor være viktig å holde kolesterolnivået lavt, og forhindre moderat eller uttalt forhøyet nivå. Vi sier i denne sammenhengen at forhøyet kolesterol er verdier over 250 mg/dL (=6.5 mmol/l). Vi ønsker å kontrollere kolesterolnivået hos barn. Fra tidligere vet vi fra store studier av 
kolesterol (i blod) hos barn i alderen 2-14 år at gjennomsnittet er 175 mg/dL og standardavviket er 30 mg/dL.

1. Anta nå at målt kolesterol kan betraktes som normalfordelt. Hva er da sannsynligheten for at et barn skal ha kolesterolnivå over 250 mg/dL?
μ = 175 mg/dL
σ = 30 mg/dL
Vi standardiserer fordelingen ved Y = (X – μ)/σ.
P(Y > 250) = 1- P(Y < 250) = 1 – P((X – 175)/30 < ((250 – 175)/30) = 1 – P((X – 175)/30 < 2.5) = 1 – 0.9938 = 0.0062 = 0.62%
*Har stått feil her tidligere (-2.5), men riktig svar

2. Hvis vi undersøker 50.000 barn hvert år, hvor mange vil vi oppdage med forhøyet kolesterolverdi?
E(X) = 50000 * 0.0062 = 310

3. Hvor høyt kolesterolnivå har du hvis du er blant de 10% med høyest kolesterol?
P(Y < z) = 0.9
Sannsynligheten for å finne en verdi med standardavvik mindre enn en tenkt standardisert verdi x er 90%, dvs. den tenkte verdien er blant de høyeste 10%.

Ser i tabellen og finner at x = 1.28. Det nærmeste vi kommer 0.9000 er 0.8997. Gjør om fra standardisert format ved Y = (X – μ)/σ. 1.28 = (X – 175)/30 –> X = 213.4. Det vil si at en må ha kolesterolnivå på minst ~213.4 mg/dL for å kvalifiseres innen topp 10%.

Vi antar at det er sammenheng mellom forhøyet kolesterol hos foreldre og hos barn. I et utvalg av menn som har hatt hjerteinfarkt og som har forhøyede kolesterolverdier (altså verdier ≥ 250 mg/dL), måles kolesterolverdiene til deres barn i alderen 2-14. Gjennomsnittlig kolesterol for disse er 207 mg/dL, fortsatt med et standardavvik på 30 mg/dL.

4. Hva er sannsynligheten for at et barn, med en far som har hatt hjerteinfarkt, skal ha et kolesterolnivå mellom 207 mg/dL og 250 mg/dL?
P(Y>207) og P(Y<250)
Y = (X – μ)/σ.
P((X – 207)/30 > (207 – 207)/30)  = 1 – P((X – 207)/30 < 0) = 0.5000
P((X – 207)/30 < (250-207)/30) = P((X – 207)/30 < 1.43) = 0.9236
0.9236 – 0.5000 = 0.4236

5. Hva er sannsynligheten for at et barn med en far som har hatt hjerteinfarkt skal ha forhøyet kolesterolverdi?
P(Y>250) = 1 – P(Y<250) = 1 – P((X-207)/30) < (250-207)/30) = 1 – 0.9236 = 0.0764 = 7.64%

6. Hvis man undersøker 1.000 barn med fedre som har hatt infarkt, hvor mange vil man da oppdage? Kommenter dette resultatet opp mot det du fant i 2.
1000 * 0.0764 = 76.4
50000 * 0.0764 = 3820
I #2 var det 310.
3820 / 310 ~= 12.3 ganger flere.
(Evt. 0.0764 / 0.0062 ~= 12.3)

7. Vil du anbefale tester av kolesterol blant barn (og av utvalgte risikogrupper) for å avsløre forhøyet kolesterol?
Ja.

Vi ser på ut utvalg på 10 barn som har fedre som har hatt hjerteinfarkt og som har forhøyede kolesterolverdier. Sannsynligheten for at et tilfeldig valgt barn har forhøyet kolesterolverdier er den du fant i 5.

8. Kan dette antas å være et binomisk forsøk? Hvilke kriterier må være til stede?
En suksessfordeling av binære utfall ved n forsøk.

  • Begivenhetene må være uavhengige
  • Begivenhetene må være binære (to utfall)
  • Sannsynlighetene for utfallene må være statiske

Ja.

9. Hva er sannsynligheten for at mindre enn 2 av disse har forhøyet kolesterolverdier? Er det greit å bruke tilnærmingen til normalfordelingen her?
Nei, da utvalget ikke er stort nok.

Mindre enn 2 = 1 og 0
P(<2) = (1 av 10) * 0.0764^1 * (1-0.0764)^9 + (0 av 10) * 0.0764^0 * (1-0.0764)^10
P(<2) = 0.3736 + 0.4517 = 0.8253 ~= 0.83 = 83%


ForeleserSimon Lergenmuller

Ressurser
Oppgaver

Hypotesetesting

Hypotesetesting er en metode i statistikk vi bruker for å kvantifisere usikkerhet og variasjon. Hva skjer om vi f.eks. tester et legemiddel på alt for små utvalg? Hva om det testes bare på menn? Utvalgene i legemiddeltester har inntil nylig bestått av 90% menn. Hvordan kan vi vite om observasjonene våre skyldes tilfeldigheter eller ikke? Dette kan vi finne svar på gjennom hypotesetesting.

Vi setter opp en nøytral nullhypotese (H0) og en alternativ hypotese (H1). Vi ønsker å vise at H1 er sann ved å undergrave H0. Formålet er å undersøke om datamaterialet gir tilstrekkelig grunnlag for å forkaste H0 til fordel for H1 med høy grad av sikkerhet. Vi regner ut en “p-verdi“, eller “signifikanssannsynlighet” med en antagelse om at H0 er sann og sammenligner med et “signifikansnivå” som bestemmes i forkant av forsøket. Dersom p-verdien er lavere enn signifikansnivået, sier vi at det er grunnlag for å forkaste H0. Det er vanlig at signifikansnivået er satt til 5%. Jo lavere signifikansnivå, jo sikrere vil konklusjonen være. Ved 5% signifikansnivå aksepterer vi at det er en risiko på 5% for å feilaktig forkaste H0. Dette kaller vi en feil av type I. Det motsatte, at vi ikke forkaster H0 selv om den er feil, kaller vi en feil av type II. Denne typen feil skyldes ofte at datamaterialet er for lite.

Hva er “p-verdi” og “signifikansnivå“?
Både p-verdi og signifikansnivå er verdier mellom 0 og 1.

La oss si at vi mistenker at en mynt havner på kron alt for ofte. Da er nullhypotesen P(K) = 0.5 og alternativhypotesen P(K) > 0.5. Av antall forsøk n vil det være a antall mynter som lander på kron. Dersom a er tilstrekkelig større enn 1/2 av n, kan vi forkaste H0. Med tilstrekkelig mye større menes da at a er større enn en verdi c. Verdien c velger vi utifra hvor sannsynlig vi vil at konklusjonen skal være. Vi vil at sannsyligheten for at vi forkaster H0 feilaktig skal være minst mulig. Denne sannsynligheten kaller vi “signifikansnivået”, ofte satt til 0.05 (5% sannsynlighet for at assosiasjonene vi har observert er tilfeldige). P-verdien er sannsynligheten for et testresultat dersom betingelsene i H0 er sanne.

La oss si at vi i et forsøk har fått at 70 av 100 mynter lander på kron. Vi går ut ifra at H0 er sann og ser på hvor sannsynlig det er å få dette resultatet (70/100 kron) eller noe mer ekstremt dersom P(K) = 0.5, altså P(X >= 70 | H0). Dette kunne vi regnet ut for hånd ved hjelp av den binomiske sannsynlighetsfordelingen, men det hadde vært tungvint. Det viser seg imidlertid at den binomiske fordelingen nærmer seg en normalfordeling når n, antall forsøk, er stort (ved sentralgrenseteoremet). Vi kan derfor forenkle utregningen via. en såkalt “normaltilnærmelse”

Når vi skal finne normalfordelingen som er mest lik histogrammet vårt, tar vi utgangspunkt i forventningen (μ) og standardavviket (σ) til den binomiske fordelingen. For en binomisk fordeling gjelder:

  • Forventning, E(X) = n * p
  • Varians, var(X) = n * p * (1 – p)

Derfor har vi at normalfordelingen har:

  • Forventning, E(X), μ = n * p
  • Standardavvik, SD(X), σ = sqrt(n * p * (1 – p))
    Siden Var(X) = SD(X)^2

Utregning
P(K) = 0.5
N = 100
μ = 100 * 0.5 = 50
σ = sqrt(50 * (0.5)) = sqrt(25) = 5
Normaltilnærmelsen er best når μ >= 5 og Var(X) >= 5.

Det neste steget er å standardisere normaltilnærmelsen vår, Y ~ N(0, 1). Vi trekker μ fra X slik at standardfordelingen får sentrum i 0, og deler på σ for å få et standardavvik = 1. Y = (X – μ) / σ.

Vi er interessert i P(X >= 70) = 1 – P(X <= 70). P(X <= 70) = P((X – 50)/5 <= (70 – 50)/5) = P(Y <= 4). På engelsk, kaller vi 4 for z-skåren (z-score). Den sier noe om hvor mange standardavvik verdien vår ligger unna gjennomsnittet (0). Gjennomsnittet av utfallene i et forsøk med en stokastisk variabel vil nærme seg forventningen dersom forsøket gjentas tilstrekkelig mange ganger. På normalfordelingstabellen ser vi at en z-skår på 4 gir oss en sannsynlighet på 0.99997. Det vil si at sannsynligheten for at en tilfeldig valgt verdi ligger et mindre antall standardavvik fra gjennomsnittet enn 4 er 99.997%. Videre regner vi ut at 1 – 0.99997 = 0.00003 = 0.003%. Verdien vi har funnet nå er p-verdien, altså sannsynligheten for at vi får at 70 / 100 mynter lander på kron dersom H0 er sann, P(K) = 0.50. Med et signifikansnivå på 5%, kan vi forkaste H0 med relativt god sikkerhet og konkludere med at H1 er sann, altså at mistanken vår om at mynten landet på kron alt for ofte var vel begrunnet.

Estimering
Et utvalg på 1000 pasienter forteller oss ikke nødvendigvis virkeligheten for hele populasjonen. Når det ikke er praktisk mulig å samle data for en hel populasjon må vi estimere (tilnærme) den “sanne sannsynligheten” Estimatsannsynligheten noteres som en p med en “hatt” (^) over, altså p^ dersom “^” var direkte over p’en. Vi ser på p^ som sannsynligheten i et utvalg av en større gruppe og den “sanne sannsynligheten” som en tenkt verdi for hele gruppen. Vi tenker for oss at vi har en stokastisk variabel som er binomisk fordelt, men der sannsynligheten p er ukjent.

Rett fra boka til Aalen et al.:
“Generelt er det liten grunn til å tro at p^ faller eksakt sammen med p, og et viktig spørsmål er hvor mye de med rimelighet kan avvike fra hverandre. Denne usikkerheten kan beskrives ved et såkalt konfidensintervall. Med dette mener vi et område rundt p^ som med stor sannsynlighet dekker den sanne verdien p.” 

Vi har formlene:

  • E(p^) = p
  • SD(p^) = sqrt((p * (1 – p) / n))
    Dette leses som standardfeilen til estimatet p^.
    Om vi vil estimere standardfeilen, erstatter vi bare p i formelen med p^. Da får vi Sp = sqrt((p^ * (1 – p^) / n)).

Konfidensintervallet er bestemt ved p^ +- x * Sp hvor x er en verdi fra normalfordelingstabellen. Jo større x, jo bredere konfidensintervall, og jo større sannsynlighet er det for at den sanne verdien p er inkludert. For eksempel vil et intervall på p^ +- 1.96 * Sp dekke 95% av fordelingen. Intervallet har altså en 95% sannsynlighet for å inneholde p.

Alle formlene er gitt at n er tilstrekkelig stor, evt. går mot ∞.


Foreleser: Magne Thoresen

Ressurser
Presentasjon