Analyse av to uavhengige grupper: to-utvalgs t-test

Vi bruker to utvalgs t-test når vi skal sammenligne to uavhengige datasett.

Fremgangsmåte

  1. Bestemme hypoteser
    Ofte er H0 slik at µ1 = µ2 og HA: µ1 ≠ µ2
  2. Bestemme α-nivå
  3. Beregne standardavvik og gjennomsnitt for de to gruppene
  4. Vi antar at SD er ~like for de to gruppene og finner felles SD ved Sf = sqrt(((n1 – 1) * s1^2 + (n2 – 1) * s2^2) / n1 + n2 – 2)
  5. Standardfeilen SE(X1 – X2) = Sf * sqrt (1/n1 + 1/n2)
  6. Regne ut teststørrelsen T = (X1 – X2) / SE(X1 – X2)
  7. Sammnligne T med t-verdi fra tabell
    Forkast H0 om T > t

Konfidensintervall
(X1 – X2) +- c * SE(X1 – X2)

Vi antar at gjennomsnittsvariablene som hører til datasettene våre er normalfordelte. Dette gjelder dersom n er tilstrekkelig stor ved sentralgrenseteoremet.


ForeleserMagne Thoresen

Ressurser
Presentasjon

Gruppeøvelser i statistikk

Oppgave 9
1. Forklar hva vi mener med et konfidensintervall. Ta utgangspunkt i den binomiske situasjonen.
Om vi gjentar et forsøk mange ganger, vil et 95% konfidensintervall si at andelen konfidensintervall (basert på en estimert sannsynlighet) som inneholder den sanne populasjonsverdien p er 95%.

Binomisk situasjon: X ~ bin(n, p)
Konfidensintervall: p^ +- 1.96 * sqrt(p^(1-p^)/n) hvor sqrt(p^(1-p^)/n) er den estimerte standardfeilen.

Del 1
1. Gjør de beregningene som er nødvendige for å finne de feilmarginene som er oppgitt over.
Feilmarginene her vil si 1.96 * standardfeilene for et 95% konfidensintervall. Leser av partibarometer og får p^ = 0.297 for Ap og 0.250 for Høyre. Vi finner standardfeil ved Sp = sqrt(p^(1-p^)/n) hvor n er 721. Vi får Sp(Ap) ~= 0.017. 0.017 * 1.96 ~= 0.033. Sp(H) ~= 0.016. 0.016 * 1.96 ~= 0.032

2. Hva skal vi mene med øvre og nedre grense for partitilslutning? Gjør de beregningene som er nødvendig for å finne øvre og nedre grense for Arbeiderpartiet og Høyre. Hva synes du om overskriften til NRK: Dårlig måling for Støre: Ap under 30 prosent
Med øvre og nedre grense mener vi konfidensintervall. Formelen for et 95% konfidensintervall er p^ +- 1.96 * Sp. Vi får for Ap: 0.297 +- 0.033. For høyre får vi: 0.250 +- 0.032. Sannsynligheten for at den sanne oppslutningen for Ap er over 30% er nesten like stor som at den er under. Litt misvisende overskrift.

3. Kan vi bruke tilnærmingen til normalfordelingen i de beregningene vi gjør her? Hvor er det vi bruker den i våre beregninger?
Vi bruker antagelsen når vi regner ut feilmargin og konfidensintervall (øvre/nedre partigrense). Vi kan bruke tilnærmingen pg.a. sentralgrenseteoremet. np og nq er > 5.

Del 2
4. Gi en begrunnelse for at en skulle vente en binomisk fordeling med samme p hvis risikoen for spontanabort var den samme for hver kvinne.

  1. Kvinnene er uavhengig fra hverandre
  2. Vi kan måle om hendelsen spontanabort inntreffer
  3. Sannsynligheten for spontanabort er samme og konstant for hver kvinne

5. Hvilken andel av det totale antallet graviditeter har resultert i spontanabort?
p^ = ((28 + 14 + 15 + 24) = 81) / (70 * 4 = 280) ~= 0.29

6. Beregn et 95% konfidensintervall for andelen spontanaborter. Forklar med ord hva denne betyr. Kan vi bruke tilnærmingen til normalfordelingen her?
p^ ~= 0.29
Sp ~= 0.027
Feilmargin ~= 0.053
95% KI: (0.24, 0.34)
Vi tolker det slik at intervallet (0.24, 0.34) har en 95% for å inneholde den sanne populasjonsverdien p.

Vi kan bruke tilnærming pg.a. sentralgrenseteorem og np & nq > 5.

7. Hvis den binomiske sannsynligheten p settes lik denne andelen, beregn da de forventede antall kvinner med henholdsvis 0, 1, 2, 3 og 4 aborter. Sammenlign med den observerte fordelingen over. Diskuter eventuelle avvik.
(4 0): 0.254 * 70 = 17.78
(4 1): 0.415 * 70 = 29.05
(4 2): 0.254 * 70 = 17.78
(4 3): 0.069 * 70 = 4.83
(4 4): 0.007 * 70 = 0.49

Fra tabellen:
(4 0): 24
(4 1): 28
(4 2): 7
(4 3): 5
(4 4): 6

Vi ser at de forventede tallene vi får ikke stemmer så godt overens med tallene vi observerer. Dette kan tyde på at fordelingen vi har ikke er binomisk og at f.eks. p ikke er lik for alle kvinner.

Oppgave 10
1. Hva er sannsynligheten for at en (tilfeldig valgt) pasient med metabolsk syndrom har hjerte- og karsykdom. Finn et konfidensintervall for denne andelen.
p^ = 29/198 ~= 0.146
Sp ~= 0.025
95% KI: (0.097, 0.195)

2. Beregn differansen i andelen med hjerte- og karsykdom for dem med og uten metabolsk syndrom. Beregn også konfidensintervallet for differansen. Dette må du regne ut for hånd!
p^1 = 0.146
p^2 = 8/73 ~= 0.110
RD = 0.146 – 0.110 = 0.036

Regner ut konfidensintervall:
Finner felles standardfeil Sf = sqrt((p^1 * (1 – p^1) / n1) + (p^2 * (1 – p^2) / n2)) ~= 0.044
95% konfidensintervall er gitt ved: RD +- 1.96 * Sf
Vi får konfidensintervall (-0.05, 0.12).

3. Beregn relativ risiko (RR), med konfidensintervall.
RR = 0.146 / 0.110 ~= 1.33

95% konfidensintervall for RR er definert ved RR * e^(+- 1.96 * SRR) hvor SRR = sqrt(1/29 + 1/8 – 1/198 – 1/73) ~= 0.375. Da får vi konfidensintervall (0.64, 2.77).

4. Beregn også odds ratio (OR), med konfidensintervall.
OR = (29/169) / (8/65) ~= 1.39

95% konfidensintervall for OR er definert ved OR * e^(+- 1.96 * SOR) hvor SOR = sqrt(1/29 + 1/8 + 1/169 + 1/65) ~= 0.425. Da får vi konfidensintervall (0.60, 3.20).

5. Du har i pkt. 2, 3 og 4 beregnet tre alternative mål for effekten som metabolsk syndrom har på hjerte- og karsykdom. Hvilket av disse ville du bruke hvis du skal presentere dette for en gruppe lekfolk?
Alle effektmålene har egne styrker. I denne sammenhengen ville jeg valgt RR eller RD da disse er lettere å forstå. Vi får at en pasient med metabolsk syndrom er ~33% (1.33) mer eksponert for hjerte- og karsykdom. RD forteller oss at den reelle forskjellen er ~3.6%.

6. Sett opp nullhypotesen for å studere om andelene med hjerte- og karsykdom er like for
dem med og uten metabolsk syndrom. Test nullhypotesen. Hvilken konklusjon finner
du?
Vi kan bruke Y-test og Chi-kvadrat-test.

Y-test:
Setter α-nivå = 0.05
H0: p1 = p2
HA: p1 != p2

p^1 ~= 0.146
p^2 ~= 0.110

Finner z-skår, altså Y = (p^1 – p^2) / sqrt(((1/n1)+(1/n2))*p-(1-p-)) hvor p-, den gjennomsnittlige p, = (x1 + x2) / (n1 + n2). Vi får da Y ~= 0.77 som gir i tabellen 0.7794. P-verdi blir da 2*(1 – 0.7794) ~= 0.44. Dette er mye større enn 0.05. Vi kan ikke forkaste H0.

Chi-kvadrat-test:
H0: p1 = p2
HA: p1 != p2

Andel med metabolsk syndrom: 198/271 ~= 0.73
Forventet andel med metabolsk syndrom med hjerte- og karsykdom: 37*0.73 = 27.01
Forventet andel med metabolsk syndrom uten hjerte- og karsykdom: 234*0.73 = 170.82

Andel uten metabolsk syndrom: 73/271 ~= 0.27
Forventet andel uten metabolsk syndrom med hjerte- og karsykdom: 37*0.27 = 9.99
Forventet andel uten metabolsk syndrom med hjerte- og karsykdom: 234*0.27 = 63.18

Vi regner ut teststørrelse X^2:
X^2 = (29 – 27.01)^2 / 27.01 + (169 – 170.82)^2 / 170.82 + (8 – 9.99)^2 / 9.99 + (65 – 63.18)^2 / 63.18 ~= 0.61

Antall frihetsgrader: (kolonner – 1) * (rader – 1) = 1
For α-nivå 0.05 har vi en verdi 3.84. Fordi teststørrelsen vi fant er mye mindre enn 3.84, kan vi ikke forkaste H0.

Oppgave 11
1. Bruk tabellen til å undersøke om andelen med hjerte- og karsykdom avhenger av om personen er overvektig eller ikke. Sett opp en nullhypotese og test den.
Vi kan bruke Y-test og Chi-kvadrat-test.

Y-test:
Setter α-nivå = 0.05
H0: p1 = p2
HA: p1 != p2

p^1 ~= 0.19
p^2 ~= 0.060

Finner z-skår, altså Y = (p^1 – p^2) / sqrt(((1/n1)+(1/n2))*p-(1-p-)) hvor p-, den gjennomsnittlige p, = (x1 + x2) / (n1 + n2). Vi får da Y ~= 6.32 som gir i tabellen > 0.9998. P-verdi blir da < 2*(1 – 0.9998) ~= 0.0004. Dette er mye mindre enn 0.05. Vi kan med god sikkerhet forkaste H0.

Chi-kvadrat-test:
H0: p1 = p2
HA: p1 != p2

Andel med overvekt: 312/994 ~= 0.31
Forventet andel med overvekt med hjerte- og karsykdom: 100*0.31 = 31
Forventet andel med overvekt uten hjerte- og karsykdom: 894*0.31 = 277.14

Andel uten overvekt: 682/994 ~= 0.69
Forventet andel uten overvekt med hjerte- og karsykdom: 100*0.69 = 69
Forventet andel uten overvekt med hjerte- og karsykdom: 894*0.69 = 616.86

Vi regner ut teststørrelse X^2:
X^2 = (60 – 31 )^2 / 31 + (40 – 69)^2 / 69 + (252 – 277.14)^2 / 277.14 + (642 – 616.86)^2 / 616.86 ~= 42.62

Antall frihetsgrader: (kolonner – 1) * (rader – 1) = 1
For α-nivå 0.05 har vi en verdi 3.84. Fordi teststørrelsen vi fant er mye større enn 3.84, kan vi med god sikkerhet forkaste H0.

2. Bruk differansen i andelen med hjerte- og karsykdom som effektmål for effekten av overvekt på hjerte- og karsykdom. Finn et estimat for effekten og lag et konfidensintervall (for hånd!).
p^1 ~= 0.19
p^2 ~= 0.060
RD = 0.19 – 0.060 = 0.13

Regner ut konfidensintervall:
Finner felles standardfeil Sf = sqrt((p^1 * (1 – p^1) / n1) + (p^2 * (1 – p^2) / n2)) ~= 0.024
95% konfidensintervall er gitt ved: RD +- 1.96 * Sf
Vi får konfidensintervall (0.083, 0.18).

3. Bruk relativ risiko som effektmål. Beregn den og finn et konfidensintervall for den.
RR = 0.19 / 0.060 ~= 3.17

95% konfidensintervall for RR er definert ved RR * e^(+- 1.96 * SRR) hvor SRR = sqrt(1/60 + 1/40 – 1/312 – 1/682) ~= 0.19. Da får vi konfidensintervall (2.18, 4.60).

4. Bruk odds ratio som effektmål, beregn den og finn konfidensintervallet.
OR = (60/252) / (40/642) ~= 3.82

95% konfidensintervall for OR er definert ved OR * e^(+- 1.96 * SOR) hvor SOR = sqrt(1/60 + 1/40 + 1/252 + 1/642) ~= 0.22. Da får vi konfidensintervall (2.48, 5.88).

5. Les inn tabellen over i SPSS. Lag variabelnavn, variabel labels og value labels og
presenter selve tabellen.
Kommer senere

6. Beregn RR, OR med tilhørende konfidensintervall ved å bruke SPSS.
Kommer senere

7. Hvordan vil du presentere sammenhengen mellom overvekt og hjerte- og karsykdom, og hvordan vil du konkludere om sammenhengen mellom overvekt og hjerte- og karsykdom?
Alle effektmålene har egne styrker. I denne sammenhengen ville jeg valgt RR eller RD da disse er lettere å forstå. Vi får at en pasient med overvekt er ~317% (3.17) mer eksponert for hjerte- og karsykdom. RD forteller oss at den reelle forskjellen er ~13%. Vi ser at om H0 for RR = 1 og RD = 0, er ingen av disse inkludert i deres tilsvarende 95% konfidensintervall. Vi kan si med 95% sikkerhet at det er en betydelig sammenheng mellom overvekt og økt forekomst av hjerte- og karsykdom.


ForeleserSimon Lergenmuller

Ressurser
Oppgaver

Konfidensintervall

Hovedsakelig små avvik fra presentasjonen

  • Tradisjonelt sett forholder vi oss til at populasjonen er uendelig stor.
    Det er praktisk vanskelig å få tall på hele populasjonen da det ofte står store logistiske og økonomiske utfordringer i veien.

  • Konfidensintervall som hypotesetesting
    Konfidensintervall gir oss samme konklusjon som en tradisjonell hypotesetesting (H0, 1). Dersom konfidensintervallet ikke dekker nullverdien (H0-verdien), vil p-verdien være mindre enn 0.05 (signifikansnivået).

Foreleser: Magne Thoresen

Ressurser
Presentasjon

Gruppeøvelser i statistikk

Oppgave 6
Symptomer som vedvarende hoste og blodtilblandet oppspytt kan være symptomer på lungekreft, og vi vil studere denne muligheten nærmere. I data fra Kreftregisteret finner vi at det i 1993 var fem tilfeller av lungekreft blant norske menn i alderen 30‐39 år. Befolkningstallet av menn i denne aldersgruppen var 325.000. Prevalensen av lungekreft vil omtrent være lik insidensen og kan derfor settes lik 5/325.000.

1. Vedvarende hoste kan være et symptom på lungekreft. Hvis slik hoste betraktes som en diagnostisk indikator, kan en anslå at sensitiviteten er 95%, mens spesifisiteten er 90%. Forklar hva disse tallene betyr i den konkrete sammenhengen vi har her.
Sensitivitet
Hva er sannsynlighet for at en syk pasient får positivt utslag på en test?
Sannsynligheten for at pasienten har hoste gitt lungekreft.

Spesifisitet
Hva er sannsynligheten for at en frisk pasient får negativt utslag på en test?
Sannsynligheten for at pasienten ikke har hoste gitt ikke lungekreft.

2. Beregn den positive prediktive verdi av hoste som symptom på lungekreft for en mann i alderen 30‐39 år. Forklar hva tallet betyr.
Sensitivitet: 0.95
Spesifisitet: 0.90
Vi bruker Bayes lov:
PPV = Sensitivitet * Prevalens / (Sensitivitet * Prevalens + (1 – Spesifisitet) * (1 – Prevalens)) = (0.95 * 5/325000) / ((0.95 * 5/325000) + (1 – 0.90) * (1 – 5/325000)) ~= 0.000146 = 0.00015 = 0.015%

PPV er sannsynligheten for at en positiv diagnose er riktig.

3. Sammenlign med prevalensen: hvor mye vil sannsynligheten for lungekreft være forøket når det foreligger vedvarende hoste?
PPV: Sannsynligheten for at pasienten har lungekreft gitt hoste, dvs. 0.015%. Prevalensen er 0.0015%. En pasient med vedvarende hoste er ti ganger mer sannsynlig å ha lungekreft.

4. Hvis det foreligger både vedvarende hoste og blodtilblandet oppspytt, og vi betrakter kombinasjonen som en diagnostisk indikator for lungekreft, vil sensitiviteten bli redusert til 90%, mens spesifisiteten øker til 99%. Forklar hvorfor det å innføre en kombinasjon av to symptomer, og forlange at begge skal være tilstede, generelt må forventes å føre til redusert sensitivitet og forøket spesifisitet.
Sensitiviteten i denne sammenhengen vil da være sannsynligheten for at en pasient med lungekreft har både vedvarende hoste og blodtilblandet oppspytt. Kriteriene er strengere og det er derfor færre pasienter som regnes med enn når vi bare behøvde en enkel indikator. På den andre siden er det flere som blir regnet med i spesifisiteten, da alle andre kombinasjoner enn begge symptomer havner i spesifisiteten (dvs. enten vedvarende hoste eller blodtilblandet oppspytt og ingen av delene vs. begge deler).

5. Hvis det i tillegg er kjent at pasienten røyker 20‐25 sigaretter per dag vil prevalensen være ti ganger så høy som det som ble benyttet ovenfor. Beregn nå den positive prediktive verdi. Hvor mye er den forøket i forhold til det du fant over? Bruk sensitivitet og spesifisitet fra pkt. 1.
Sensitivitet: 0.95
Spesifisitet: 0.90
Vi bruker Bayes lov:
PPV = Sensitivitet * Prevalens / (Sensitivitet * Prevalens + (1 – Spesifisitet) * (1 – Prevalens)) = (0.95 * (50/325000)) / ((0.95 * (50/325000)) + (1 – 0.90) * (1 – (50/325000))) ~= 0.00146 = 0.146% ~= 0.15%. Denne er 100 ganger større enn 0.0015%.

Oppgave 7
1. Forklar hva vi mener med en binomisk sannsynlighetsfordeling. Hvilke betingelser må være oppfylt for at variabel skal være binomisk fordelt?
ref
En suksessfordeling av binære utfall ved n forsøk.

  • Begivenhetene må være uavhengige
  • Begivenhetene må være binære (to utfall)
  • Sannsynlighetene for utfallene må være statiske

2. Diskuter hva vi mener med en statistisk nullhypotese og alternativhypotesen.
Ved hypotesetesting forsøker vi å bevise en alternativhypotese ved å falsifisere en (nøytral) nullhypotese. Nullhypotesen er en beskrivelse av en antatt virkelighet. Alternativhypotesen er en beskrivelse vi prøver å bevise er en bedre antagelse.

3. Sett opp en nullhypotese og en alternativhypotese for sannsynligheten p i en binomisk situasjon.
ref

4. Diskuter hva vi mener med en p-verdi. Hvordan regner vi ut en p-verdi i en binomisk situasjon?
ref

En (europeisk) rulett har 37 felter, som er nummerert 0 og 1 til 36. Feltet 0 har fargen grønn, 18 er røde og 18 er sorte. Croupieren (spillelederen) spinner hjulet og ruller en liten ball langs hjulet i motsatt retning. Hjulet er balansert slik at det er like sannsynlig å lande på alle feltene. Spillerne kan spille på alle kombinasjoner av tall og farger.

5. Hva er sannsynligheten for at kulen skal falle på rødt?
18/37

6. En spiller bestemmer seg for å spille 6 ganger. Han teller opp antall ganger kulen faller på rødt felt og kaller dette antallet for X. Hva slags sannsynlighetsfordeling har da X?
Binomisk fordeling

7. Spilleren observerer at det kommer rødt 6 ganger etter hverandre. Han betviler at spillet er rettferdig, og vil bruke sin statistiske kunnskap til å utføre en statistisk test før han bestemmer seg for å «avsløre» om spillet er urettferdig. Hva er den statistiske nullhypotesen og hva er alternativhypotesen han setter opp?
H0: P(R) = 18/37
H1: P(R) != 18/37 (i denne sammenheng P(R) > 18/37)

8. Spilleren baserer selve testen på antall ganger han får rødt, altså X, og velger å forkaste nullhypotesen når X er stor. Hva er p-verdien for testen han utfører?
P(6R) = (6 av 6) * (18/37)^6 * (19/37)^0 = (6!/6!) * (18/37)^6 ~= 0.013 = 1.3%. P-verdien er 1.3%. Dette er under det typiske signifikansnivået på 5% som vil si at vi kan forkaste H0.

9. Hvis spilleren hadde observert 5 røde, og ikke 6 som over, hva hadde p-verdien vært da?
P(5R) = (5 av 6) * (18/37)^5 * (19/37) = (6!/(5!)) * … ~= 0.084 = 8.4%. Dette er over det typiske signifikansnivået på 5% som vil si at vi ikke kan forkaste H0.

10. Basert på resultatet med 6 kuler på rad på rødt, vil du gå til ledelsen for kasinoet og fortelle dem at spillet deres er urettferdig?
Det kan jo godt være en tilfeldighet, men om det skjedde konsekvent ville jeg sagt ifra. Utvalget vårt (antall observasjoner) er for “øyeblikket” for lite til å konkludere med sikkerhet.

Oppgave 8
Vi vet at forhøyet kolesterol er en risikofaktor for hjertesykdom. Det kan derfor være viktig å holde kolesterolnivået lavt, og forhindre moderat eller uttalt forhøyet nivå. Vi sier i denne sammenhengen at forhøyet kolesterol er verdier over 250 mg/dL (=6.5 mmol/l). Vi ønsker å kontrollere kolesterolnivået hos barn. Fra tidligere vet vi fra store studier av 
kolesterol (i blod) hos barn i alderen 2-14 år at gjennomsnittet er 175 mg/dL og standardavviket er 30 mg/dL.

1. Anta nå at målt kolesterol kan betraktes som normalfordelt. Hva er da sannsynligheten for at et barn skal ha kolesterolnivå over 250 mg/dL?
μ = 175 mg/dL
σ = 30 mg/dL
Vi standardiserer fordelingen ved Y = (X – μ)/σ.
P(Y > 250) = 1- P(Y < 250) = 1 – P((X – 175)/30 < ((250 – 175)/30) = 1 – P((X – 175)/30 < 2.5) = 1 – 0.9938 = 0.0062 = 0.62%
*Har stått feil her tidligere (-2.5), men riktig svar

2. Hvis vi undersøker 50.000 barn hvert år, hvor mange vil vi oppdage med forhøyet kolesterolverdi?
E(X) = 50000 * 0.0062 = 310

3. Hvor høyt kolesterolnivå har du hvis du er blant de 10% med høyest kolesterol?
P(Y < z) = 0.9
Sannsynligheten for å finne en verdi med standardavvik mindre enn en tenkt standardisert verdi x er 90%, dvs. den tenkte verdien er blant de høyeste 10%.

Ser i tabellen og finner at x = 1.28. Det nærmeste vi kommer 0.9000 er 0.8997. Gjør om fra standardisert format ved Y = (X – μ)/σ. 1.28 = (X – 175)/30 –> X = 213.4. Det vil si at en må ha kolesterolnivå på minst ~213.4 mg/dL for å kvalifiseres innen topp 10%.

Vi antar at det er sammenheng mellom forhøyet kolesterol hos foreldre og hos barn. I et utvalg av menn som har hatt hjerteinfarkt og som har forhøyede kolesterolverdier (altså verdier ≥ 250 mg/dL), måles kolesterolverdiene til deres barn i alderen 2-14. Gjennomsnittlig kolesterol for disse er 207 mg/dL, fortsatt med et standardavvik på 30 mg/dL.

4. Hva er sannsynligheten for at et barn, med en far som har hatt hjerteinfarkt, skal ha et kolesterolnivå mellom 207 mg/dL og 250 mg/dL?
P(Y>207) og P(Y<250)
Y = (X – μ)/σ.
P((X – 207)/30 > (207 – 207)/30)  = 1 – P((X – 207)/30 < 0) = 0.5000
P((X – 207)/30 < (250-207)/30) = P((X – 207)/30 < 1.43) = 0.9236
0.9236 – 0.5000 = 0.4236

5. Hva er sannsynligheten for at et barn med en far som har hatt hjerteinfarkt skal ha forhøyet kolesterolverdi?
P(Y>250) = 1 – P(Y<250) = 1 – P((X-207)/30) < (250-207)/30) = 1 – 0.9236 = 0.0764 = 7.64%

6. Hvis man undersøker 1.000 barn med fedre som har hatt infarkt, hvor mange vil man da oppdage? Kommenter dette resultatet opp mot det du fant i 2.
1000 * 0.0764 = 76.4
50000 * 0.0764 = 3820
I #2 var det 310.
3820 / 310 ~= 12.3 ganger flere.
(Evt. 0.0764 / 0.0062 ~= 12.3)

7. Vil du anbefale tester av kolesterol blant barn (og av utvalgte risikogrupper) for å avsløre forhøyet kolesterol?
Ja.

Vi ser på ut utvalg på 10 barn som har fedre som har hatt hjerteinfarkt og som har forhøyede kolesterolverdier. Sannsynligheten for at et tilfeldig valgt barn har forhøyet kolesterolverdier er den du fant i 5.

8. Kan dette antas å være et binomisk forsøk? Hvilke kriterier må være til stede?
En suksessfordeling av binære utfall ved n forsøk.

  • Begivenhetene må være uavhengige
  • Begivenhetene må være binære (to utfall)
  • Sannsynlighetene for utfallene må være statiske

Ja.

9. Hva er sannsynligheten for at mindre enn 2 av disse har forhøyet kolesterolverdier? Er det greit å bruke tilnærmingen til normalfordelingen her?
Nei, da utvalget ikke er stort nok.

Mindre enn 2 = 1 og 0
P(<2) = (1 av 10) * 0.0764^1 * (1-0.0764)^9 + (0 av 10) * 0.0764^0 * (1-0.0764)^10
P(<2) = 0.3736 + 0.4517 = 0.8253 ~= 0.83 = 83%


ForeleserSimon Lergenmuller

Ressurser
Oppgaver

KURS: PC-øvelser

  1. Les oppgavebeskrivelsen her: oppgaver-uke-34.pdf
  2. Last ned programmet SPSS her
  3. Finn datafilene (og annen informasjon) hervo2.sav og vo2hr.sav
  4. Eventuelt titte på instruksjonshåndboken her

Oppgave 1 (kopiert rett fra oppgavefilen)
Vi skal introdusere et datamateriale, som også stammer fra University of Massachusetts. Det er til sammen data fra 233 menn (individ 139 mangler) som deltok i en undersøkelse av fysisk form og oksygenopptak under arbeid. En del av undersøkelsen ble foretatt på tredemølle hvor O2-opptak og blodtrykk ble målt.

De viktige variablene er maksimalt O2- opptak på tredemøllen (VO2, målt i ml/kg/min) og
Aerob svekkelse (FAI, målt i prosent relativt til alder og kjønn). VO2 er maksimum antall
milliliter av oksygen opptatt i løpet av 1 minutt, per kg kroppsvekt.

På nettet finnes det en rekke enkle kalkulatorer på av maksimalt O2- opptak – uten å løpe på tredemølle, se for eksempel https://www.ntnu.no/cerg/vo2max.

Det er ingen Missing values på datafilen

Løsning oppgave 1
3. Lag en deskriptiv analyse av VO2. Gjør dette via Analyze/Descriptive Statistics/Explore. 
Trinn 1Trinn 2Trinn 3Trinn 4Trinn 5Trinn 6Trinn 6.5
Forklar hva gjennomsnittene, medianene, standardavvikene og standardfeilen til gjennomsnittet (Std. Error) uttrykker. Forklar boksplottene.

  • Gjennomsnittet
    Sum av observasjoner / antall observasjoner.
  • Medianen
    Like mange observasjoner over som under medianobservasjonen. Om antall observasjoner er et partall, blir medianverdien vanligvis et gjennomsnitt av de to midterste verdiene.
  • Standardavviket
    Verdienes gjennomsnittsavstand fra gjennomsnittsverdien
  • Standardfeilen
    Standardavviket / kvadratroten av antall observasjoner. Hva ligger bak formelen? La oss si at det snart er stortingsvalg. Avisene tar en meningsmåling (typisk grupper på 1000) som viser at 23% stemmer på Høyre. I en annen måling med en annen gruppe mennesker får vi kanskje 26%. Jo flere målinger vi tar av grupper på 1000, jo nærmere kommer vi populasjonsverdien (altså den egentlige prosentverdien for hele befolkningen). Standardavviket til alle disse “småverdiene” kaller vi da for standardfeilen, altså graden av usikkerhet i meningsmålingene.
  • Interkvartil avstand
    Deler målingene i fire grupper. Når første 25% av målingene er bak oss kaller vi det for første kvartil. Like så kalles 50% for andre kvartil (eller medianen) og 75% for tredje kvartil. Avstanden mellom første og tredje kvartil kaller vi den interkvartile avstanden. I praksis har vi da med 50% av målingene.

box w coms.PNG
Figuren ovenfor kaller vi et boksplott og er en grafisk fremstilling av noen utvalgte deskriptive verdier.

HistogramAdd histro
Histogramgraph.PNG
Jo flere observasjoner, jo nærmere kommer vi en kurve (og en sannsynlighetsfordeling). Den mest brukte sannsynlighetsfordelingen er en normalfordeling som er symmetrisk rundt gjennomsnittet. Det er ofte interessant å se på hvordan målinger samsvarer med en normalfordeling. Dette kan vi sjekke ved:
Trinn 1Trinn 2Normal plots
Normality plot 1Normality plot 2
Jo nærmere verdiene er normalfordelte, jo mer samsvarer de med grafene (hvor stor andel som ligger innen normalfordelingen). I praksis vil vi aldri se reelle data som ligger eksakt på normalfordeligen. Foreleser forteller at han selv aldri har klart å tolke den horisontale grafen langs x. Da er det vel trygt å anta at dette heller ikke er pensum (med mindre det er ekstreme avvik eller samsvarelser).

For å undersøke om VO2 er normalfordelt skal vi laget et normalfordelingsplott. Da går vi tilbake til Analyze/Descriptive Statistics/Explore, og vi klikker på Plots i den høyre knapperekken. Da åpner det seg en ny meny. Der klikker vi på Normality plots with tests. Kan vi anta at VO2 er normalfordelt?

Nei.


Lag en frekvensfordeling for variabelen EXP. Gjør dette via Analyze/Descriptives/Frequencies. Forklar resultatene.
Trinn 1EXPTrenignsprogram
Vi ser her at 117 har fulgt treningsprogrammet og 116 ikke. Når vi har en så jevn fordeling er det naturlig å tenke seg at det ikke er et tilfeldig oppsett, men en designet studie (at halvparten f.eks. har fått et treningsprogram, halvparten ikke).

To prosenter

  • Precent
    Prosentandel av alle svarene
  • Valid precent
    Prosentandel av alle gyldige svar, dvs. ikke talt med “missing values”

Når det er snakk om kategoriske variabler med mange kategorier, f.eks. fødeland, kan det være naturlig å oppsummere det i et stolpediagram.

6. Variabelen FAI er en kontinuerlig variabel som angir graden av aerob svekkelse. Hvis FAI er større eller lik 0 er personen aerob svekket, er FAI mindre enn 0 er personen ikke svekket. Vi skal lage en variabel IMP som angir om personen er svekket eller ikke. Lag da variabelen:

  • IMP = 1 når FAI >= 0
  • IMP = 0 når FAI < 0

newvar1newvar2newvar3newvar4.png
Vi velger ikke “Range, LOWEST through value”, for da tar vi med 0 i begge omganger. Om det finnes “missing values” i datasettet “prikker vi av” “System-missing”-alternativet. Manglende verdier ser ut i datafilen som et åpent felt, men er kodet som en ekstremverdi (enten ekstremt høy eller lav). Disse verdiene tas med dersom vi f.eks. har alle verdier fra 0 og oppover og kan påvirke resultatene vi får. Det kan være lurt å gi den nye variabelen et “label”, f.eks. “Svekkelse”

Label 1.png

Label 2Label 3Frekvenstabell 2.PNG

Lag frekvenstabell som tidligere. Vi ser her at et overveiende flertall opplever å bli svekket (59 v. 174).

9. Lag en deskriptiv analyse av VO2 mht. til IMP. Meningen er da å gi en presentasjon av de sentrale målene, som gjennomsnitt, median, standardavvik etc. for VO2 for de to gruppene av IMP. Gjør dette via Analyze/Descriptive Statistics/Explore. Hva er gjennomsnittene, medianene, standardavvikene og standardfeilen til gjennomsnittet (Std. Error)? Forklar boksplottene.

Det er litt merkelig å undersøke disse forholdene da IMP er basert på VO2 (men la gå).
Trinn 1Trinn 2

Factor2Deskriptiv.PNGFactor1

Observer at det er en forskjell på feilmarginen “Std. Error” mellom gruppen som er svekket (0.7715) og ikke svekket (1.0000). Grunnen til det er fordi vi regner ut feilmarginen ved formelen: standardavvik/roten av antall observasjoner. Hva det vil si i praksis er at det rett og slett er flere som opplever å bli svekket enn ikke.

Boksplottet

  • Mindre spredning (interkvartil avstand, min-max) blant gruppen “ikke svekket”
  • Generelt høyere VO2 for “ikke svekket”

Merk at SPSS har satt ring rundt og skrevet “33” over boksplottet til “ikke svekket” Det er fordi programmet vil understreke at observasjon #33 er i overkant stor (i forhold til normen). Observasjon 33 har VO2-verdien: 59.7 som nærmer seg opptaket til en eliteutøver. Når SPSS skisserer boksplottene gjør de en antagelse om at datasettet er normalfordelt. Observasjoner som er lengre unna gjennomsnittsverdien enn et gitt antall standardavvik markeres automatisk av programmet.

Oppgave 2 (bytte til vo2hr.sav)
Kroppen opptar mer oksygen under arbeid enn under hvile, og for å transportere oksygen til musklene må hjertet slå fortere. Hjertefrekvens er lett å måle, mens oksygenopptaket er vanskeligere. Denne studien er basert på 38 arbeidere. Vi skal studere to arbeidsbetingelser, i det arbeidet er utført med og uten beskyttende arbeidsmaske. Arbeidet er av 19 arbeidere utført uten beskyttende ansiktsmaske og for 19 andre arbeidere er det utført med ansiktsmaske. Målsetningen i studien er å se om det er en sammenheng mellom oksygenopptak (VO2) og hjertefrekvens (HR) for de to arbeidsbetingelsene. Basert på dataene nedenfor skal vi undersøke om dette virker rimelig.

Merk ummidelbart at studieutvalget er svært lite og eventuelle konklusjoner dermed svekkede. 

Relevant informasjon:

  • To faktorer:
    Hjertefrekvens (HR)
    Oksygenopptak (VO2)
  • Med og uten maske
  • 38 arbeidere

analyze-1.pngAnalyze 2Analyze 4.PNG
Kurtosis 1Kurtosis 24. Lag boksplott for VO2 og HR for personer med og uten bruk av ansiktsmaske. Forklar hva du finner. Er fordelingen til disse to variablene symmetriske?

Kurtosis 3

  • HR uten maske
    Vi ser at boksplottet er relativt symmetrisk. Avstandene fra min og max til medianen er ~like. Avstanden fra 1. til 2. (medianen) og 3. til 2. (medianen) kvartil er ganske lik.
  • HR med maske
    Vi ser her at boksplottet er relativt usymmetrisk. Selv om avstanden fra 1. til 2. (medianen) og 3. til 2. kvartil (medianen) er ganske lik, er det stor forskjell på avstandene fra min og max til medianen (og den interkvartile avstanden). Det kan være fordi studieutvalget er for lite.

Sammenligning
Boksplottene viser en tydelig redusert hjertefrekvens for de som hadde på seg maske.

Kurtosis 4

  • VO2-opptak uten maske
    Vi ser at boksplottet er relativt symmetrisk. Avstandene fra min og max til medianen er ~like. Avstanden fra 1. til 2. (medianen) og 3. til 2. (medianen) kvartil er ganske lik.
  • VO2-opptak med maske
    Vi ser at boksplottet er relativt symmetrisk. Avstandene fra min og max til medianen er ~like. Avstanden fra 1. til 2. (medianen) og 3. til 2. (medianen) kvartil er ganske lik.

Sammenligning
Boksplottene viser noe lavere VO2-opptak med maske på. Det er naturlig da masken gjør det vanskeligere å puste.

Tolkning
Resultatene tyder på at det er en assosiasjon mellom maskebruk og både redusert VO2-opptak og hjertefrekvens. En konfunderende faktor kunne vært arbeidsintensitet. Resultatene kan f.eks. forklares ved at de som hadde på seg maske som gjorde det vanskeligere å puste jobbet mindre intenst og viste dermed også lavere hjertefrekvens.

5. Lag normalfordelingsplott for VO2 og HR for personer med og uten bruk av ansiktsmaske. Hva finner du?

Datamengdene samsvarer ikke med en normalfordeling.

Lag et spredningsdiagram for sammenhengen mellom VO2 og HR for dem med og uten ansiktsmaske, med VO2 på y-aksen og HR på x-aksen. Det gjør vi ved å gå til Graphs/Legacy Dialogs/Scatter/Dots. Her klikker vi på Simple Scatter og Define. Vi trekker VO2 over i y-aksen og HR over i x-aksen og MASK over i Set Markers by.Scatter 2scatter 1Scatter 3scatter 4
scatter 5.PNGDet at grafene (regresjonslinjene) er tilnærmet parallelle betyr at veksten (proporsjonalitetskonstanten a i y=ax+b) er ~lik. Grunnen til at grafene er forskjøvet er fordi oksygenopptaket er generelt lavere med maske på (gir mening i praksis!).

8. Forklar sammenhengen mellom oksygenopptak og hjertefrekvens ut fra resultatene fra denne studien.
Vi ser fra regresjonsplottet at forholdet mellom hjertefrekvens (HF) og oksygenopptak (VO2) er tilnærmet konstant uavhengig av faktorer som reduserer oksygentilgangen (maske). Er studien fullstendig konkluderende? Det er de aldri, men ideelt sett kunne vi gjort målingene på nytt med et større utvalg.


ForeleserMorten Valberg

Sannsynlighetsregning II

I læren om sannsynligheter finner vi blant annet en tanke om tilfeldige forsøk. Når vi leder slike forsøk vet vi ikke på forhånd hva utfallet vil bli. Vi kjenner kun til mulighetene (utfallsrommet, S). Eksempler på når dette gjelder kan være:

  • Myntkast (S = {Kron, Mynt})
    Kategorisk data
    Diskret utfallsrom
  • Terningkast (S = {1, 2, 3, 4, 5, 6})
    Kategorisk data
    Diskret utfallsrom
  • Banefødsler (S = {Jente, Gutt})
    Kategorisk data
    Diskret utfallsrom
  • Telle antall lungekrefttilfeller i Oslo i løpet av et år (S = {0})
    Diskrete numeriske data (telletall)
    Diskret utfallsrom
  • Kreftbehandling. Hvor lenge lever pasienten? (S = {{\mathbb  {R}}_{{>0}}})
    Kontinuerlig data
    Kontinuerlig utfallsrom

Vi er ofte i sannsynlighetsregning ute etter sannsynligheter for forskjellige delmengder, eller begivenheter innen et gitt utfallsrom. Når vi gjør forsøk bruker vi begrepet serie for å betegne en rekke likeartede forsøk (samme konsept som sets og reps på Domus Athletica).

Hva er sannsynlighet?
Det er ofte snakk om to tolkninger som svar til spørsmålet:

  • Frekventistisk
    Dette beskriver typen sannsynlighet vi er vant med. F.eks. at sannsynligheten for at en terning lander på 6 blir nærmere og nærmere 1/6 jo flere forsøk vi gjør. Skrevet på en ordentlig måte:
    La antall kast i hver serie være N og antall ganger terningen lander på 6 være nA. Den relative frekvensen til A, fA, er andelen kast som lander på 6. Det vil si antall ganger terningen lander på 6, nA, delt på antall totale kast, N: nA/N. Sannsynligheten for A, P(A), nærmer seg den relative frekvensen, fA, når antall kast, N, nærmer seg uendelig.Forenklet: Jo flere kast, jo nærmere kommer vi en “teoretisk sannsynlighet” for at terningen lander på 6.Eksempel
    Vi kaster en terning først 12 ganger. Da forventer vi å få 1/6*12 = 2 seksere. Når vi kaster får vi i stedet 4 seksere. Om vi regner ut sannsynligheten utifra dette får vi at sannsynligheten for seksere blir P(6) = 4/12 = 1/3 i stedet. Så kaster vi terningen 120 ganger og får 16 seksere. P(6) = 16/120 = 4/30. 1/6 = 5/30. Her ser vi hvordan den relative frekvensen (praktisk resultat) nærmer seg den teoretiske sannsynligheten ettersom vi kaster flere kast.
  • Bayesiansk
    Dette beskriver en type sannsynlighet som er basert på forventninger i forkant av forsøket og er sannsynligvis ikke pensum.

Vi har (minst) fem grunnleggende regneregler som vi skal lære nå:
U (union) betyr eller
∩ (snitt) betyr og

  • Komplementsetningen
    Komplement.PNG
    Sannsynligheten for A og ikke A legges sammen til 1.
  • Addisjonssetningen for disjunkte hendelser
    addisjon.png
    To disjunkte hendelser har ingenting å gjøre med hverandre. Si at i et klasserom finner vi 50% som shipper Barney og Robin og 30% som shipper Ted og Robin med ingen overlapping. Da er det naturlig at sannsynligheten for at en tilfeldig valgt elev i klassen shipper Robin med enten Barney eller Ted vil være 50% + 30% = 80%. Sannsynligheten for at en i klassen shipper Robin med både Barney og Ted vil på den andre siden være 0, fordi vi vet at ingen gjør det. Tomme mengder merker vi ofte med Ø. P(B∩T) = Ø.
  • Addisjonssetningen
    Addisjon2.PNG
    Se for deg et venndiagram. Når to hendelser ikke er disjunkte og har overlapp ser vi at om vi teller sannsynlighetene P(A) og P(B), eller sirklene A og B, hver for seg, vil vi telle med området der det overlappes to ganger. Derfor må vi trekke det fra en gang. Fellesarealet noteres P(A∩B).
  • Produktsetningen
    multiplikasjon.png
    Dersom hendelsene A og B skal begge inntreffe, må B inntreffe først for at A skal kunne inntreffe. Dersom sannsynligheten for at A inntreffer er avhengig om B inntreffer eller ikke, kan sannsynligheten regnes utifra multiplikasjonssetningen (produktsetningen).
  • For uavhengige hendelser gjelder
    Uavhengig.PNG
    Dersom sannsynligheten for at A inntreffer er uavhengig av B vil P(A|B) i praksis være det samme som P(A).P(A|B) er et eksempel på betinget sannsynlighet. Det handler om å finne sannsynligheten for at A kommer til å skje dersom B allerede har skjedd. Eksempel: Sannsynligheten for Robin blir sammen med Ted dersom Barney har dødd.

For å friske opp litt kunnskap fra videregående kan det være lurt å sjekke ut matematikk.net. Det er flere eksempler i presentasjonen.

De første forelesningene er for å bygge opp det grunnleggende og kan selvsagt oppleves som kjedelige. Foreleser ønsker at studentene kikker litt på oppgavesettet til gruppearbeidet i morgen (fredag).

LIK står for Legestudentenes Idrettsklubb og er, ja, en idrettsklubb. Medlemskap koster kr 10. Studentlekene arrangeres 10. oktober. Det er bare å stille lag!


ForeleserMagne Thoresen

Ressurser
Presentasjon