Analyse av pardata: ett-utvalgs t-test

Fortsettelse fra sist
Vi kan ikke gi en fornuftig fortolkning av relativ risiko: 0.64 (36% redusert risiko) uten å vite hvilke tall som ligger bak. Om vi regner på risikodifferansen, finner vi at den er 1%. Forsøket i eksempelet vårt ble stoppet fordi forskerne mente det ikke lenger var forsvarlig å la pasienter stå på placebo. I en større samfunnsgruppe er det hensiktsmessig å se på RR (36%) da selv en liten endring i den reelle risikodifferansen kan utgjøre en forskjell for mange når populasjonen er stor.

Dilemma:
Er det forsvarlig å la en pasient stå / starte en pasient på medikamenter som gjør at en risiko går fra 3% til 2%, men som vedkommende må ta hele livet?

Ny kunnskap
Om vi har et normalfordelt utvalg vil gjennomsnittet også være normalfordelt.
E(X) = μ
SE(X) = σ / sqrt(n)

SE har samme funksjon som SD ved gjennomsnitt. Vi bruker SE ved estimator, SD ved datamengde.

Vi estimerer sigma (empirisk standardavvik) ved s = sqrt(1/(n-1) * sigma(xi-x)^2). Når vi estimerer sigma får vi naturligvis mer usikkerhet og derfor et bredere konfidensintervall (avhengig av størrelse på datamengde da s nærmer seg σ når n blir stor). Vi kan derfor ikke lenger bruke 1.96 som konstant, men en faktor c fra studentfordelingen (t-fordelingen). Den nye formelen blir da x +- c * s/sqrt(n). S er det empiriske standardavviket. Det finnes mange t-fordelinger. Utseende på dem varierer med antall frihetsgrader. Fordi studentfordelingen har mer usikkerhet, har sannsynlighetstettheten tyngre haler (tar for seg flere verdier utover i begge retninger). Vi må derfor litt lenger ut for å ta for oss 95% (derfor C >= 1.96). Vi regner ut antall frihetsgrader ved n – 1. 

T-tabellen viser sannsynligheter for å overstige. Vi leser av 0.025 for å få et 0.05 α-nivå (tosidig). Fra presentasjon: “[…] siden vi skal ha 2.5% over verdien c og tilsvarende 2.5%
under verdien –c.” Vi forkaster H0 dersom verdien overstiger α-nivåverdien. Kjikvadratfordelingen er annerledes ved at vi ikke beregner noe konfidensintervall (gir oss direkte et svar).

Labtester vil ofte oppgi sin sigma, men i praksis må vi nesten alltid estimere den som s. Dersom vi forkaster H0 ved t-test, vil nullverdien (H0) aldri være inkludert i konfidensintervallet. Ved RR, kjikvadrat usw. kan det hende vi finner en/et overlapp.

Foreleser:
Det er ikke krise om den eksplisitte frihetsgraden ikke er gitt i tabellen. Forskjellene når vi får store frihetsgrader blir så små at de egentlig ikke har en stor praktisk betydning (innenfor våre rammer). “Bare begrunn valget.”

Notiser:
En paret t-test er bare en ett-utvalgs t-test på forskjellen mellom de to avhengige datasettene. Vi antar at standardavvikene i de opprinnelige datasettene er ~like. Standardavviket til forskjellene må nødvendigvis være mellom de to opprinnelige. SPSS tester om vi kan anta et tilstrekkelig likt standardavvik, men foreleser sier han ikke pleier å titte på den (dårlig test): “Pleier å krysse over.”


ForeleserMagne Thoresen

Ressurser
Presentasjon

Orientering om eksamen

Eksamen i blokk 1 skal handle om

  • Statistikk
    Veier tyngst
  • Humanbiologi
  • Samfunnsmedisin
  • Atferdsfag

Siden vi får en samlet karakter kan det godt tenkes at det er mulig å “stryke” i ett av fagene og likevel bestå eksamen. Det absolutt beste rådet er å jobbe med tidligere eksamensoppgaver og se på læringsutbyttet.

Alle klager på eksamen er anonyme. De som opprinnelig rettet eksamen får ikke vite hvem som klager eller at det i det hele tatt har vært en klage. Klagekommisjonen får ikke vite hva som tidligere har blitt gitt og det de kommer fram til blir stående.

Fra foreleser
“Blokk-1-eksamen er snill”
Det er relativt få som stryker.
Stågrensa for eksamen var 60% før. Nå er den 55%. Poenggrensene er imidlertid flytende og endres etter helhetsinntrykket.

Gis karakterene etter en viss fordeling?
Universitetet har mål om at det over tid skal være en viss fordeling, men de forholder seg ikke til dette ved hver enkelt eksamen.

Vi får en felles karakter for hele modul 1 hvor blokk 1 teller ~20%. Studentene får ikke vite hvilken persentil de ligger i.


ForeleserMagne Thoresen