Indholdsfortegnelse:
For at lave overslag over en befolkning bruger statistikere en tilfældig stikprøve, der er repræsentativ for befolkningen. Hvis du f.eks. Vejer 50 tilfældige amerikanske kvinder, kan du estimere vægten af alle amerikanske kvinder baseret på deres gennemsnitlige vægt. Prøvetagningsfejl opstår, når dine prøveresultater afviger fra den sande befolkningsværdi. Det vil sige, hvis dine 50 kvinder gav en gennemsnitsvægt på 135 pund, når det sande gennemsnit var 150 pund, så er din prøveudtagningsfejl -15 (den observerede minus faktiske), hvilket betyder, at du undervurderede den sande værdi med 15 point. Fordi den sande værdi sjældent er kendt, bruger statistikere andre estimater som standardfejl og konfidensintervaller til at estimere prøveudtagningsfejlen.
Trin
Beregn den procentdel, du måler. Hvis du f.eks. Vil vide, hvilken procentdel af elever i en given skole ryger cigaretter, så tag en tilfældig prøve (lad os sige n, vores stikstørrelse er lig med 30), få dem til at udfylde en anonym undersøgelse og beregne procentdelen af studerende, der siger, at de ryger. For illustration skyld, lad os sige, at seks studerende sagde, at de røg. Så den procentdel, der ryger = (# der ryger) / (total antal studerende målt) x 100% = 6/30 x 100% = 20%.
Trin
Beregn standardfejlen. Fordi vi ikke kender den faktiske procentdel af elever, der ryger, kan vi kun tilnærme prøveudtagningsfejlen ved at beregne standardfejlen. I statistikken bruger vi proportioner, p, i stedet for procentsatser til beregninger, så lad os konvertere 20% til en andel. Opdeling 20% med 100%, du får p = 0,20. Standardfejl (SE) for store stikstørrelser = sqrt p x (1 - p) / n, hvor sqrt x betyder at tage kvadratroten af x. I dette eksempel får vi SE = sqrt 0.2 x (0.8) / 30 = sqrt 0.00533 …? 0,073.
Trin
Opret et konfidensinterval. Nedre grænse: Anslået andel - 1,96 x SE = 0,2 - 1,96 (0,073) = 0,0569 Øvre grænse: Estimeret andel + 1,96 x SE = 0,2 + 1,96 (0,073) = 0,343 Så vi vil sige, at vi er 95% sikre på den reelle andel rygere er mellem 0,0569 og 0,343, eller som en procentdel ryger 5.69% eller 34.3% af eleverne. Denne brede spredning angiver muligheden for en ret stor prøveudtagningsfejl.
Trin
Mål alle at beregne den eksakte prøveudtagningsfejl. Lad alle elever i skolen færdiggøre den anonyme undersøgelse og beregne procentdelen af elever, der sagde at de ryger. Lad os sige, at det var 120 ud af 800 studerende, der sagde at de røgede, så er vores procentdel 120/800 x 100% = 15%. Derfor er vores "prøveudtagningsfejl" = (estimeret) - (faktisk) = 20 - 15 = 5. Jo tættere på nul, jo bedre er vores estimering og jo mindre vores prøveudtagningsfejl siges at være. I en reel verdenssituation er du dog ikke tilbøjelig til at kende den faktiske værdi og bliver nødt til at stole på SE og konfidensinterval for fortolkning.