Eksempelstørrelse: Problem og matematik

Efter at have læst denne artikel vil du lære om problem og matematik af stikstørrelse.

Problemer med prøveformat:

Vi skal nu overveje en af ​​de vanskeligste problemer i forbindelse med prøveudtagning, dvs. problemet med prøvestørrelse. "Hvad skal prøven være passende i forhold til befolkningens størrelse?" "Hvor stor burde være en prøve?" Er spørgsmål, der ofte stilles af forskerstuderende. Xo afgørende svar på dette spørgsmål kan gives.

Dette skyldes, at spørgsmålet om størrelse kun kan besvares, når vi er prøveudtagningselementer for befolkningen på en sådan måde, at hvert element har samme chance for at blive medtaget i prøven, dvs. når vi vedtager sandsynlighedsdesign af prøveudtagning.

Kun sandsynlighedsdesign muliggør formulering af repræsentative prøveudtagningsplaner. Derved gør det muligt at formulere repræsentative prøveudtagningsplaner.

Derfor spørgsmålet "hvor stor prøven skal være for at være repræsentativ for befolkningen af ​​en bestemt størrelse?" Forudsætter sandsynlighedsprøvetagningsproceduren. Manglende denne procedure kan repræsentativiteten af ​​prøven, uanset hvor stor, kun være et spørgsmål om håb og formodning.

De generelle misforståelser med hensyn til størrelsen af ​​prøven er, at størrelsen på universet, hvorfra prøven trækkes, bestemmer antallet af tilfælde, der er nødvendige for at give en passende eller repræsentativ prøve af det pågældende univers.

Vi vil gøre det godt at bemærke med det samme, at vægten bør lægges ikke på antallet af tilfælde i universet, men på deres antal i stikprøven.

Matematik af prøveformat:

Det grundlæggende praktiske spørgsmål "Hvordan bestemmer du stikprøvestørrelsen, som giver den ønskede grad af præcision, som forskeren fastsætter for en given undersøgelse?" Prøveudtagningsproblemet er selvfølgelig det samme i alle undersøgelser, dvs. at estimere eller forudsige noget om befolkningen på grundlag af viden om noget om prøven.

Forskeren skal vide, hvilken slags statistik på prøven tjener formålet, fx procentsatser, gennemsnit, standardafvigelse mv. Til et sådant estimat. Dette er vigtigt, fordi forskellige typer statistikker er nyttige, afhængigt af de ønskede grader af præcision i prøveafkast, som igen er udført af forskellige prøvestørrelser.

Gennemsnitsværdier og procentsatser er de mere almindeligt ønskede statistikker. Vi skal derfor behandle spørgsmålet om prøvestørrelser svarende til de ønskede grader af præcision med hensyn til middelværdier og procentsatser.

Da prøven tegnet af forskeren kun er en af ​​de mange mulige prøver af universet, at han måske er sket at vælge, skal han vide, hvor meget afhængighed han kan placere på prøven som repræsentant for "universet", som han ønsker at vide noget eller med henvisning til hvilken han ønsker at generalisere.

Han har brug for at vide, hvor stor prøven skal være for at give ham et tilfredsstillende niveau af præcision. Denne beregning er mulig ved anvendelse af matematik siden i tilfældig prøveudtagning (sandsynlighedsprøveudtagning), hvor hvert element i universet har en specificeret sandsynlighed for optagelse i prøven, er forudsigelsen eller estimatets præcision relateret til kvadratroden af ​​antallet af elementer i prøven.

Før man fortsætter med beregningen af ​​den nødvendige størrelse af prøven for en given undersøgelse, er det i praksis nødvendigt at sikre nogle foreløbige oplysninger om befolkningen eller universet.

Hvis forskeren har til hensigt at bruge prøven til at beregne det gennemsnitlige mål for særlige karakteristika i universet, skal han have et foreløbigt skøn over standardafvigelsen (dispersionen) i fordelingen af ​​værdierne af elementer i universet med respekt til den givne karakteristik.

Forskeren, der kommer til at kende værdiernes rækkevidde (spredningen) med hensyn til en bestemt karakteristik i universet, kan få et foreløbigt skøn over standardafvigelsen ved at dividere dette interval med 6, da standardafvigelsen for det (endelige) univers kan til alle praktiske formål anses for at være omkring 1/6 af hele spektret af variation.

Med andre ord kan spredningsområdet for en fordeling antages at omfatte 6 standardafvigelsesenheder. De foreløbige oplysninger om universet kan fås ved hjælp af en pilotundersøgelse, resultater fra tidligere undersøgelser, rapporter udgivet af statistiske bureauer, beregning af eksperter på området mv.

Forskeren skal, inden man fortsætter med at beregne størrelsen af ​​prøven, bestemme det forventede niveau for estimaternes præcision. Denne forventning er hovedsagelig baseret på formålet med undersøgelsen.

Forskeren skal med andre ord bestemme:

(a) Hvor meget fejl i estimatet der skal udledes af prøven (i forhold til den sande værdi, dvs. værdien af ​​'universet') kan tolereres (kaldet fejlmargin eller nøjagtighedsgrænse) og

(b) Med hvor stor sikkerhed kan man sige, at estimatet vil falde inden for denne fejlmargin (kaldet niveau for tillid eller sandsynlighed).

Det vil imidlertid være hensigtsmæssigt at overveje disse mere detaljeret i øjeblikket:

(a) Fejlmargin eller Nøjagtighedsgrænse:

Det grundlæggende spørgsmål her er: 'Hvor meget er procentdelen eller gennemsnittet, der skal sikres ved undersøgelsen af ​​prøven, som kan variere fra den sande middelværdi (af befolkningen) og kan stadig tolereres?' Forskeren kan tolerere 5% fejl, eller han kan kræve nøjagtighed inden for en grænse på 2%.

Det hele afhænger af, hvor præcist eller præcist han vil vide visse fakta. Lad os antage, at forskeren gerne vil vide på forhånd, hvilken af ​​de to kandidater, der bestrider valget, vil vinde stolen. Hvis afstemningen vil være tæt, har forskeren råd til at tolerere kun en mindre fejl, hvis han skal være praktisk sikker.

Han kan f.eks. Indstille den tilladte fejl på mindre end 2%. På den anden side, hvis valget ser ud til at være ensidig og ret forudindtaget til fordel for en bestemt kandidat, kan forskeren muligvis forudsige resultaterne selv med en meget større fejl i estimatet.

Hvis stikprøveundersøgelsen tilfældigvis afslørede at 60% af stemmerne ville gå til fordel for en kandidat, kunne en fejl så høj som 9% tolereres. I dette tilfælde, selvom prøveundersøgelsen havde trukket den mest uheldige prøve afvigende 9% fra den sande værdi, ville den sande værdi stadig være 51%, dvs. 1% over den 50%, som er det kritiske punkt.

Således ville både estimeret værdi på 60% og sand værdi på 51% være over det kritiske punkt (dvs. 50%), og forudsigelsen ville være pålidelig.

(b) Sandsynligheds- eller konfidensniveau:

Ud over nøjagtighedsgrænsen skal forskeren også beslutte med henvisning til hans undersøgelse, hvor meget tillid han gerne vil placere i stikprøveberegningerne er så tæt på det sande estimat, at det ligger inden for grænserne for tolerance eller nøjagtighed fastsat af han til studiet.

I visse tilfælde kan han være meget sikker på, at hans estimater (baseret på stikprøven) vil ligge inden for 51% af den sande værdi, mens han i visse andre situationer kan være tilfreds med en lidt mindre grad af sikkerhed.

I samfundsvidenskabelig forskning er to grader af sandsynlighed eller tillid meget velkendte og ofte brugt.

En af disse er 0, 95 sandsynlighedsniveau, dvs. der vil være 95 chancer ud af 100, at stikprøveoverslaget ikke overskrider grænserne for tolerance eller fejlmargin, og det andet niveau er sandsynligheden 0, 99, det vil sige det Det er sandsynligt, at i 99 chancer ud af 100 vil stikprøveoverslaget ikke overstige fejlmarginen rettet mod.

Niveauet af selvtillid kan endda indstilles til 0, 999, det vil sige, at stikprøveopgørelsen ikke ville afvige fra den sande værdi (af universet) ud over grænserne for tolerance i 999 chancer ud af 1000. For visse formål kan forskeren tilstræbe lav og Indstil sandsynlighedsniveauet på 0, 67 (dvs. 2 ud af 3).

Chancerne for, at en bestemt prøve trukket til en undersøgelse vil give et estimat af universet, som ligger inden for fejlmarginen, afhænger af variationen mellem de prøver, der kan trækkes fra universet. Hvis de værdier, der er sikret fra prøverne, har tendens til at afvige betydeligt fra den sande værdi, er chancerne for en given prøveværdi, der opholder sig inden for de tilladte fejlfelter, dårlige.

Standardfejlen er den foranstaltning, der fortæller os, hvad chancerne for en stikprøve, der opholder sig inden for de tilladte grænser, er. Det er et mål for variation i stikprøveoverslag, som man kunne forvente ved stikprøveudtagning. Tilfældige prøver har tendens til at følge sandsynlighedslovene, og stikprøveoverslagene har tendens til at klynge rundt om den sande værdi af universet.

Disse estimater kan repræsenteres af en klokkeformet eller normal kurve. Midten af ​​denne kurve repræsenterer den sande værdi (af universet), og den maksimale variation eller afvigelse af et tilfældigt stikprøveberegning fra denne sande værdi er ca. tre gange standardfejlen.

Standardfejlen er således ca. 1/6 af hele spektret af tilfældig prøveudtagningsvariation. Til alle praktiske formål tages standardfejl dog som 1/4 af variationen, da de ekstreme variationer forekommer meget sjældent.

Sandsynligheds tabeller viser, at 95 ud af 100 prøveoverslag kan forventes at falde inden for grænsen +2 og -2 standardfejl. Det betyder, at hvis vi har sat vores grad af tillid eller sandsynlighed til 0, 95, vil vores problem være at tegne en tilfældig prøve med en standardfejl, der er ca. ½ (halv) af vores fejlmargin.

For et højere sandsynlighedsniveau skal vi tegne en prøve med en standardfejl, det er en endnu mindre del af fejlmarginen.

Det skal bemærkes, at standardfejlen bliver mindre (højere præcision), da prøverne bliver større. For at fordoble præcisionen skal prøvestørrelsen multipliceres med 4, dvs. øget fire gange; at diskantere det, skal stikstørrelsen multipliceres med 9; at quadruple det, ved 16 og så videre.

Dette betyder kun, at præcisionen stiger som kvadratroten af ​​antallet af tilfælde i prøven. Statistikere har udarbejdet tabeller, som viser sandsynligheden for, at stikprøveberegninger kommer inden for de forskellige standardfejlgrænser.

Disse grænser er generelt angivet som + (plus) og - (minus). Sådanne tabeller viser f.eks., At 95% af de stikprøveberegninger falder inden for grænsen på +1, 96 og -1, 96 standardfejl, ca. 68% af estimaterne falder inden for grænserne for + 1 og -1 standardfejl og 99% af estimaterne falder inden for intervallet +2, 57 og -2, 57 standardfejl og så videre.

I fuld overvejelse af (1) fejlmarginen og (2) sandsynligheden eller tillidsniveauet kan forskeren fortsætte med beregningen af ​​en ønsket prøvestørrelse. Mildred Parten har givet følgende formel til beregning af stikstørrelsen, når den statistik, der skal estimeres, er procentdelen. Dette er naturligvis en transponeret variation af en standardfejlformel.

Størrelse af prøve = PC (100-PC) Z 2 / T 2

I ovenstående formel betyder PC det foreløbige skøn over procentdelen (fra universet).

Z betyder antallet af standardfejlenheder, der findes (fra den normale sandsynlighedstabel) for at svare til det krævede sandsynlighedsniveau.

T betyder fejlmarginen, der kan tolereres (5% eller 2%).

Parten har givet følgende formel til beregning af stikstørrelsen til forudsigelse eller estimering af universets middelværdi i forhold til en bestemt karakteristik ved et vist konfidensniveau og rettet mod en given margen eller fejl eller tolerance.

Prøvestørrelse = (δ + Z / T) 2

Hvor 8 står for det foreløbige skøn over universelle standardafvigelser.

Z står for antallet af standardfejl enheder svarende til det krævede sandsynlighedsniveau eller konfidensniveau.

Lad os tage et konkret eksempel og udarbejde stikprøvestørrelsen. Antag, at vi ønsker at estimere den gennemsnitlige årlige indkomst af familier, der befinder sig i en bestemt middelklasseklasse af en by.

Lad os sige, vi har sat vores fejlmargin på Rs.100 / -, dvs. vi vil tolerere stikprøveopgørelsen inden for plus eller minus 100 fra den sande gennemsnit af befolkningen med hensyn til indkomst. Antag, at vi har sat sandsynligheds- eller konfidensniveauet til 0, 95.

Antag også, at vi fra en undersøgelse foretaget et par år tilbage vurderer standardafvigelsen for befolkningens årlige indkomst (lokalitet) til Rs.500 / -. Værdien af ​​Z, dvs. standardfejlenhederne svarende til sandsynligheden for 0, 95 er 1, 96.

Ved at erstatte disse værdier i formlen ovenfor, har vi

Størrelse på enkelt = (500 × 1, 96 / 100) 2

= (9, 8) 2

= 95

Det betyder, at en tilfældig stikprøve på 95 tilfælde (familier, der er prøveenhederne) skal give os et skøn over middelværdien af ​​det givne "univers" inden for den fastsatte fejlmargin og på det ønskede niveau af tillid eller sandsynlighed, af Rs. 100 / - og 0, 95.

Hvis vi strammer fejlmarginen og indstiller den til Rs. 50 / - Antallet af sager i stikprøven, dvs. den ønskede størrelse af prøven, vil være fire gange så stor (dvs. 380) som den størrelse, der kræves for den tidligere fejlmargin (Rs. 100 / -).

Hvis en anden lokalitet er præget af større homogenitet med hensyn til indkomst og formodet, således at standardafvigelsen i indkomstvilkår kun er 100, vil størrelsen af ​​prøven for ovennævnte fejlmargin være meget lavere.

Med andre ord illustrerer brugen af ​​formlen lektionen nemlig større homogeniteten mindre den nødvendige prøve og større nøjagtigheden efterspurgt, større den nødvendige prøvestørrelse.

Den gentagne brug af sådanne udtryk som fejlmargin og konfidensniveau og andre numeriske udtryk for sandsynligheder og stikstørrelser kan have en indtryk af, at en prøvestørrelse beregnet ved en formel vil sikre en ønsket præcision.

Det skal imidlertid huskes, at relationerne i de sandsynlige statistiske tabeller repræsenterer normale forventninger i en ideel tilfældig prøveudtagning. Men så meget som den faktiske prøveudtagning sjældent er ideel, kan relationerne udtrykt i tabeller ikke forventes at holde.

Den generelle vanskelighed og sjældenhed ved ideel prøveudtagning skal forståeligt nok gøre en skeptisk til resultater, der er nøjagtigt i overensstemmelse med forventningerne.

Dette betyder imidlertid ikke, at forskeren ikke bør bruge eller foretrække den nøjagtige stikprøvestørrelse beregnet på grundlag af sandsynlighedsformlen. Faktisk er det netop det, han skal gøre, fordi det er hans bedste spil. Han bør dog ikke insistere på denne nøjagtige størrelse, hvis praktiske overvejelser gør det uhensigtsmæssigt.

En væsentlig anden tilgang til problemet med bestemmelse af den ønskede prøvestørrelse er 'stabilitetstesten'. Dette består i at indsamle data for relativt små delprøver og holde løbende rekord af fordelingen af ​​afkastet.

Når der efter et tidspunkt ændres tilføjelsen af ​​flere delprøver ikke resultaterne væsentligt, kan forskeren antage, at den samlede prøve, der er trukket hidtil, er blevet tilstrækkelig størrelsevis. Men denne procedure kan vel betragtes som spild af tid, fordi den faktisk svarer til en forsker, der deltager i en række særskilte undersøgelser spredt over en længere periode.

Det er blevet hævdet, at denne procedure er uøkonomisk, idet flere skemaer indsamles, end der faktisk er behov for, da den afsmalende ud til punktet af omtrentlig stabilitet ikke kan lokaliseres med nogen sikkerhed, indtil kurven har opretholdt sit niveau i et stykke tid.

Men det ser ikke ud til at være en alvorlig begrænsning i forhold til den konservative praksis af mange velrenommerede studier, der samler mere end det nødvendige / mindste antal genstande som en prøve.

Den største fordel ved denne type stabilitetstest er, at man i stedet for at afhænge af beregninger baseret på foreløbige oplysninger øger simpelthen den samlede prøvestørrelsesenhed, som det observeres at være tilstrækkelig. Den empiriske kontrol med at se afkastet og stoppe, når de stabiliserer, virker ligetil og overbevisende.

Den væsentligste fare for denne procedure ligger i, at de successive delprøver indsamlet sandsynligvis ikke spredes over universet. Resultaterne kan stabilisere, selvom de ikke repræsenterer befolkningen.

Faktisk er den mindre repræsentative delprøven, jo mere sandsynligt er tilføjelsen af ​​flere tilfælde at give det samme resultat og kaste op for stabiliseringens udseende. Medmindre subprøve er et tværsnit af universet, vil der ikke være en overfølsom prøve, hvorpå man observerer den nærliggende stabilisering.

Det grundlæggende krav i denne procedure er, at en voksende repræsentativ prøve skal være tilgængelig til observation. Udgifterne og vanskeligheden ved at indsamle successive delprøver, som er spredt over universet, er hovedårsagerne til, at dette ikke sandsynligvis vil være repræsentativt.

Den empiriske stabilitetstest kan imidlertid være meget effektiv, når delprøverne er korrekt tegnet og opsamlet. Metoden er bedst egnet til interviewundersøgelser, der dækker relativt små områder eller samfund som en by eller en by, fordi det ikke er så svært eller dyrt at gøre hver delprøve til en tilfældig stikprøve af befolkningen.

En mere raffineret form for empirisk kontrol sammenlignet med stabilitetstesten er en forholdsvis ny udvikling, der kaldes sekventiel analyse. Den generelle procedure, der er involveret her, er at fortsætte med at tilføje til prøven og samtidig holde testen af ​​prøven for betydning, indtil den mindste prøve er akkumuleret, der vil tilvejebringe det nødvendige niveau af betydning.