8 Vigtige typer sandsynlighedsprøveudtagning

Denne artikel sætter fokus på de otte vigtige typer sandsynlighedsprøvetagning, der anvendes til at udføre social forskning. Typerne er: 1. Simpel tilfældig prøveudtagning 2. Systematisk prøveudtagning 3. Stratificeret tilfældig prøveudtagning 4. Proportional Stratified Sampling 5. Disproportioneret Stratified Sampling 6. Optimal Allocation Prøve 7. Klusterprøveudtagning 8. Flerfasetagning.

Type # 1. Simpel tilfældig prøveudtagning:

Simpel tilfældig prøveudtagning er på en måde grundtemaet for al videnskabelig prøveudtagning. Det er det primære sandsynlighedsprøveudtag. Faktisk er alle andre metoder til videnskabelig prøveudtagning variationer i den enkle stikprøveudtagning. En forståelse af nogen af ​​de raffinerede eller komplekse forskellige prøveudtagningsprocedurer forudsætter en forståelse af simpel tilfældig prøveudtagning.

En simpel tilfældig prøve udvælges ved en proces, der ikke kun giver hvert element i befolkningen en lige chance for at blive inkluderet i prøven, men gør ligeledes sandsynliggørelsen af ​​enhver mulig kombination af tilfælde i den ønskede prøvestørrelse. Antag for eksempel, at man har en befolkning på seks børn, nemlig A, B, C, D, E og F.

Der vil være følgende mulige kombinationer af tilfælde, der hver har to elementer fra denne population, nemlig AB, AC, AD, AE, AF, BC, BD, BE, BF, CD, CE, EF, DE, DF og EF, dvs. i alle 15 kombinationer.

Hvis vi skriver hver kombination på lige store kort, sæt kortene i en kurv, bland dem grundigt og lad en blindfoldet person vælge en, vil hver af kortene have samme chance for at blive valgt / inkluderet i prøven.

De to tilfælde (parret) skrevet på kortet hentet af den blinde foldede person vil således udgøre den ønskede simple tilfældige prøve. Hvis man ønsker at vælge simple tilfældige prøver af tre tilfælde fra ovennævnte population af seks tilfælde, vil de mulige prøver, hver af de tre tilfælde, være ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, BCD, BCE, BCF, BDE, BDF, BEF, CDE, CDF, CEF og DEF, dvs. 20 kombinationer i alt.

Hver af disse kombinationer vil have en lige chance for udvælgelse i prøven. Ved hjælp af samme metode kan man vælge en simpel tilfældig prøve af fire tilfælde fra denne population.

I princippet kan man anvende denne metode til at vælge stikprøver af enhver størrelse fra en population. Men i praksis vil det blive en meget besværlig og i visse tilfælde en umulig opgave at liste alle mulige kombinationer af det ønskede antal sager. Det samme resultat kan opnås ved at vælge enkelte elementer, en efter en, ved hjælp af ovenstående metode (lotteri) eller ved hjælp af en bog med tilfældige tal.

Bogen af ​​tabeller, der indeholder en liste over tilfældige tal, er opkaldt efter Tippet, som først oversatte begrebet tilfældighed til en bog med tilfældige tal.

Denne bog er udarbejdet ved en meget kompliceret procedure på en sådan måde, at tallene ikke viser noget tegn på systematisk orden, det vil sige, ingen kan anslå antallet af følgende på grundlag af det foregående nummer og omvendt. Lad os diskutere de to metoder til at tegne en simpel tilfældig prøve.

Lotteri Metode:

Denne metode indebærer følgende trin:

(a) Hvert medlem eller element i "befolkningen" er tildelt et unikt nummer. Det vil sige, ingen to medlemmer har samme nummer,

(b) Hvert nummer er noteret på et separat kort eller en chip. Hver chip eller kort skal ligner alle de andre med hensyn til vægt, størrelse og form osv.

(c) Kortene eller chipsene anbringes i en skål og blandes grundigt,

(d) En blindfoldet person bliver bedt om at afhente enhver chip eller kort fra skålen.

Under disse omstændigheder kan sandsynligheden for at tegne et kort betragtes som det samme som sandsynligheden for at tegne et andet kort. Da hvert kort repræsenterer et medlem af befolkningen, vil sandsynligheden for at vælge hver være nøjagtig den samme.

Hvis det efter at have valgt et kort (chip) blev erstattet i skålen og indholdet igen grundigt blandet, ville hver chip have en lige sandsynlighed for at blive valgt på anden, fjerde eller nste tegning. En sådan procedure ville i sidste ende give en simpel tilfældig prøve.

Valg af prøve med hjælp til tilfældige tal :

Vi har allerede sagt hvad tilfældige tal er. Disse tal hjælper med at undgå enhver forskelsbehandling (ulige chancer) for elementer, der omfatter en population, at være medtaget i prøven ved udvælgelse af prøven.

Disse tilfældige tal er så forberedt, at de opfylder det matematiske kriterium for fuldstændig tilfældighed. Enhver standard bog om statistikker indeholder et par sider med tilfældige tal. Disse tal er generelt angivet i kolonner på på hinanden følgende sider.

Følgende er en del af et sæt tilfældige tal:

Brugen af ​​tabellerne med tilfældige tal involverer følgende trin:

(a) Hvert medlem af befolkningen er tildelt et unikt nummer. For eksempel kan et medlem have nummeret 77 og en anden 83 osv.

b) Tabellen med tilfældige tal indtastes på et vilkårligt vilkårligt sted (med et blinde mark på en hvilken som helst side i tabellen), og de tilfælde, hvis tal kommer op, mens man flytter fra dette punkt ned i søjlen, er inkluderet i prøven indtil Det ønskede antal sager er opnået.

Antag, at vores befolkning består af fem hundrede elementer, og vi ønsker at tegne halvtreds sager som en prøve. Antag at vi bruger de sidste tre cifre i hvert antal fem cifre (da universets størrelse er 500, dvs. tre-digital).

Vi går ned ad søjlen og starter med 42827; men da vi har besluttet at bruge kun tre cifre (sige de sidste tre), starter vi med 827 (ignorerer de to første cifre). Vi noterer nu hvert tal mindre end 501 (da befolkningen er på 500).

Prøven ville blive taget til at bestå af de elementer i befolkningen med de tal, der svarer til de valgte. Vi stopper efter at have valgt 50 (størrelsen afgjort af os) elementer. På baggrund af ovenstående afsnit af tabellen vælger vi 12 tal svarende til de valgte. Vi vælger 12 tilfælde svarende til tallene 237, 225, 280, 184, 203, 190, 213, 027, 336, 281, 288, 251.

Karakteristik af Simple Random Sample:

Vi skal starte med at overveje en meget vigtig egenskab af de enkle tilfældige prøver; Dette væsen, jo større stikprøven er, jo mere sandsynligt er det, at dets gennemsnitlige (middelværdi) vil være tæt på 'population'-middelværdien, dvs. den sande værdi. Lad os illustrere denne ejendom ved at antage, at en befolkning bestående af seks medlemmer (børn).

Lad disse børns alder være henholdsvis: A = 2 år, B = 3 år, C = 4 år, D = 6 år, E = 9 år og F = 12 år. Lad os tegne tilfældige prøver af en, to, tre fire og fem medlemmer fra denne befolkning og se, hvordan prøveeksemplerne (middelværdier) i hvert tilfælde opfører sig i forhold til den sande "population" -middel (dvs. 2 + 3 + 4 + 6 + 9 + 12 = 36/6 = 6). Tabel efter illustrerer opførsel af prøveorganet som forbundet med størrelsen af ​​prøven.

Tabel, der viser de mulige prøver af en, to, tre, fire og fem elementer (børn fra henholdsvis 6 børn i alderen 2, 3, 4, 6, 9 og 12 år):

I den givne tabel er alle mulige stikprøver af forskellige størrelser (dvs. 1, 2, 3, 4 og 5) og deres tilsvarende midler vist. Den sande (population) middel er 6 år. Dette middel kan naturligvis beregnes ved at tilføje middelværdierne af de samlede kombinationer af elementerne i befolkningen for en given prøvestørrelse.

I tabellen ser vi for eksempel at for stikprøvestørrelsen af ​​tre elementer er der 20 mulige kombinationer af elementer, hvor hver kombination har en lige chance for at blive valgt som en prøve i overensstemmelse med sandsynlighedsprincippet.

Tilføjelse af middelværdierne for disse mulige kombinationer vist i tabellen, vi får den samlede score på 120. Middelværdien vil være 120 ÷ 20 = 6, hvilket også er selvfølgelig befolkningens middelværdi. Dette gælder også for andre kolonner.

Lad os nu undersøge tabellen omhyggeligt. Vi finder ud af, at for prøver af ét element hver (kolonne A) er der kun en middelværdi, som ikke afviger mere end 1 enhed fra den ægte befolknings gennemsnit af 6 år. Det vil sige, at alle andre, dvs. 2, 3, 4, 9 og 12 afviger mere end en enhed fra befolkningsmiddelet, dvs. 6. Da vi øger stikprøven, f.eks. I kolonne B, hvor stikprøvestørrelsen er 2, vi finder en større andel af middelværdierne (gennemsnit), der ikke afviger fra befolkningens gennemsnit med mere end 1 enhed.

Ovenstående tabel viser, at for to eksemplarer er der 15 mulige kombinationer og dermed 15 mulige midler. Ud af disse 15 betyder der 5 midler, der ikke afviger fra befolkningen, med mere end 1 enhed.

Det vil sige, at der er 33% af stikprøveorganerne, som ligger tæt på befolkningens gennemsnit inden for +1 og -1 enheder. I kolonne C i tabellen ser vi, at der er 20 mulige kombinationer af elementer til stikprøvestørrelsen af ​​tre elementer, hver.

Fra ud af de 20 mulige prøveemner finder vi, at 10, dvs. 50% afviger ikke fra befolkningens gennemsnit med mere end 1 enhed. For stikprøvestørrelsen på fire elementer er der 67% af midler, der ligger inden for intervallet +1 og -1 enhed fra det sande (population) middelværdi.

Endelig er der for prøven størrelse på fem elementer meget mere, dvs. 83% af sådanne midler eller estimater. Lærdommen, der ligger ud af vores observationer, er helt tydelig, dvs. jo større prøve er, jo mere sandsynligt er det, at dets gennemsnit vil være tæt på befolkningsmediet.

Dette er det samme som at sige, at spredningen af ​​estimater (midler) falder, da prøvestørrelsen stiger. Vi kan tydeligt se dette i ovenstående tabel. For stikprøvestørrelsen på en (søjle A) er middelmængden den største, dvs. mellem 2 og 12 = 10. For stikprøvestørrelsen på to er intervallet mellem 2, 5 og 10, 5 = 8.

For stikprøvestørrelsen på tre, fire og fem er variabiliteten af ​​midler henholdsvis 3 til 9 = 6, 3, 8 til 7, 8 = 4 og 4, 8 til 6, 8 = 2. Det fremgår også af bordet, at jo mere en prøve Middelværdien adskiller sig fra befolkningen, dvs. jo mindre hyppigt forekommer det sandsynligvis.

Vi kan repræsentere dette fænomen ved simpel tilfældig prøveudtagning klart ved hjælp af en række kurver, der viser forholdet mellem variabilitet af estimater og størrelsen af ​​prøven. Lad os overveje en stor befolkning af beboere. Man kan forestille sig, at deres aldre vil variere mellem under 1 år (i det mindste) og over 80 år (højst).

Den normale og fornuftige forventning ville være, at der er mindre tilfælde, da man nærmer sig ekstremerne, og at antallet af sager fortsætter gradvis og symmetrisk, idet vi bevæger os væk fra disse ekstremer.

Middelalderen for befolkningen er, lad os sige, 40 år. En sådan fordeling af beboere kan repræsenteres ved en kurve kendt som den normale eller klokkeformede kurve (A i nedenstående diagram). Lad os nu antage, at vi fra denne befolkning tager forskellige tilfældige prøver af forskellige størrelser, fx 10.100 og 10.000. For en af ​​stikprøvestørrelsen får vi et meget stort antal prøver fra befolkningen.

Hver af disse prøver vil give os et bestemt skøn over populationens gennemsnit. Nogle af disse midler vil være over-estimater og nogle under-estimater af befolkningskarakteristikken (middel- eller middelalder). Nogle midler vil være meget tæt på det, et par ganske langt.

Hvis vi plotte sådanne prøveorganer for en bestemt stikstørrelse og tilslutte disse punkter, får vi i hvert tilfælde en normal kurve. Forskellige normale kurver repræsenterer således værdierne af prøveorganer til prøver af forskellige størrelser.

Ovennævnte diagram nærmer sig et billede af, hvordan prøveorganerne ville opføre sig i forhold til prøveens størrelse. Kurven A repræsenterer placeringen af ​​enkeltpersoners alder. De estimerede prøver af 10 individer, hver fra kurven B, der viser en ganske bred dispersion fra sand befolkning - betyder 40 år).

Prøven af ​​prøver på 100 individer hver udgør en normal kurve C, der viser meget mindre afvigelse fra populationsmiddelet. Endelig betyder midlerne til prøverne på 10.000 fra en kurve, der næsten nærmer sig den lodrette linje, der svarer til populationsmiddelet. Afvigelsen af ​​de værdier, der repræsenterer kurve D fra populationens gennemsnit, ville være ubetydelige, hvilket det fremgår af diagrammet.

Det kan også meget klart skelnes fra ovenstående figur, at for stikprøver af en given størrelse er det mest sandsynlige prøvemiddel middelmængden. Den næste mest sandsynlige er middelværdierne tæt på befolkningens middelværdi.

Således kan vi konkludere, at jo mere en stikprøve betyder afviger fra befolkningen, jo mindre er det sandsynligt, at det skal forekomme. Og endelig ser vi også, hvad vi allerede har sagt om prøvernes opførsel, nemlig jo større prøve jo mere sandsynligt er det, at dets gennemsnit vil være tæt på befolkningsmiddelet.

Det er denne form for adfærd på den del af de enkle tilfældige (sandsynligheds) prøver med hensyn til gennemsnittet såvel som proportioner og andre typer statistikker, som gør det muligt for os at estimere ikke kun befolkningskarakteristikken (f.eks. den gennemsnitlige) men også sandsynligheden for, at prøven ville afvige fra den sande befolkningsværdi med et givet beløb.

Et typisk træk ved den enkle stikprøveudtagning er, at når befolkningen er stor sammenlignet med stikprøvestørrelsen (f.eks. Mere end ti gange så stor), påvirkes variablerne af prøveudtagningsfordelinger mere af det absolutte antal tilfælde i prøve end af den andel af befolkningen, som prøven indeholder.

Med andre ord afhænger størrelsen af ​​de fejl, der sandsynligvis vil opstå som følge af prøveudtagning, mere af prøveens absolutte størrelse end den andel, den bærer med befolkningen, dvs. hvor stor eller hvor lille en del er af befolkning.

Jo større størrelsen af ​​den tilfældige stikprøve er, jo større er sandsynligheden for, at den vil give et rimeligt godt skøn over befolkningskarakteristikken uanset proportionen i forhold til befolkningen.

Vurderingen af ​​en populær afstemning ved en national meningsmåling inden for rammerne af en tolerabel fejlmargin ville således ikke kræve en væsentligt større prøve end den, der ville være nødvendigt for en vurdering af befolkningsstemme i en bestemt provins, hvor afstemningsresultatet er i tvivl.

For at uddybe punktet vil en prøve på 500 (100% prøve) give perfekt nøjagtighed, hvis et fællesskab kun havde 500 indbyggere. En prøve på 500 vil give en smule større nøjagtighed for et byområde på 1000 beboere end for en by på 10.000 indbyggere. Men ud over det punkt, hvor prøven er en stor del af 'universet', er der ingen mærkbar forskel i nøjagtigheden med stigningerne i størrelsen af ​​'universet'.

For et givet nøjagtighedsniveau ville identiske stikstørrelser give samme niveau af nøjagtighed for lokalsamfund i forskellige befolkninger, fx fra 10.000 til 10 millioner. Forholdet mellem stikprøvestørrelsen og befolkningen i disse samfund betyder intet, selvom det synes at være vigtigt, hvis vi fortsætter med intuition.

Type # 2. Systematisk prøveudtagning:

Denne type prøveudtagning er til alle praktiske formål, en tilnærmelse af simpel tilfældig prøveudtagning. Det kræver, at befolkningen kan identificeres entydigt ved sin ordre. F.eks. Kan beboere i et fællesskab være opført, og deres navne omordnes alfabetisk. Hvert af disse navne kan få et unikt nummer. Et sådant indeks er kendt som "rammen" for den pågældende befolkning.

Antag, at denne ramme består af 1.000 medlemmer, hver med et unikt nummer, dvs. fra 1 til 1.000. Lad os sige, vi vil vælge en prøve på 100. Vi kan starte med at vælge et tal mellem 1 til 10 (begge medfølger). Antag at vi foretager et tilfældigt udvalg ved at indtaste listen og få 7.

Vi fortsætter med at vælge medlemmer; startende fra 7, med et regelmæssigt interval på 10. Den valgte til at vælge medlemmer: starter fra med et regelmæssigt interval på 10. Den valgte prøve vil således bestå af elementer, der bærer nr. 7, 17, 27, 37, 47, ... 977, 987, 997. Disse elementer sammen ville udgøre en systematisk prøve.

Det skal huskes, at en systematisk prøve kun kan anses for at være en sandsynlighedstest, hvis det første tilfælde (f.eks. 7) er valgt tilfældigt, og derefter blev tiende tilfælde fra rammen valgt derefter.

Hvis det første tilfælde ikke vælges tilfældigt, vil den resulterende prøve ikke være en sandsynlighedsprøve, da de fleste af sagerne, der ikke er i en afstand af ti fra det oprindeligt valgte nummer, vil have en null (0 ) sandsynlighed for at blive medtaget i prøven.

Det skal bemærkes, at der ved den systematiske prøveudtagning, når det første tilfælde er tilfældigt udtrukket, ikke er nogen begrænsning på chancerne for en given sag, der skal indgå i stikprøven. Men når først det første tilfælde er valgt, er chancerne for efterfølgende sager afgørende påvirket eller ændret. I ovenstående eksempel har tilfældene bortset fra 17, 27, 37, 47 ... osv. Ingen chance for at blive medtaget i prøven.

Det betyder, at systematisk prøveudtagningsplan ikke har råd til alle mulige kombinationer af tilfælde, den samme chance for at blive medtaget i prøven.

Resultaterne kan derfor være ret vildledende, hvis sagerne på listen er arrangeret i en eller anden cyklisk rækkefølge, eller hvis befolkningen ikke blandes grundigt med hensyn til de karakteristika, der er under undersøgelse (dvs. indkomst eller studieperiode), dvs. på en måde at hver af de ti medlemmer havde lige chance for at blive valgt.

Type # 3. Stratificeret Random Sampling:

I den stratificerede stikprøveudtagning deles befolkningen først i en række lag. Sådanne lag kan baseres på et enkelt kriterium, f.eks. Uddannelsesniveau, hvilket giver et antal lag svarende til de forskellige uddannelsesniveauer) eller ved kombination af to eller flere kriterier (fx alder og køn), hvilket giver strata som mænd under 30 år og mænd over 30 år, kvinder under 30 år og kvinder over 30 år.

I stratificeret stikprøveudtagning tages en simpel tilfældig prøve fra hver af lagene, og sådanne delprøver bøjes sammen for at danne den samlede prøve.

Generelt bidrager stratifikation af universet med henblik på prøveudtagning til prøveudtagningens effektivitet, hvis den opretter klasser, det vil sige om den kan opdele befolkningen i klasser af medlemmer eller elementer, der er internt forholdsvis homogene og i forhold til hinanden, heterogene, med hensyn til de karakteristika, der undersøges. Lad os antage, at alder og køn er to potentielle grundlag for lagdeling.

Nu skal vi opdage, at stratifikation på grundlag af køn (mand / kvinde) giver to lag, som afviger markant fra hinanden med hensyn til score på andre relevante egenskaber under undersøgelse, mens på den anden side alder som grundlag for stratificering ikke udbyttestrat, der er væsentligt forskellige fra hinanden med hensyn til scoren på de andre væsentlige egenskaber, vil det være tilrådeligt at stratificere befolkningen på grundlag af køn snarere end alder.

Med andre ord vil kriteriet om køn være mere effektivt grundlag for stratificering i denne sag. Det er helt muligt, at processen med at bryde befolkningen ned i lag, der er internt homogene og relativt heterogene med hensyn til bestemte relevante egenskaber, er uforholdsmæssigt dyrt.

I en sådan situation kan forskeren vælge at vælge en stor simpel tilfældig prøve og kompensere for den høje pris ved at øge (gennem en stor størrelse simpel tilfældig prøve) den samlede størrelse af prøven og undgå farer ved hjælp af stratificering.

Det skal klart forstås, at stratificeringen næsten ikke har noget med at gøre prøven til en replika af befolkningen.

Faktisk er de problemer, der er involveret i beslutningen om, om lagdeling skal ske, primært relateret til den forventede homogenitet af de definerede lag med hensyn til de undersøgte egenskaber og de komparative omkostninger ved forskellige metoder til opnåelse af præcision. Stratificeret stikprøveudtagning som den enkle stikprøveudtagning involverer repræsentative prøveudtagningsplaner.

Vi vender nu til at diskutere de store former eller lagdelt prøveudtagning. Antallet af sager, der er valgt inden for hvert stratum, kan være proportional med stratumets styrke eller uforholdsmæssigt store.

Antallet af sager kan være det samme fra lag til stratum eller variere fra et lag til et andet afhængigt af prøveudtagningsplanen. Vi skal nu meget kort overveje disse to former, dvs. forholdsmæssige og uforholdsmæssige stratificerede prøver.

Type nr. 4. Proportional Stratified Sampling :

Ved proportional prøveudtagning trækkes sager fra hvert lag i samme forhold som de forekommer i universet. Antag, at vi ved, at 60% af "befolkningen" er mandlig og 40% af den er kvinde. Proportional stratified sampling med henvisning til denne 'population' ville indebære at tegne en prøve på en sådan måde, at den samme division blandt køn afspejles, dvs. 60:40 i prøven.

Hvis den systematiske prøveudtagningsprocedure anvendes i en undersøgelse, afgøres grundlaget for listen, hvorvidt den resulterende prøve er en forholdsmæssig stratificeret prøve. For eksempel, hvis hvert syvnavn er valgt i en regelmæssig rækkefølge fra en liste over alfabetisk arrangerede navne, skal den resulterende prøve indeholde ca. 1/7 af de navne, der begynder med hvert bogstav i alfabetet.

Den resulterende prøve i dette tilfælde ville være en forholdsmæssig stratificeret alfabetisk prøve. Selvfølgelig, hvis det alfabetiske arrangement er fuldstændig uafhængigt og irrelevant for det problem, der undersøges, kan prøven betragtes som en tilfældig prøve med visse begrænsninger, der er typiske for de systematiske prøver, der er diskuteret ovenfor.

Der kan adskilles forskellige grunde til at prøve de forskellige lag i ulige eller ulige proportioner. Nogle gange er det nødvendigt at øge andelen af ​​prøver, der er udtaget fra lag, har et lille antal tilfælde for at få en garanti for, at disse lag ikke kommer til at blive samplet overhovedet.

Hvis man for eksempel planlægger en undersøgelse af detailhandel med tøj i en bestemt by på et givet tidspunkt, kan en simpel tilfældig prøve af detailbutikker ikke give os et nøjagtigt skøn over det samlede salgsvolumen, da en lille Antallet af virksomheder med en meget stor del af det samlede salg kan forekomme at blive udelukket fra stikprøven.

I dette tilfælde ville man være klogt at lagre befolkningen i tøjbutikker med hensyn til nogle få tøjbutikker, der har et meget stort salgsomfang, vil udgøre det øverste lag. Forskeren ville gøre det godt at medtage dem alle i sin prøve.

Det vil sige, han kan til tider gøre det godt at tage en 100% prøve fra dette lag og en meget mindre procentdel af sager fra de andre lag, der repræsenterer et stort antal butikker (med lavt eller moderat volumen af ​​omsætning). En sådan uforholdsmæssig prøveudtagning vil sandsynligvis give pålidelige skøn for befolkningen.

En anden grund til at tage en større del af sager fra et lag snarere end fra andre er, at forskeren måske ønsker at opdele sager inden for hvert lag for yderligere analyse.

Substraterne, der således er afledt, kan ikke alle indeholde tilstrækkeligt mange sager til at prøve ud fra og i samme forhold som de andre delstrater. Derfor ville de ikke have tilstrækkelige tilfælde til at tjene som et passende grundlag for yderligere analyse. Dette er tilfældet, man må prøve ud en større del af sagerne fra underlaget.

Generelt kan man sige, at størst præcision og repræsentation kan opnås, hvis prøver fra de forskellige strata afspejler deres relative variabler tilstrækkeligt i forhold til karakteristika under undersøgelse snarere end at præsentere deres relative størrelser i 'befolkningen'.

Det anbefales at prøve tyngre i lag, hvor forskeren har en grund til at tro, at variabiliteten omkring en given karakteristik, f.eks. Holdninger eller deltagelse, ville være større.

I en undersøgelse, der blev foretaget for at forudsige udfaldet af de nationale valg, der anvender metoden for lagdelt prøveudtagning, med stater som grundlag for stratificering, bør der derfor tages en tyngre prøve fra de områder eller regioner, hvor resultatet er stærkt overskyet og stærkt tvivlsomt .

Type nr. 5. Uforholdsmæssig stratificeret prøveudtagning :

Vi har allerede foreslået egenskaberne ved den uforholdsmæssige prøveudtagning og også en del af den største fordel ved denne prøveudtagningsprocedure. Det er klart, at en stratificeret prøve, hvor antallet af elementer trukket fra forskellige lag er uafhængigt af størrelsen af ​​disse lag, kan kaldes en uforholdsmæssig stratificeret prøve.

Den samme effekt kan godt opnås alternativt ved at tegne et lige antal sager fra hvert lag, uanset hvor stærkt eller svagt stratum er repræsenteret i befolkningen.

Som en følge af den valgte måde er en fordel ved uforholdsmæssig stratificeret prøveudtagning relateret til det faktum, at alle lagene er lige så pålidelige ud fra prøveens størrelse. En endnu vigtigere fordel er økonomien.

Denne type prøve er økonomisk, idet forskerne sparer problemerne med at sikre en unødvendig stor mængde information fra de mest udbredte grupper i befolkningen.

En sådan prøve kan dog også forråde de kombinerede ulemper ved ulige antal tilfælde, dvs. lillehed og ikke-repræsentativitet. Desuden kræver en uforholdsmæssig prøve dybt kendskab til de relevante karakteristika af de forskellige lag.

Type nr. 6. Optimal fordelingsprøve :

I denne prøveudtagningsprocedure er størrelsen på prøven trukket fra hvert stratum proportional med både størrelsen og spredningen af ​​værdier inden for et givet stratum. En nøjagtig anvendelse af denne prøveudtagningsprocedure indebærer anvendelse af visse statistiske begreber, der endnu ikke er tilstrækkeligt eller overbevisende indført.

Vi ved nu noget om den stratificerede stikprøveudtagning og dens forskellige manifestationer. Lad os nu se, hvordan variablerne eller kriterierne for stratificering skal planlægges.

Følgende overvejelser indgår ideelt i udvælgelsen af ​​kontroller til stratificering:

(a) De oplysninger, der er tydelige for lagens institutioner, bør være ajourførte, nøjagtige, komplette, gældende for befolkningen og tilgængelig for forskeren.

Mange karakteristika ved befolkningen kan ikke bruges som kontroller, da der ikke foreligger tilfredsstillende statistikker om dem. I et højdynamisk samfund præget af store omvæltninger i befolkningen risikerer forskeren at anvende stratifikationsstrategien typisk risikoen for at gå ret forkert i sine skøn over størrelsen af ​​de lag, han påvirker i sin prøve.

b) Forskeren bør have grund til at tro, at de faktorer eller kriterier, der anvendes til stratificering, er signifikante i lyset af det undersøgte problem.

c) Medmindre det pågældende stratum er stort nok, og derfor har sampler og feltarbejdere ingen store vanskeligheder med at finde kandidater til det, bør den ikke anvendes.

d) Ved udvælgelse af tilfælde til stratificering skal forskeren forsøge at vælge de homogene med hensyn til de karakteristika, der er væsentlige for det undersøgte problem. Som det blev sagt tidligere, er stratifikationen effektiv i det omfang, at elementerne inden for lagret er som hinanden og samtidig forskellige i forhold til elementerne i andre lag.

Lad os nu overveje fordelene og begrænsningerne af stratificeret stikprøveudtagning på en generel måde:

(1) Ved anvendelse af den stratificerede stikprøveudtagningsprocedure kan forskeren forblive sikker på, at ingen væsentlige grupper eller kategorier udelukkes fra stikprøven. Større repræsentativitet af prøven er således sikret, og de lejlighedsvise uheld, der opstår i simpel tilfældig prøveudtagning, undgås således.

(2) I tilfælde af mere homogene populationer kan der opnås større præcision med færre tilfælde.

(3) Sammenlignet med de enkle tilfældige er stratificerede prøver mere koncentreret geografisk og derved reducerer omkostningerne i form af tid, penge og energi i interviewpersoner.

(4) De prøver, som en interviewer vælger, kan være mere repræsentativ, hvis hans kvote er allokeret ved den upersonlige stratifikationsprocedure, end hvis han skal bruge sin egen bedømmelse (som i kvoteprøver).

Hovedbegrænsningen af ​​stratificeret stikprøveudtagning er, at for at sikre de maksimale fordele ved det i løbet af en undersøgelse, skal forskeren vide meget om problemet med forskning og dets forhold til andre faktorer. En sådan viden er ikke altid kommende, og ganske så ofte venter er længe.

Det skal huskes, at synspunktet om sandsynlighedsprøvetagningsteorien er det i det væsentlige irrelevant, om stratifikation indføres under prøveudtagningsprocessen eller under analysen af ​​data, undtagen i det omfang det førstnævnte gør det muligt at kontrollere størrelsen af prøve opnået fra hvert lag og således forøge effektiviteten af ​​prøveudtagningsdesignet.

Med andre ord er proceduren med at tegne en simpel tilfældig prøve og derefter opdele den i strata tilsvarende for at tegne en stratificeret tilfældig prøve ved anvendelse som prøveudtagningsrammen inden for hvert lag, populationen af ​​det lag, som er inkluderet i den givne enkle tilfældig prøve.

Type nr. 7. Clusterprøveudtagning :

Typisk medfører simpelt stikprøveudtagning og stratificeret stikprøveudtag enorme omkostninger, når de beskæftiger sig med store og rumlige eller geografisk spredte populationer.

I de ovennævnte typer af prøveudtagning kan de elementer, der er valgt i prøven, være så vidt spredt, at det kan medføre store omkostninger, en større andel af ikke-produktiv tid (brugt under rejser), større sandsynlighed for manglende ensartethed blandt interviewpersoner spørgsmålstegn, optagelser og endelig en stor udgift til overvågning af feltpersonalet.

Der er også andre praktiske faktorer for denne prøveudtagning. For eksempel kan det betragtes som mindre anstødeligt og dermed tilladt at administrere et spørgeskema til tre eller fire afdelinger på en fabrik eller et kontor i stedet for at administrere det på en prøve trukket fra alle afdelinger på en simpel eller stratificeret tilfældig basis, da sidstnævnte procedure kan være meget mere forstyrrende for fabriksrutinerne.

Det er af nogle af grundene, at storskalaundersøgelser sjældent gør brug af enkle eller stratificerede tilfældige prøver; I stedet gør de brug af metoden for klyngeprøveudtagning.

I klyngeprøveudtag prøver sampler først ud af befolkningen, visse store grupperinger, dvs. "klynge". Disse klynger kan være byafdelinger, husholdninger eller flere geografiske eller sociale enheder. Prøveudtagningen af ​​klynger fra befolkningen sker ved simple eller stratificerede stikprøveudtagningsmetoder. Fra disse udvalgte klynger udtages de bestanddele ved anvendelse af procedurer, der sikrer tilfældighed.

Antag for eksempel, at en forsker ønsker at gennemføre en stikprøveundersøgelse af problemerne med bachelorstuderende på gymnasier i Maharashtra.

Han kan fortsætte som følger:

(a) Først forbereder han en liste over alle universiteterne i staten og vælger en prøve af universiteterne på en "tilfældig" basis.

(b) For hver af de universiteter i staten indbefattet m prøven, udarbejder han en liste over gymnasier under sin jurisdiktion og tager en prøve af kollegier på en "tilfældig" basis.

(c) For hver af de gymnasier, der tilfældigvis indgår i prøven, laver han en liste over alle bachelorstuderende, der er indskrevet med det. Fra ud af disse studerende vælger han en prøve af den ønskede størrelse på en "tilfældig" basis (enkelt eller stratificeret).

På denne måde får forskeren en sandsynlighed eller tilfældig prøve af elementer, mere eller mindre koncentreret, geografisk. På denne måde er han i stand til at undgå store udgifter, som ellers ville have været pådraget, hvis han havde været i stand til simpel eller stratificeret stikprøveudtagning, og alligevel behøver han ikke ofre principperne og fordele ved sandsynlighedsprøvetagning.

Karakteristisk går denne prøveudtagningsprocedure gennem en række faser. Derfor er det på en måde en "flerstadie" prøveudtagning og nogle gange kendt af dette navn. Denne prøveudtagningsprocedure bevæger sig gradvist fra de mere inklusiv til de mindre inklusiv prøveudtagningsenheder, som forskeren endelig ankommer til de bestanddele, der udgør hans ønskede prøve.

Det skal bemærkes, at det ved klyngeprøveudtagning ikke længere er sandt, at hver kombination af det ønskede antal elementer i befolkningen lige så sandsynligt kan vælges som befolkningens stikprøve. Derfor kan den slags effekter, vi så i vores analyse af enkle stikprøver, dvs. befolkningsværdien er den mest sandsynlige prøveværdi, ikke ses her.

But such effects do materialize in a more complicated way, though, of course, the sampling efficiency is hampered to some extent. It has been found that on a per case basis, the cluster sampling is much less efficient in getting information than comparably effective stratified random sampling.

Relatively speaking, in the cluster sampling, the margin of error is much greater. This handicap, however, is more than balanced by associated economies, which permit the sampling of a sufficiently large number of cases at a smaller total cost.

Depending on the specific features of the sampling plan attendant upon the objects of survey, cluster sampling may be more or less efficient than simple random sampling. The economies associated with cluster sampling generally tilt the balance in favour of employing cluster sampling in large-scale surveys, although compared to simple random sampling, more cases are needed for the same level of accuracy.

Type # 8. Multi-Phase Sampling:

It is sometimes convenient to confine certain questions about specific aspects of the study to a fraction of the sample, while other information is being collected from the whole sample. This procedure is known as 'multi-phase sampling.'

The basic information recorded from the whole sample makes it possible to compare certain characteristics of the sub-sample with that of the whole sample.

One additional point that merits mention is that multi-phase sampling facilitates stratification of the sub-sample since the information collected from the first phase sample can sometimes be gathered before the sub-sampling process takes place. It will be remembered that panel studies involve multi-phase sampling.