Studie noter om Chi-Square test

Denne artikel indeholder en studie notat om chi-square test.

X ² (græsk bogstav X ² Pronounced as Ki-square) test er en metode til evaluering af, hvorvidt frekvenser, som er empirisk observeret, afviger væsentligt fra dem, der ville forventes under et bestemt sæt teoretiske antagelser. Antag for eksempel at politisk præference og bopæl eller nativitet er blevet krydsklassificeret, og dataene er opsummeret i følgende 2 × 3 beredskabstabel.

Det ses i tabellen, at andelen af byfolk er 38/48 = 0, 79, 20/46 = 0, 34 og 12/18 = 0, 67 (afrundet til to decimaler) for de tre politiske partier i landet. Vi vil så gerne vide, om disse forskelle er statistisk signifikante.

Med henblik herpå kan vi foreslå en null hypotese, som forudsætter, at der ikke er forskelle mellem de tre politiske partier med hensyn til fødsel. Det betyder, at andelen af by- og landbefolkningen forventes at være den samme for hver af de tre politiske partier.

På grundlag af antagelsen om, at nullhypotesen er korrekt, kan vi beregne et sæt frekvenser, der forventes i betragtning af disse marginale totaler. Med andre ord kan vi beregne antallet af personer, der viser præference for kongrespartiet, som vi ville forvente på grundlag af ovenstående antagelse om at være urbanites og sammenligne denne figur med den, der faktisk blev observeret.

Hvis nulhypotesen er sand, kan vi beregne en fælles andel som:

38 + 20 + 12/48 + 46 + 18 = 70/112 = 0, 625

Med denne anslåede andel forventer vi 48 x (0, 625) = 30 personer tilknyttet kongres, 46 _x (0, 625) = 28, 75 personer tilknyttet Janata Party og 18 x (0, 625) = 11, 25 personer tilknyttet Lok Dal fra ud af 70 mobiliserede. Ved at trække disse tal fra de respektive observerede tal fra de respektive størrelser af de tre prøver finder vi 48 - 30 = 18 tilknyttet kongres, 46 - 28.75 = 17.25 tilknyttet Janata og 18 - 11.25 = 6, 25 personer tilknyttet Lok Dal fra 42 personer fra landdistrikterne.

Disse resultater er vist i nedenstående tabel, hvor forventede frekvenser ar. vist i parentes.

For at teste holdbarheden af nullhypotesen sammenligner vi de forventede og observerede frekvenser. Sammenligningen er baseret på følgende X ^2- statistik.

X ² = Σ (O-E) ² / E

hvor O står for observerede frekvenser og E for de forventede frekvenser.

Frihedsgrader :

Antallet af frihedsgrader betyder antallet af uafhængige begrænsninger pålagt os i et uforudsete bord.

Følgende eksempel illustrerer begrebet:

Lad os antage, at de to attributter A og B er uafhængige, i hvilket tilfælde

forventet frekvens eller celle AB ville være 40 × 30/60 = 20. Når dette er identificeret, bliver frekvenserne af de resterende tre celler automatisk fikseret. For celle, aB skal den forventede frekvens være 40 - 20 = 20, tilsvarende for cellen AB skal den være 30 - 20 = 10 og for aB skal den være 10.

Det betyder, at for 2 × 2 bord har vi kun ét valg af vores egne, mens vi ikke har nogen frihed i de resterende tre celler. Graden af frihed (df) kan således beregnes ved hjælp af formlen:

df - (c - 1) (r - 1)

hvor df står for graden af frihed, c for antallet af kolonner og r for antallet af rækker.

Således i tabel 2 x 3 (tabel 18.54)

df = (3 - 1) (2 - 1) = 2 x 1 = 2

Niveauet af betydning :

Som tidligere nævnt anvendes chi-kvadratprøven til at undersøge, om forskellen mellem observerede og forventede frekvenser skyldes prøvetagningsfluktuationerne og som sådan ubetydelig eller modsat, om forskellen skyldes en anden grund og som sådan signifikant.

Før man tegner den konklusion, at forskellen er betydelige forskere opstiller en hypotese, der ofte henvises til som en null hypotese (symboliseret som H _o ) i modsætning til forskningshypotesen (H ₁ ), der er oprettet som et alternativ til H _o .

Normalt, men ikke altid, siger nullhypotesen, at der ikke er nogen forskel mellem flere grupper eller intet forhold mellem variabler, mens en forskningshypotese kan forudsige enten et positivt eller negativt forhold.

Med andre ord forudsætter null hypotesen, at der mangler ikke-prøveudtagningsfejl, og forskellen skyldes tilfældighed alene. Derefter bestemmes sandsynligheden for forekomsten af en sådan forskel.

Sandsynligheden indikerer omfanget af afhængighed, som vi kan placere på den indledte indledning. Tabellværdierne for chi-square er tilgængelige på forskellige sandsynlighedsniveauer. Disse niveauer kaldes niveauer af betydning. Vi kan finde ud af bordet værdierne af chi-square på bestemte niveauer af betydning.

Normalt (i samfundsvidenskabsproblemet) ses værdien af chi-square ved 0, 05 eller .01 niveauer af betydning fra de givne frihedsgrader fra bordet og sammenlignes med observeret værdi af chi-square. Hvis den observerede værdi eller y ¹ er mere end tabelværdien ved 0, 05, betyder det, at forskellen er signifikant.

Frihedsgrad :

For at bruge chi-square testen er det næste trin at beregne graden af frihed: Antag at vi har en 2 x 2 beredskabstabel som den i figur 1.

Vi kender rækken og kolonnens totaler r _t ¹ og r _t ² - og c _t ¹ og c _t ² . Antallet af frihedsgrader kan defineres som antallet af celleværdier, som vi frit kan specificere.

I figur 1 er den anden værdi i den række og værdierne for anden række (betegnet med X) allerede bestemt, når vi først angiver den ene værdi af række 1 (angivet ved check i figuren). Vi er ikke frie til at angive disse, fordi vi kender rædsumlerne og kolonnens totaler. Dette viser, at vi i en 2 x 2 beredskabstabel kun kan specificere en værdi.

Procedure :

Beregning for Chi-square:

Chi-square som en test af godhed af pasform:

I det foregående afsnit brugt vi chi-firkanten som en test af uafhængighed; det er om at acceptere eller afvise en null hypotese. X-testene kan også bruges til at afgøre, om der er en signifikant forskel mellem en observeret frekvensfordeling og en teoretisk frekvensfordeling.

På denne måde kan vi bestemme, hvor god passformen er for de observerede og forventede frekvenser. Det vil sige, at passformen ville blive betragtet som god, hvis der ikke er nogen signifikant divergens mellem de observerede og forventede data, når kurven for de observerede frekvenser er superpålagt på kurven af forventede frekvenser.

Vi skal imidlertid huske på, at selvom proportionerne i cellerne forbliver uændrede, varierer den chi-kvadratiske værdi direkte med det samlede antal tilfælde (N). Hvis vi fordobler antallet af tilfælde, bliver den chi-kvadratiske værdi fordoblet; hvis vi tredobler antallet af sager vi også triple chi-square og så videre.

Virkningerne af denne kendsgerning kan illustreres med et eksempel nedenfor:

I det foreliggende eksempel er den chi-kvadratiske værdi 3, 15. På dette grundlag ville vi naturligvis konkludere, at forholdet ikke er en væsentlig.

Antag nu, at der var indsamlet data på 500 tilfælde med følgende resultater:

Chi-kvadratværdi som beregnet fra figurerne, er nu kl. 6.30, hvilket er dobbeltværdien fremkommet i det foregående eksempel. Værdien 6, 30 er statistisk signifikant. Havde vi udtrykt resultaterne i procentvise tal ville der ikke have været en forskel i fortolkningen.

Ovennævnte eksempler illustrerer et meget vigtigt punkt, nemlig at kvadratet er direkte proportionalt med N. Derfor ville vi have brug for en foranstaltning, som ikke kun påvirkes af en ændring i antallet af tilfælde. Foranstaltningen phi (ǿ) giver denne facilitet, det vil sige den ejendom, vi ønsker i vores mål. Denne foranstaltning er simpelthen et forhold mellem chi-kvadratværdien og det samlede antal af de undersøgte sager.

Foranstaltningen phi (ø) er defineret som:

Ø = √x ² / n

det vil sige kvadratroden af chi-kvadrat divideret med antallet af sager.

Ved at anvende denne formel på de to ovenfor nævnte eksempler får vi i det første tilfælde:

Således giver foranstaltningen ø i modsætning til chi-kvadratet det samme resultat, når proportionerne i de sammenlignelige celler er ens.

G. Udny Yule har foreslået endnu en foreningskoefficient, der normalt betegnes som "Q" (mere kendt som Yule's Q), som måler foreningen i? x 2 bord. Foreningskoefficienten (Q) opnås ved at beregne forholdet mellem forskellen og summen af de tværgående produkter af de diagonale celler, hvis celler i 2 × 2-bordet er angivet som i den følgende tabel:

ac- cc / ad + be

hvor a, b, c og d henviser til cellefrekvenserne.

Foreningskoefficienten Q varierer mellem minus en og plus en (+1) som værende mindre end eller større end ad. Q opnår sine grænser på +1, når en af cellerne er nul, dvs. foreningen er komplet (korrelationen er perfekt). Q er nul, når variablerne er uafhængige (dvs. når der ikke er nogen tilknytning), dvs. når annonce. = være og. Q = 0.

Anvendelse af ovenstående formel er illustreret i følgende eksempel:

Lad os beregne Yules associeringsfaktor mellem civilstand og præstationer under eksamen på grundlag af de data, der fremgår af nedenstående tabel:

At erstatte de ovennævnte værdier i Yules formel:

Der er således en lille negativ sammenhæng mellem civilstand og præstationer i undersøgelsen.

Vi kan også se på problemet fra et andet synspunkt også.

Andelen af giftede elever, der fejler, er = 60 × 100/150 = 40.

Andelen ugifte studerende, der mislykkedes, er = 100 × 100/350 = 28, 57 (Ca.

Således mislykkedes 40 procent af de giftede elever og næsten 29 procent af de ugifte studerende i undersøgelsen. Derfor kan de dårlige resultater af eleverne tilskrives civilstand.

Årsagssammenhænge kan meget sikkert etableres i en eksperimentel situation. Vi har overvejet dette problem, når vi beskæftiger os med eksperimentelle designs. I samfundsvidenskab er det meget svært at oprette et forsøg, så de fleste af studierne er ikke eksperimentelle. Analytiske procedurer er dog udtænkt til at tegne afledninger om årsagssammenhæng i ikke-eksperimentelle undersøgelser.

I så høj grad som de fleste sociale undersøgelser indebærer en undersøgelse af de prøver, der er trukket fra "befolkningen" og forsøger at tegne generaliseringer til denne "befolkning", er det i videnskabens interesse nødvendigt at vide, i hvilket omfang generaliseringer således er trukket berettiget.

Antag at i en undersøgelse af prøver af mandlige og kvindelige studerende viser vores resultater signifikante forskelle mellem de to prøver i forhold til antallet af timer, de bruger til studier.

Vi kan spørge, om de forskelle, der observeres, afspejler de sande forskelle mellem de mandlige og kvindelige studerende, eller om de to 'populationer' af elever faktisk er ens i form af de timer, de bruger til studier, men de prøver, der er trukket fra disse 'populationer' for undersøgelsen kunne have adskilt sig i denne grad ved 'chance'.

En række statistiske procedurer er udformet til at sætte os i stand til at besvare et sådant spørgsmål med hensyn til sandsynlighedsopgørelserne.

Når vi sammenligner prøver eller studerer forskellen mellem eksperimentelle og kontrolgrupper, ønsker vi normalt at teste en hypotese om arten af den sande forskel mellem "populationerne", der skulle repræsenteres af de undersøgte prøver.

I samfundsvidenskab er vi normalt bekymret over relativt grov hypotese (for eksempel bruger de kvindelige studerende mere tid til deres studier end de mandlige studerende gør).

Vi er normalt ikke i stand til at overveje mere specifik eller præcis hypotese (f.eks. Som præcist angiver forskellen mellem de to "populationer"). Antag, vores data viser, at prøven af kvindelige studerende bruger i gennemsnit fire timer til studier, mens prøven af mandlige studerende, kun to timer.

Det er klart, at resultaterne af vores prøver stemmer overens med hypotesen, dvs. at kvindelige studerende bruger mere tid til deres studier end deres mandlige kolleger. Men vi må konstant huske på muligheden for, at resultaterne baseret på vores prøver måske ikke er nøjagtigt de samme som de resultater, vi kunne have opnået, havde vi studeret to "populationer" i toto.

Nu vil vi estimere, om vi stadig har observeret mere tid på studier blandt de kvindelige studerende, hvis vi havde studeret den samlede befolkning. Et sådant skøn er muligt, hvis vi tester 'null hypotesen'.

Nulhypotesen siger, at "populationerne" ikke adskiller sig i forhold til egenskaber under undersøgelse. I dette tilfælde vil en "nullhypotese" angive, at undergrupper af de kvindelige og mandlige elever i den større "befolkning" af elever som helhed ikke adskiller sig med hensyn til den tid, de bruger til deres studier.

Forskellige statistiske teknikker kaldet test af betydning er blevet udtænkt, som hjælper os med at estimere sandsynligheden for, at vores to prøver kunne have afvignet i det omfang de gør ved en tilfældighed, selv om der faktisk ikke er nogen forskel mellem de to tilsvarende "populationer" af mandlige og kvindelige studerende med hensyn til tid afsat til studier.

Blandt de forskellige metoder til afprøvning af betydning er beslutningen om hvilken metode der passer til en bestemt undersøgelse, afhængig af arten af de anvendte målinger og fordelingen af karakteristika (f.eks. Studietid, antal børn, lønforventninger mv. ).

De fleste af disse test af betydning antager, at målingerne udgør intervalleskala, og at fordelingen af karakteristikken nærmer sig en normal kurve. I social forskning svarer disse antagelser sjældent til virkeligheden. Den seneste statistiske udvikling er imidlertid kommet ud med en slags løsning på dette i form af ikke parametriske test, der ikke hviler på disse antagelser.

Vi bør forsøge at forstå på dette tidspunkt grunden til, at nulhypotesen skal testes, når vores aktuelle interesse er at teste en hypotese (alternativ hypotese, som det hedder), der siger, at der er forskel på de to "populationer" repræsenteret af prøverne.

Årsagen er let at forstå. Da vi ikke kender det sande billede i "befolkningen", er det bedste, vi kan gøre, at afgøre, om det er baseret på vores stikprøveundersøgelse.

Hvis vi sammenligner to prøver, er der selvfølgelig to muligheder:

(1) Enten er populationerne repræsenteret af prøven ens eller

(2) De er forskellige.

Vores prøver fra to "populationer" er forskellige med hensyn til nogle attributter; timer afsat til studier i vores eksempel. Det kan tydeligvis ske, hvis de to "populationer", som prøverne repræsenterer, faktisk adskiller sig i forhold til nævnte attribut.

Dette er imidlertid ikke et konkret bevis for, at disse "populationer" er forskellige, da der altid er mulighed for, at prøverne ikke svarer præcist til de "befolkninger", de påstår at repræsentere.

Vi må derfor give plads til muligheden for, at chancerne, der er involveret i udvælgelsen af en prøve, måske have givet os prøver, der adskiller sig fra hinanden, selv om de to "populationer", hvorfra de er trukket, ikke er forskellige.

Det spørgsmål, vi måske vil stille, er derfor:

"Kunne vi muligvis få prøver, der adskiller sig fra hinanden i det omfang de gør det, selvom de" befolkninger ", hvorfra de er trukket, ikke adskiller sig?" Dette er netop det spørgsmål, som en "nullhypotese" svarer på.

Nul hypotesen hjælper os med at estimere, hvad chancerne er for, at de to prøver, der er forskellige i denne grad, ville være blevet trukket fra to "populationer", der faktisk er ens: 5 i 100? 1 ud af 100? eller hvad som helst.

Hvis den statistiske test af betydning tyder på, at det er usandsynligt, at to prøver, der er forskellige i denne grad, kunne have været trukket fra "populationer", der faktisk er ens, kan vi konkludere, at de to "populationer" sandsynligvis adskiller sig fra hinanden.

Et pointe at huske her er, at alle statistiske tests af betydning og dermed alle generaliseringer fra prøverne til befolkningerne hviler på den antagelse, at prøverne ikke vælges på en sådan måde, at forstyrrelser kunne have gået ind i processen med at tegne prøverne.

Med andre ord antages det, at den stikprøve, vi har valgt, er tegnet på en sådan måde, at alle tilfælde eller genstande i "befolkningen" havde en lige eller specifik chance for at blive medtaget i prøven.

Hvis denne antagelse ikke er berettiget, bliver test af betydning betydningløs og uanvendelig. Med andre ord er testen af betydning kun gældende, når sandsynlighedsprincippet var blevet anvendt til udvælgelse af prøven.

For at vende tilbage til vores illustration, antage, at vores resultater viser ingen forskel mellem de to prøver: hvilket betyder, at både mandlige og kvindelige studerende i vores prøve er fundet at afsætte lige tid til deres studier.

Kan vi så sige, at de to "populationer" af mandlige og kvindelige studerende er ens i form af denne egenskab? Selvfølgelig kan vi ikke med sikkerhed sige det, da prøverne kan være ens, når befolkningen rent faktisk adskiller sig.

Men for at gå tilbage til sagen, hvor de to prøver adskiller sig, kan vi bekræfte, at de to populationer de repræsenterer sandsynligvis er forskellige, hvis vi kan afvise nulhypotesen; det vil sige, hvis vi kan vise, at forskellen mellem de to prøver sandsynligvis ikke vises, hvis de ovennævnte "populationer" ikke afviger.

Men igen er der en chance for at vi kan være forkerte ved at afvise nulhypotesen, da det er sandsynligt, at selv meget usandsynlige hændelser undertiden kan forekomme.

Der er også en anden side til det. Ligesom vi måske er forkerte ved at afvise "nulhypotesen", er det også sandsynligt, at vi måske tager fejl ved at acceptere "nulhypotesen". Det vil sige, at selv om vores statistiske test af betydning viser, at stikprøveforskelle let kan opstå ved en tilfældighed, selv om "populationerne" er ens, kan det alligevel være rigtigt, at »befolkningerne« faktisk er forskellige.

Med andre ord står vi altid over for risikoen for at gøre en af de to typer fejl:

(1) Vi kan afvise "null hypotesen", når det faktisk er sandt,

(2) Vi kan acceptere 'null hypotesen', når det faktisk er falsk.

Den første type fejl, vi kan kalde type I-fejlen. Dette indebærer, at de to "populationer" adskiller sig, når de faktisk er ens.

Den anden type fejl kan kaldes type II-fejlen. Dette indebærer, at de to 'populationer' er ens, når de faktisk er forskellige.

Risikoen for at gøre type I-fejlen bestemmes af det niveau, vi er villige til at acceptere i vores statistiske test, f.eks. 0, 05, 0, 01, 0, 001, etc. (det vil sige 5 ud af 100, 1 ud af 100 og 1 ud af 1000 Således, hvis vi f.eks. Bestemmer, at befolkningen virkelig adskiller sig, når en test af betydning viser, at forskellen mellem de to prøver forventes at forekomme tilfældigt ikke mere end 5 gange i 100.

Dette betyder, at hvis de to "populationer" repræsenteret af stikprøven faktisk var ens (i form af en bestemt egenskab), accepterer vi 5 chancer i 100, at vi vil være forkerte ved at afvise nulhypotesen. Vi kan naturligvis minimere risikoen for at gøre type I-fejl ved at gøre vores kriterium for at afvise nulhypotesen, strengere og strengere.

Vi kan f.eks. Bestemme niveauet af betydning ved 0, 01, dvs. vi ville afvise nulhypotesen, hvis testen viser, at forskellen i de to "prøver" måske kun har været tilfældet en gang i hundrede.

I det væsentlige er det, vi siger, at vi vil afvise nulhypotesen, hvis testen viser, at ud af hundrede prøver af en bestemt størrelse valgt fra de respektive "populationer" ved at anvende sandsynlighedsprincippet, vil kun en prøve vise forskel hvad angår attributterne i den udstrækning det ses i de to undersøgte prøver.

Kriteriet for at afvise "null hypotesen" kan gøres endnu strengere ved yderligere at hæve niveauet af betydning. Men problemet her er, at fejlene i type I og type II tilfældigvis er så relaterede til hinanden, at jo mere vi beskytter os mod at gøre en type I-fejl, jo mere sårbare er vi at lave en type II-fejl.

Efter at have fastslået omfanget af risikoen for type I-fejl, som vi er villige til at løbe, er den eneste måde at reducere muligheden for type II-fejl på at tage større prøver og anvende statistiske tests, der gør maksimal brug af tilgængelig relevant information.

Situationen i forhold til type II-fejlen kan illustreres på en meget præcis måde ved hjælp af en "åbnings karakteristisk kurve." Denne kurves opførsel afhænger af, hvor stor prøven er. Jo større stikprøven er, desto mindre sandsynlig er det, at vi vil acceptere en hypotese, der antyder en tilstand af ekstremt langt væk fra virkeligheden.

For så vidt forholdet mellem type I og type II fejl er omvendt, er det nødvendigt at finde en rimelig balance mellem de to typer risici.

I samfundsvidenskab er det næsten blevet en etableret praksis eller konvention at afvise nulhypotesen, når testen indikerer, at forskellen mellem prøverne ikke ville forekomme tilfældigt mere end 5 gange ud af 100. Men konventionerne er nyttige, når der er ingen anden rimelig vejledning.

Beslutningen om, hvordan balancen mellem de to slags fejl skal rammes, skal foretages af forskeren. I nogle tilfælde er det vigtigere at være sikker på at afvise en hypotese, når det er falsk end ikke at acceptere det, når det er sandt. I andre tilfælde kan omvendt være sandt.

For eksempel anses det i visse lande for vigtigere at afvise en hypotese om skyld, når det er falsk end at acceptere denne hypotese, når det er sandt, dvs. en person anses for at være skyldig, så længe der er en rimelig tvivl om hans skyld. I visse andre lande anses en person, der er anklaget for en forbrydelse, til at være skyldig indtil en sådan tid, da han har påvist sin mangel på skyld.

I meget forskning er der selvfølgelig ikke noget klart grundlag for at afgøre, om en type I eller type II-fejl ville være dyrere, og forskeren bruger det konventionelle niveau til at bestemme statistisk betydning. Men der kan være nogle undersøgelser, hvor en type fejl klart ville være dyrere og mere skadelig end den anden.

Antag, at i en organisation er det blevet foreslået, at en ny arbejdsdeling vil være mere effektiv og antage også, at denne metode ville kræve en masse omkostning.

Hvis et forsøg består af to grupper af personale - en opererer som eksperimentel gruppe og den anden som kontrolgruppe - er oprettet for at teste om den nye metode er virkelig gavnlig for de organisatoriske mål, og hvis det forventes, at den nye metode vil medføre mange udgifter ville organisationen ikke ønske at vedtage den, medmindre der var stor sikkerhed for sin overlegenhed.

Det vil med andre ord være dyrt at lave en type 1-fejl, dvs. konkludere, at den nye metode er bedre, når den ikke er så faktisk.

Hvis den nye metode medførte omkostninger, som var omtrent de samme som den gamle metode, ville type II-fejl være uønsket og mere skadelig, da det kan føre til, at ledelsens manglende overholdelse af den nye metode, når den faktisk er overlegen og som sådan har langdistancefordele i butikken for organisationen.

Enhver generalisering fra stikprøven til "befolkningen" er simpelthen en erklæring om statistisk sandsynlighed. Lad os sige, vi har besluttet at arbejde med et 0, 05 niveau af betydning. Det betyder, at vi kun afviser nulhypotesen, hvis prøveforskellen i den størrelsesorden, vi har observeret, kan forventes at forekomme tilfældigt ikke mere end 5 gange i 100.

Selvfølgelig vil vi acceptere "null hypotesen", hvis en sådan forskel kan forventes at forekomme tilfældigt mere end 5 gange ud af 100. Nu er spørgsmålet: Er vores fundet en af dem 5 gange, når en sådan forskel kan have dukket op ved en tilfældighed?

Dette spørgsmål kan ikke besvares endeligt på grundlag af en isoleret konklusion. Det kan dog være muligt for os at sige noget om dette, når vi undersøger mønstrene inden for vores resultater.

Antag, at vi er interesserede i at teste virkningerne af en film om holdninger til et bestemt statsligt program, siger familieplanlægning. Vi har, lad os sige, sørget for at holde de ønskede betingelser for forsøg på det maksimale.

Antag nu, at vi bruger som en måling af holdninger til programmet, kun ét emne, dvs. holdningen til afstandsbørn og find, at de, der så filmen, er mere positivt tilbøjelige til dette problem end dem, der ikke så filmen.

Antag nu, at den statistiske test viser, at forskellen ikke ville have været tilfældet på grund af tilfældige prøvetagningsudsving mere end en gang i tyve. Logisk betyder det også, at det måske har været tilfældigt en gang om tyve (eller 5 gange i 100). Som vi har påpeget, har vi ingen bestemt måde at vide, om vores prøve er en blandt de fem ud af 100. Nu, hvad bedst kan vi gøre?

Lad os sige, at vi har stillet 40 forskellige spørgsmål til respondenterne, som er rimelige indikatorer for holdningen til det offentlige velfærdsprogram. Hvis vi bruger et konfidensniveau på 5%, og hvis vi stillede 100 spørgsmål, kunne vi forvente at finde statistisk signifikante forskelle, der kan henføres til chancen for 5 af dem.

Således ud fra vores 40 spørgsmål om forskellige emner, kan vi forvente at finde statistisk signifikante forskelle på 2 af dem. Men antag at vi faktisk finder, at 25 ud af 40 spørgsmål om dem, der så filmen, havde mere favorable holdninger i forhold til dem, der ikke så filmen.

Vi kan i så fald føle sig meget sikrere ved at konkludere, at der er en sand forskel i holdninger (selv om den statistiske test viser, at forskellen måske er opstået ved en tilfældighed på hvert spørgsmål 5 gange i 100).

Lad os nu antage, at ud af de 40 spørgsmål viste svar på kun en, dvs. om afstanden mellem børnene, en statistisk signifikant forskel mellem de to grupper, der udsættes for film og de ikke). Denne forskel kan lige så godt være sket ved en tilfældighed.

På den anden side kan det være, at filmens indhold faktisk har påvirket meninger på dette punkt, men ikke på noget andet (såsom det, der vedrører sterilitetsoperationer). Men medmindre vores hypotese specifikt har forudsagt i forvejen, at filmen ville være mere tilbøjelige til at påvirke holdninger til afstand mellem børn end holdningerne til nogen af de andre 39 spørgsmål, er vi ikke berettiget til at gøre denne fortolkning.

En sådan fortolkning, dvs. en påberåbt sig til at forklare resultaterne efter overgangen, er kendt som 'post factual'-fortolkningen, fordi det indebærer forklaringer, der er givet for at retfærdiggøre resultaterne, uanset hvad de er. Det afhænger af forskerens opfindsomhed, hvilken forklaring han kan opfinde for at retfærdiggøre disse resultater. Han kan derfor retfærdiggøre selv de modsatte fund.

Merton har meget tydeligt påpeget, at post-factum fortolkningerne er designet til at "forklare" observationer. Metoden for post factum forklaring er fuldstændig fleksibel. Hvis forskeren konstaterer, at de ledige har tendens til at læse færre bøger end tidligere, kan dette "forklares" af hypotesen om, at angst som følge af ledighed påvirker koncentrationen, og så læsning bliver vanskelig.

Hvis det dog observeres, at de arbejdsløse læser flere bøger end tidligere (når de er i arbejde), kan der påberåbes en ny efter faktumforklaring; forklaringen er, at de ledige har mere fritid, og derfor læser de flere bøger.

Den kritiske test på 'et opnået forhold (blandt variabler) er ikke post-factum rationaler og forklaring på det; Det er snarere evnen til at forudsige det eller at forudsige andre relationer på basis af det. Således kan vores tidligere uforudsete konstatering af en forskel i holdninger til afstand af børn, selvom det er statistisk signifikant, ikke betragtes som fastlagt af den undersøgelse, vi har udført.

Siden statistiske udsagn er sandsynlighedsudsagn, kan vi aldrig helt stole på det statistiske bevis alene for at afgøre, hvorvidt vi vil acceptere en hypotese som sandt eller ej.

Tillid til fortolkningen af et forskningsresultat kræver ikke kun statistisk tillid til konklusionen af konklusionen (dvs. at forskellene sandsynligvis ikke har fundet sted ved en tilfældighed), men derudover nogle beviser for gyldigheden af forudsætninger for forskningen.

Dette bevis er nødvendigvis indirekte. Det kommer fra kongruensen af de givne forskningsresultater med anden viden, som har modstået tidstesten og dermed om hvilken der er stor sikkerhed.

Selv i den strengest kontrollerede undersøgelse kræver etableringen af tillid til fortolkningen af ens resultater eller i pålæggelsen af årsagssammenhænge replikation af forskning og relateringen af resultaterne til andre undersøgelser.

Det er nødvendigt at bemærke, at selv når statistiske tests og resultaterne af en række studier tyder på, at der faktisk er en konsistent forskel mellem to grupper eller sammenhængende forhold mellem to variabler, udgør dette stadig ikke bevis for årsagen til forholdet.

Hvis vi ønsker at tegne årsagssammenhænge (f.eks. X producerer Y), skal vi opfylde forudsætninger udover dem der kræves for at etablere eksistensen af et forhold. Det er også værd at bemærke, at et resultat ikke er socialt eller psykologisk signifikant, bare fordi det er statistisk signifikant. Mange statistisk signifikante forskelle kan være trivielle i praktisk social parlance.

For eksempel kan en gennemsnitlig forskel på mindre end et IQ-punkt mellem by- og landbefolkningen være statistisk signifikant, men ikke så i det praktiske daglige liv. Til gengæld er der tilfælde, hvor en lille, men pålidelig forskel har stor praktisk betydning.

I en storskalaundersøgelse kan f.eks. En forskel på en halv eller en procent repræsentere hundredtusindvis af mennesker, og bevidstheden om forskellen kan være vigtig for vigtige politiske beslutninger. Derfor skal forskeren udover at være bekymret for den statistiske betydning af sine resultater også være bekymret for deres sociale og psykologiske betydning.

Inferring årsagssammenhæng:

På grund af åbenlyse vanskeligheder kan sådanne stive eksperimentelle design sjældent udarbejdes i samfundsvidenskabelige undersøgelser. De fleste af undersøgelserne i samfundsvidenskab er ikke-eksperimentelle.

I sådanne undersøgelser er der visse empiriske hindringer i vejen for at afgøre, hvorvidt et forhold mellem variabler er kausal. Det er gentagne gange blevet nævnt, at en af de sværeste opgaver i analysen af data om social adfærd er etableringen af årsag og virkning forhold.

En problematisk situation skyldes dets oprindelse og processen med at blive, ikke kun til en faktor, men til et kompleks af forskellige faktorer og sekvenser.

Processen med at løsne disse elementer udgør en stor udfordring for den sociologiske fantasi og sætter for at teste forskernes færdigheder. Det er farligt at følge en 'one-track' forklaring, der fører til årsagen. Det er absolut nødvendigt at kigge efter et helt batteri af årsagssammenhænge, som generelt spiller en væsentlig rolle for at skabe komplekse sociale situationer.

Som Karl Pearson påpeger, "intet fænomen eller stadium i rækkefølge har kun én årsag; alle antecedent stadier er successive årsager; når vi videnskabelige stater forårsager, beskriver vi virkelig de successive faser af en rutine af erfaring. "

Yule og Kendall har erkendt det faktum, at statistikker "må acceptere for analyse, data, der er underlagt indflydelse fra en lang række årsager og skal forsøge at opdage fra de data, selv hvilke årsager er de vigtige, og hvor meget af den observerede virkning skyldes driften af hver. "

Paul Lazarsfeld har sporet de faser, der er involveret i den teknik, han kalder "kræsne". Han taler for sin anvendelse til at bestemme årsagssammenhæng mellem variabler. Lazarsfeld fastsætter denne procedure:

(a) Bekræftelse af en påstået begivenhed som:

For at bekræfte denne begivenhed er det nødvendigt at fastslå, om personen faktisk har oplevet de påståede situationer. Hvis ja, hvordan manifesterer forekomsten sig selv og under hvilke betingelser i hans umiddelbare liv?

Hvilke årsager er der for at tro på, at der er en specifik sammenkobling mellem to variabler, fx tab af beskæftigelse og tab af myndighed? Hvor korrekt er personens begrundelse i dette særlige tilfælde?

(b) Forsøger at opdage, om den påståede betingelse er i overensstemmelse med objektive kendsgerninger i denne persons tidligere liv.

(d) Afklare de forklaringer, der ikke er i overensstemmelse med mønsteret af begivenheder.

Det er helt forståeligt, at de fleste vanskeligheder eller forhindringer for at etablere årsagssammenhæng rammer stærkeste ikke-eksperimentelle undersøgelser. I ikke-eksperimentelle undersøgelser, hvor der er interesse i at etablere årsagssammenhæng mellem to variabler, skal investigatøren finde erstatninger til sikkerhedsforanstaltninger, der er indbygget i de eksperimentelle undersøgelser.

Mange af disse sikkerhedsforanstaltninger indgår på tidspunktet for planlægningen af dataindsamling i form af tilvejebringelse af indsamling af oplysninger om en række variabler, som måske ville være de alternative betingelser for at producere den hypoteseffekt.

Ved at indføre sådanne yderligere variabler i analysen nærmer forskeren nogle af de kontroller, der er forbundet med forsøg. Ikke desto mindre forbliver tegningen af årsagssammenhænge fortsat noget farlig i ikke-eksperimentelle undersøgelser.

Vi skal nu diskutere nogle af problemerne og strategierne til at overvinde dem, der vedrører tegninger af årsagssammenhæng i ikke-eksperimentelle undersøgelser. Hvis en ikke-eksperimentel undersøgelse peger på et forhold eller en sammenhæng mellem to variabler, siger X og Y, og hvis forskningsinteressen er i årsagssammenhænge snarere end i den simple sammenhæng mellem variabler, har analysen kun taget sit første skridt.

Forskeren skal yderligere overveje (udover sammenhæng mellem X og Y), hvorvidt Y (effekt) måske har fundet sted før X (den hypotetiske årsag), i hvilket tilfælde Y ikke kan være effekten af X.

Ud over denne overvejelse skal forskeren overveje spørgsmålet om, hvorvidt andre faktorer end X (den hypotese årsag) kan have produceret Y (den hypoteseeffekt). Dette er generelt taget sig af ved at indføre yderligere variabler i analysen og undersøge, hvordan forholdet mellem X og Y påvirkes af disse yderligere variabler.

Hvis forholdet mellem X og Y vedvarer, selvom andre formodede effektive og muligvis alternative variabler introduceres, forbliver hypotesen om, at X er årsagen til Y, holdbar.

For eksempel, hvis forholdet mellem at spise en bestemt sæsonbestemt frugt (X) og kold (Y) ikke ændrer sig selv, når andre variabler som alder, temperatur, fordøjelsestilstand mv indføres i analysen, kan vi acceptere hypotese at X fører til Y som holdbar.

Men det er ikke muligt i et lille antal tilfælde at indførelsen af andre supplerende variabler kan ændre forholdet mellem X og Y. Det kan reducere for helt at eliminere forholdet mellem X og Y, eller det kan forbedre forholdet i en gruppe og reducere det i en anden.

Hvis forholdet mellem X (spisning af sæsonbestemt frugt) og Y (kold) forbedres i en undergruppe, der er karakteriseret ved Z (dårlig fordøjelsesgrad) og reduceret i undergruppe, der ikke er karakteriseret ved Z (normal fordøjelsestilstand) kan konkludere, at Z er den betingede betingelse for forholdet mellem X og Y.

Det betyder med andre ord, at vi har været i stand til at angive betingelse (Z), under hvilken forholdet mellem X og Y holder. Nu, hvis introduktion af Z i analysen reducerer eller eliminerer helt forholdet mellem X og Y, vil vi være sikre på at konkludere enten, at X ikke er en Y-producent, det vil sige, at forholdet mellem X og Y er "falskt" eller det Vi har sporet processen, hvorved X fører til Y (dvs. gennem Z).

Lad os vende os til at overveje den situation, hvor vi med rette kan konkludere, at forholdet mellem X og Y er falsk.

Et tilsyneladende forhold mellem to variabler X og Y siges at være falsk, hvis deres samtidige variation ikke stammer fra en forbindelse mellem dem, men fra det faktum, at hver af dem (X og Y) er relateret til en tredje variabel (Z) eller en kombination af variabler, der ikke tjener som et link i processen, hvorved X fører til Y.

Situationen, der karakteriserer falsk forhold, kan skitseres som under:

Formålet her er at bestemme årsagen til Y, den afhængige variabel (lad os sige, den monetære forventning af universitetsstuderende). Forholdet (brudte linje) mellem X er den uafhængige variabel (lad os sige de karakterer, der er opnået af eleverne) og den monetære forventning af kandidater (Y) blevet observeret i løbet af analysen af data.

En anden variabel (Z) introduceres for at se, hvordan forholdet mellem X og Y opfører sig med indgangen af denne tredje faktor. Z er den tredje faktor (lad os sige indkomstniveauet for eleverne til eleverne). Vi finder, at indførelsen af denne faktor reducerer forholdet mellem X og Y.

Det er derfor konstateret, at forholdet mellem højere karakter i undersøgelsen og højere pengeprævationer ikke holder op, men reduceres betydeligt, når vi introducerer den tredje variabel, dvs. niveauet for forældrenes indkomst.

En sådan introduktion af Z bringer lyset på, at ikke X men Z sandsynligvis kan være en afgørende faktor for Y. Så forholdet mellem X og Y (vist i diagrammet med en prikket linje) er en falsk, mens forholdet mellem Z og Y er en rigtig. Lad os illustrere dette ved hjælp af hypotetiske data.

Antag, at der i forbindelse med analysen af data i en undersøgelse blev set, at der er en signifikant sammenhæng mellem de karakterer eller afdelinger (I, II, III), som studerende sikrede i eksamen og den løn, de forventer for et job, der de kan blive udnævnt til.

Det blev for eksempel set, at de første divisioner blandt eleverne generelt forventede en højere vederlag i forhold til de andre divisioner, og de andre divisioner forventede mere i forhold til de tredje divisioner.

Den følgende tabel illustrerer den hypotetiske situation:

Det fremgår tydeligt af bordet, at der er grundlag for at hypotesere, at eleverne bestemmer deres forventninger til lønninger. Lad os nu antage, at forskeren på en eller anden måde rammer idéen om, at forældrenes indkomstniveau (X) kan være en af de vigtige variabler, der bestemmer eller påvirker elevernes forventninger til lønninger (Y). Således introduceres Z i analysen.

Antag, at følgende tabel repræsenterer forholdet mellem variablerne:

Bemærk:

HML i den vandrette række, der deler hver kategori af elevernes karakterer, står henholdsvis for højt forældreindkomstniveau, moderat forældreindkomstniveau og lavt forældreindkomstniveau. Ovennævnte tabel viser tydeligt, at forholdet mellem X og Y er blevet mindre signifikant sammenlignet med forholdet mellem Z og Y. '

To get a clearer picture, let us see the following table (a version of Table B omitting the categories of X) showing the relationship between Z and, ie, parental income level and students' monetary expectations:

We can very clearly see from the table that, irrespective of their grades, the students' monetary expectations are very strongly affected by the parental levels of income (Z).

We see that an overwhelming number of students (ie, 91.5%) having high monetary expectations are from the high parental income group, 92% having moderate monetary expectations are from moderate parental income group and lastly, 97% having low monetary expectations are from the low parental income group.

Comparing this picture with the picture represented by Table A, we may say that the relation between X and Y is spurious, that is, the grade of the students did not primarily determine the level of the monetary expectations of the students.

It is noted in Table A that students getting a higher grade show a significant tendency toward higher monetary expectations whereas the lower grade students have a very marked concentration in the lower monetary expectation bracket.

But when we introduce the third variable of parental income, the emerging picture becomes clear enough to warrant the conclusion that the real factor responsible differential levels of monetary expectations is the level of parental income.

I tabel C ser vi en meget stærk og formidabel koncentration af sager af studerende svarende til de tre ovennævnte kombinationer, nemlig højere monetære forventninger og højere forældreindkomst, moderate pengeforventninger og moderat forældreindkomst og lavere pengeprævner og lavere forældreindkomst, dvs. henholdsvis 5%, 92, 1% og 1%.

Sporing af processen involveret og et forhold mellem variabler: Som tidligere nævnt, kan en tredje faktor Z reducere eller eliminere forholdet mellem den uafhængige variabel X og den afhængige variabel Y, at enten forholdet mellem X og Y er falsk, eller at vi har kunnet spore processen, hvorved X fører til Y.

Vi skal nu overveje de omstændigheder, der ville berettige konklusionen om, at processen med forholdet mellem X og Y er blevet sporet gennem en tredje faktor Z.

Antag i en undersøgelse, at efterforskerne fandt ud af, at mindre lokalsamfund havde en højere gennemsnitlig intimitetsscore, hvor intimitetsscore var et mål for intimiteten af tilknytning mellem medlemmer af et samfund ankom ved hjælp af en intimitetsskala.

Antag, at de også fandt ud af, at de mellemstore samfund havde en mindre intimitetsscore i forhold til de små samfund og store samfund havde den mindst gennemsnitlige intimitetsscore. Et sådant fund tyder på, at samfundets størrelse bestemmer foreningenes nærhed blandt medlemmer af samfundet.

Med andre ord bekræfter observationerne konklusionen om, at de medlemmer, der bor i et mindre samfund, har større tilknytning til foreningen, mens de store samfund er præget af en mindre associeringsinteresse blandt medlemmerne.

Nedenstående tabel viser de hypotetiske data:

I den anden kolonne i tabellen er der vist prøver svarende til hvert af lokalsamfundene.

I den anden kolonne i tabellen er der vist prøver svarende til hvert af lokalsamfundene. I kolonne 3 er de gennemsnitlige intimitetsresultater svarende til de typer samfund, der er beregnet på grundlag af svarene til bestemte emner på en skala vedrørende de daglige sammenslutninger blandt medlemmer, vist.

Det ses fra bordet, at de gennemsnitlige intimitetsscorer varierer omvendt med størrelsen af fællesskabet, dvs. mindre størrelse, jo større intimitetsscore og omvendt, større størrelse, jo lavere er intimitetsscoren.

Nu antager, at efterforskerne fik ideen om, at de tre typer af samfund ville være forskellige med hensyn til muligheder de tilbyder for interaktion mellem medlemmer, så meget som de levende arrangementer, boligmønstret, almindeligt fælles forsyningsselskaber mv., Ville fremme en sådan forening.

Undersøgerne vil således introducere den tredje faktor i analysen af interaktionspotentialet, dvs. i hvilket omfang de omstændigheder, som personer bor i, sandsynligvis vil give mulighed for interaktion indbyrdes.

For at kontrollere hypotesen om, at det hovedsageligt skyldtes forskelle i boligmønster, leveordninger, almindeligt fælles faciliteter mv., At de tre typer af samfund skabte forskelle i samspillet mellem medlemmer af et samfund, ville efterforskerne overveje størrelsen af fællesskab og interaktion-potentiale i fællesskab i forhold til den gennemsnitlige intimitetsscore.

Infraktionspotentialet er således den tredje variable Z introduceret i analysen. Interaktionspotentialet er klassificeret, lad os sige, at vi har et interaktivt potentiale (b) mellem interaktionspotentiale og (c) højt interaktionspotentiale.

Den følgende tabel repræsenterer de hypotetiske data:

Når vi læser tværs over rækkerne i tabellen, ser vi, at interaktionspotentialet er stærkt relateret til medlemskabets intimitetsscore, uanset størrelsen af fællesskabet.

Det er, om vi betragter rækken for små grupper, for de mellemstore samfund eller for de store samfund, er der i hvert tilfælde en stigning i den gennemsnitlige intimitetsscore med en stigning i interaktionspotentialet. Desuden bliver det klart, at størrelsen af fællesskabet og interaktionspotentialet har en signifikant sammenhæng i læsning af posterne på tværs af rækkerne.

For eksempel lever ca. to tredjedele af respondenterne i et mindre samfund under betingelser med høj interaktionspotentiale; vi finder også, at en meget mindre andel af de moderate samfundsbeboere lever under høj interaktionspotentielle forhold og en meget lille andel af de store befolkningsboere under høj interaktionspotentiale.

Nu læser vi intimitetsscore kun i kolonnerne for at finde ud af, at forholdet mellem typen af samfund og foreningens intimitet er blevet reduceret betydeligt. Faktisk for mennesker, der lever under potentielle forhold med høj interaktion, opnås der ikke noget konkret forhold mellem samfundets størrelse og intimitetsscoren.

Fra dette sæt forhold kan forskerne konkludere, at det omvendte forhold mellem samfundets størrelse og intimitetsscoren holder godt, men at en af de vigtigste måder, hvorpå en bestemt type samfund fremmer intimitet blandt sine medlemmer, er ved at tilbyde muligheder, der øger samspillet mellem dem.

Med andre ord er de små samfund præget af en højere gennemsnitlig intimitetsscore, fordi deres lille størrelse giver en ramme for mange muligheder for høj grad af interaktion blandt medlemmer. Storstormede samfund er derimod præget af en forholdsvis lavere intimitetsscore.

Men den lavere intimitetsscore kan ikke tilskrives samfundets størrelse i sig selv, men til det faktum, at et stort samfund ikke kan tilbyde muligheder for højere interaktion blandt medlemmer, som de små samfund gør.

Derfor undersøger forskerne snarere end at konkludere, at forholdet mellem samfundets størrelse og den gennemsnitlige intimitetsscore blandt medlemmer er ufuldstændige, måske konkludere, at de har været i stand til at spore processen, hvorved X (dvs. typen af samfund) påvirker Y (intimitetsscoren).

Den førstnævnte berettigede konklusionen om, at forholdet mellem variablerne X og Y var falsk, og sidstnævnte konkluderede, at processen fra X til Y kan spores gennem Z (X til Z til Y). I begge tilfælde reducerede eller fjernede indførelsen af en tredje variabel Z forholdet mellem dem (X og Y).

En forskel kan dog noteres. I det første eksempel var variablen Z (dvs. forældrenes indkomstniveau) klart tidligere i tid til de to andre variabler (studerende i eksamen og studerende forventede pengepræmier).

I det andet eksempel forekom den tredje variabel Z (interaktionspotentiale fra samfundene) ikke før den antagne årsagsvariabel (samfundets størrelse). Det var samtidig med det og kunne tænkes at starte efter det.

Tidssekvensen af variablerne er således en vigtig overvejelse ved at afgøre, om et tilsyneladende årsagsforhold er falsk. Det vil sige, at hvis den tredje variabel Z, som fjerner eller eliminerer forholdet mellem de oprindeligt relaterede variabler X og Y, konkluderer vi normalt, at det tilsyneladende årsagsforhold mellem variabler X og Y er falsk.

Men hvis den tredje variable Z er kendt eller antages at have fundet sted på samme tidspunkter som X eller efter X, kan det være for at konkludere, at den proces, hvorved X fører til Y, er blevet sporet. For at have en vis måling af tillid til årsagsforhold udledt af undersøgelser, der ikke er eksperimentelle, er det nødvendigt at underkaste dem den kritiske test for at eliminere de andre eventuelt relevante variabler.

Af denne grund er det vigtigt at indsamle data om sådanne muligvis indflydelsesrige variabler ud over dem, som hypotesen af undersøgelsen er centralt berørt af.

Det blev tidligere angivet, at indførelsen af en tredje variabel i analysen kan medføre en intensivering af forholdet inden for en undergruppe og at reducere det samme i en anden undergruppe. Hvis det er tilfældet, siger vi, at vi har angivet en betingelse (Z), som forholdet mellem X og Y indeholder.

Lad os nu illustrere processen med specifikation. Antag, at vi i en fællesskabsstudie er ved at identificere et forhold mellem indkomst og uddannelsesniveau.

Dette er vist i tabellen nedenfor:

Vi ser i tabellen, at forholdet mellem uddannelse og indkomst er ret markant. Højere uddannelse er generelt højere procentdelen af sager, der tjener en årlig indkomst på Rs.5.000 / - og derover. Vi kan dog beslutte, at forholdet kræver yderligere specifikation.

Det vil sige, vi ønsker måske at vide mere om betingelserne for, at dette forhold opnås. Antag, at tanken rammer os om, at faktumet af de respondenter, der bor i by-industrielle samfund, kan påvirke fordelene ved uddannelse til lønlig beskæftigelse positivt og dermed dens refleksion i indkomst.

På denne forudsætning introducerer vi den tredje faktor Z, dvs. de respondenter, der bor i byindustrien og dem, der bor i det landlige ikke-industrielle samfund, ind i analysen og ser hvordan det påvirker det indledende forhold mellem X og Y ( dvs. uddannelse og indkomst).

Antag at vi får et billede som vist i følgende tabel:

Vi kan tydeligt se, at Tabel B afspejler et meget anderledes forhold mellem indkomst og uddannelse for de mennesker, der bor i det landdistrikterne-industrielle samfund, sammenlignet med dem, der bor i byindustrien. Vi ser at for dem, der bor i industribyerne, er forholdet mellem uddannelse og indkomst noget højere end det oprindelige forhold.

Men for dem, der bor i landdistrikterne ikke industrielle samfund, er forholdet i ovenstående tabel betydeligt lavere end det oprindelige forhold.

Indførelsen af den tredje faktor og nedbrydning af det oprindelige forhold på grundlag af den tredje faktor (Z) har således bidraget til at specificere en tilstand, hvor forholdet mellem X og Y er mere udtalt, ligesom betingelsen om relationen er mindre udtalt.

På samme måde antager vi i løbet af en undersøgelse, at personer, der tilhører den højere indkomstkategori, generelt har mindre antal børn sammenlignet med dem i den lavere indkomstkategori. Antag, at vi føler (på grundlag af en teoretisk orientering), at byboens faktor kan være vigtig for at påvirke forholdet.

Hvis vi indfører denne faktor, antager vi, at det oprindelige forhold mellem indkomstniveau og antal børn bliver mere udtalt i byen, og at det bliver mindre udtalt blandt landbefolkningen, end vi har identificeret en betingelse Z (dvs. byboliger ), hvor forholdet bliver afgørende forstærket eller udtalt.

Fortolkning af resultaterne af en undersøgelse:

Hidtil har vi hovedsagelig beskæftiget os med de procedurer, der sammen består af, hvad vi kalder sædvanligvis analysen af data. Forskerens opgave er imidlertid ufuldstændig, hvis han stopper ved at præsentere sine resultater i form af empiriske generaliseringer, som han er i stand til at komme frem til gennem analyse af data.

En forsker, der for eksempel afslår sin forskningsøvelse ved blot at sige, at "de ugifte mennesker har en højere forekomst af selvmord i forhold til det gifte folk", opfylder næppe sin overordnede forpligtelse for videnskaben, selvom den empiriske generalisering han har fremført har en vis værdi af sig selv.

Forskeren i videnskabens større interesse skal også forsøge at vise, at hans observation peger på visse underliggende relationer og processer, der oprindeligt er skjult for øjet. Forskeren må med andre ord vise, at hans observation har en betydning, meget bredere og dybere end den, som den synes at have på overfladeniveau.

For at vende tilbage til vores eksempel på selvmord skal forskeren kunne vise, at hans observation om, at "de ugifte mennesker er præget af selvmord", afspejler i virkeligheden det dybere forhold mellem social samhørighed og selvmordsrate (Durkheims teori).

Når forskeren er i stand til at afsløre de relationer og processer, der ligger til grund for hans konkrete resultater, kan han etablere abstrakte forhold mellem hans resultater og forskellige andre.

I det væsentlige går forskerens arbejde langt ud over indsamling og analyse af data. Hans opgave strækker sig til at fortolke resultaterne af hans undersøgelse. Det er gennem fortolkning, at forskeren kan forstå den virkelige betydning af hans resultater, det vil sige han kan sætte pris på, hvorfor resultaterne er hvad de er.

Som tidligere nævnt er fortolkningen søgen efter bredere og mere abstrakte betydninger af forskningsresultaterne. Denne søgning indebærer at se forskningsresultaterne i lyset af anden etableret viden, en teori eller et princip. Denne søgning har to hovedaspekter.

Det første aspekt indebærer indsatsen for at etablere kontinuitet i forskning ved at sammenkæde resultaterne af en given undersøgelse med en anden. Det er gennem fortolkning, at forskeren kan løse eller forstå det abstrakte princip under de konkrete empiriske observationer.

Denne abstrakte fællesnævner er blevet skelnet, og forskeren kan nemt fortsætte med at forbinde sine resultater med andre undersøgelser udført i forskellige indstillinger, forskelligartede i detaljerede detaljer, men afspejler det samme abstrakte princip på niveauet af resultater.

Det er overflødigt at sige, at forskeren på grundlag af anerkendelsen af det abstrakte teoretiske princip, der ligger til grund for hans konklusion, kan lave forskellige forudsigelser om den konkrete verden af begivenheder, der ikke er relateret til tilsyneladende hans områdes område. Således kan friske henvendelser udløses for at teste forudsigelser og forståeligt nok, ville sådanne undersøgelser have et forhold til forskerens indledende undersøgelse.

I en noget anden forstand er fortolkning nødvendigvis involveret i overgangen fra forsøgsforsøg til forsøgsforskning. Fortolkningen af resultaterne fra den tidligere forskningskategori fører ofte til hypoteser for sidstnævnte.

Siden en udforskende undersøgelse ikke har en hypotese at starte med, må resultaterne eller konklusionerne af en sådan undersøgelse fortolkes på en "post factum" fortolkning er ofte et farligt spil med farlige konsekvenser. En sådan fortolkning indebærer en søgning efter en gudfar i form af en teori eller et princip, der ville vedtage (dvs. forklare) undersøgelsens resultater.

Denne søgen viser sig ofte at være en øvelse fra forskerens side for at retfærdiggøre sine resultater ved at finde nogle egnede teorier, der passer til hans resultater. Som følge heraf kan ret så ofte modstridende konklusioner finde deres "gudfædre" i forskellige teorier.

Dette aspekt af post-factum fortolkning, der omfatter forsøg på at rationalisere forskningsresultaterne, bør klart tages i betragtning, når man fortsætter med det. Ved lejligheder er der dog ikke noget andet alternativ til det.

For det andet fører tolkning til etablering af forklarende begreber. Som det er blevet påpeget, omfatter fortolkning af resultater bestræbelser på at forklare, hvorfor observationerne eller resultaterne er, hvad de er. I udførelsen af denne opgave antager teorien central betydning.

Det er en sensibiliserende og en vejledning til de underliggende faktorer og processer (forklarende baser) under resultaterne. Under forskernes observationer i løbet af en undersøgelse ligger et sæt faktorer og processer, der kan forklare hans observationer af den empiriske verden. Teoretisk fortolkning afdækker disse faktorer.

Forskerens opgave er at forklare de forhold, han har observeret i løbet af sin undersøgelse, ved at afsløre de underliggende processer, der giver ham en dybere forståelse for disse relationer og pege på rollen af visse grundlæggende faktorer, der virker i problemområdet i hans studie.

Således tjener fortolkning et dobbelt formål. For det første giver den en forståelse af de generelle faktorer, der synes at forklare, hvad der er blevet observeret i løbet af en undersøgelse, og for det andet giver den en teoretisk opfattelse, der kan tjene som en vejledning til videre forskning.

Det er på denne måde, at videnskaben kumulativt frigør de vellykkede basale processer, som forme den del af den empiriske verden, som en forsker er bekymret for.

Fortolkning er så uløseligt sammenflettet med analysen, at den mere korrekt bør opfattes som et særligt aspekt af analyse frem for en separat eller særskilt operation. Til sidst er vi fristet til at citere prof. C. Wright Mills, der har fremhævet selve essensen af, hvad der er involveret i analysen (involvering af fortolkning) af data.

Says Mills, "Så du vil opdage og beskrive, oprette typer til bestilling af det, du har fundet ud af, fokusere og organisere oplevelse ved at skelne emner efter navn. Denne søgning efter ordre vil få dig til at søge mønstre og tendenser og finde relationer, der kan være typiske og kausal. Du vil kort søge efter meningen med det, du er kommet over, eller hvad der kan fortolkes som et synligt tegn på noget, der synes at være involveret i det, du forsøger at forstå; du vil parre det ned til det væsentlige; så omhyggeligt og systematisk vil du relatere disse til hinanden for at danne en slags arbejdsmodel .... "

"Men altid blandt alle detaljer, vil du søge efter indikatorer, der kan pege på hoveddriften, til de underliggende former og tendenser i samfundets rækkevidde i sin særlige tidsperiode." Når et forskningsarbejde er afsluttet, er udsagnet der rejser en række nye spørgsmål og problemer kan gøres.

Nogle af de nye spørgsmål udgør grundlaget for nye forskningsvirksomheder og formulering af nye teorier, som enten vil ændre eller erstatte gamle. Dette er faktisk hvad forskningen betyder. Det tjener til at åbne nye og bredere veje af intellektuelt eventyr og simulere søgen efter mere viden samt større visdom i dets brug.