Chi-Square Test: Betydning, applikationer og anvendelser

Efter at have læst denne artikel vil du lære om: - 1. Betydning af Chi-Square Test 2. Niveauer af Betydning af Chi-Square Test 3. Chi-Square Test under Null-hypotesen 4. Vilkår for Gyldigheden 5. Additive Property 6. Applikationer 7. Anvendelser.

Betydning af Chi-Square-test:

Chi-square-testen (χ 2 ) repræsenterer en nyttig metode til at sammenligne eksperimentelt opnåede resultater med de, der forventes teoretisk på en vis hypotese.

Således er Chi-square et mål for den faktiske divergens af de observerede og forventede frekvenser. Det er meget indlysende, at betydningen af ​​en sådan foranstaltning ville være meget stor i stikprøveundersøgelser, hvor vi altid må studere divergensen mellem teori og fakta.

Chi-square som vi har set er et mål for divergens mellem de forventede og observerede frekvenser og som sådan, hvis der ikke er nogen forskel mellem forventede og observerede frekvenser, er værdien af ​​Chi-square 0.

Hvis der er en forskel mellem de observerede og de forventede frekvenser, vil værdien af ​​Chi-square være mere end 0. Det vil sige, jo større Chi-firkant er jo større sandsynligheden for en reel divergens af eksperimentelt observeret fra forventede resultater.

Hvis den beregnede værdi af chi-square er meget lille sammenlignet med dens tabelværdi, indikerer det, at divergensen mellem faktiske og forventede frekvenser er meget lille og følgelig er passformen god. Hvis på den anden side den beregnede værdi af chi-square er meget stor sammenlignet med dens tabelværdi, indikerer det, at divergensen mellem forventede og observerede frekvenser er meget stor, og derfor er passformen dårlig.

For at evaluere Chi-kvadratet indtaster vi tabel E med den beregnede værdi af kvadratet og det relevante antal frihedsgrader. Antallet af df = (r - 1) (c - 1), hvor r er antallet af rækker og c antallet af kolonner, hvori dataene er tabuleret.

I 2 x 2 er bordets frihedsgrader (2 - 1) (2 - 1) eller 1. Ligeledes i 3 x 3 bord er frihedsgrader (3 - 1) (3 - 1) eller 4 og i 3 x 4 bord grader af frihed er (3 - 1) (4 - 1) eller 6.

Niveauer af betydning for Chi-Square-test:

De beregnede værdier af x2 (Chi-kvadrat) sammenlignes med tabelværdierne for at konkludere, om forskellen mellem forventede og observerede frekvenser skyldes prøvetagningsfluktuationerne og som sådan signifikant, eller om forskellen skyldes en anden grund og som så signifikant. Divergensen mellem teori og fakta bliver altid testet med hensyn til visse sandsynligheder.

Sandsynlighederne angiver omfanget af afhængighed, som vi kan lægge på den konklusion, der er trukket. Tabellværdierne for χ 2 er tilgængelige på forskellige sandsynlighedsniveauer. Disse niveauer kaldes niveauer af betydning. Normalt ses værdien af ​​χ 2 på .05 og .01 niveauet af betydning for de givne frihedsgrader fra tabellerne.

Hvis den beregnede værdi af x2 er større end den tabulerede værdi, siges det at være signifikant. Med andre ord kan uoverensstemmelsen mellem de observerede og forventede frekvenser ikke tilskrives chancen, og vi afviser nulhypotesen.

Således konkluderer vi, at eksperimentet ikke understøtter teorien. På den anden side, hvis den beregnede værdi af x2 er mindre end den tilsvarende tabulerede værdi, så siges det at være ikke signifikant på det krævede niveau.

Dette indebærer, at uoverensstemmelsen mellem observerede værdier (eksperiment) og de forventede værdier (teori) kan tilskrives chancen, dvs. udsving i prøveudtagningen.

Chi-Square-test under Null-hypotesen:

Antag, at vi får et sæt observerede frekvenser opnået under nogle eksperimenter, og vi vil teste, om de eksperimentelle resultater understøtter en bestemt hypotese eller teori. Karl Pearson i 1990 udviklede en test for at teste betydningen af ​​uoverensstemmelsen mellem eksperimentelle værdier og de teoretiske værdier opnået under en teori eller hypotese.

Denne test er kendt som χ 2- test og bruges til at teste, om afvigelsen mellem observation (eksperiment) og teori kan tilskrives chancen (svingninger i stikprøveudtagningen) eller hvis det egentlig skyldes teoriens manglende evne til at passe det observerede data.

Under Null-hypotesen hedder det, at der ikke er nogen signifikant forskel mellem de observerede (eksperimentelle) og de teoretiske eller hypotetiske værdier, dvs. der er en god kompatibilitet mellem teori og eksperiment.

Ligningen for chi-kvadrat (χ 2 ) er angivet som følger:

hvor f o = hyppighed af forekomst af observerede eller eksperimentelt bestemte fakta

f e = forventet hyppighed af forekomst på en eller anden hypotese.

Chi-kvadrat er således summen af ​​de værdier, der opnås ved at dividere kvadratet af forskellen mellem observerede og forventede frekvenser med de forventede frekvenser i hvert tilfælde. Med andre ord er forskellene mellem observerede og forventede frekvenser kvadreret og divideret med det forventede tal i hvert tilfælde, og summen af ​​disse kvotienter er χ 2 .

Flere illustrationer af chi-square testen vil afklare ovennævnte diskussion. Forskellene af f o og f e er altid skrevet + ve.

1. Test af divergensen af ​​observerede resultater fra de forventede på hypotesen om lige sandsynlighed (null hypotese):

Eksempel 1:

96 personer bliver bedt om at udtrykke deres holdning til forslaget "Skal aidsundervisning integreres i læseplanen på videregående trin" ved at markere F (gunstigt), I (ligeglad) eller U (ugunstig).

Det blev observeret, at 48 markerede 'F', 24 'I' og 24 'U':

(i) Test, om de observerede resultater afviger væsentligt fra de resultater, der forventes, hvis der ikke er nogen præferencer i gruppen.

(ii) Test hypotesen om, at "der er ingen forskel mellem præferencer i gruppen".

(iii) Fortolk resultaterne.

Opløsning:

Følgende trin kan følges til beregningen af ​​x 2 og tegne konklusionerne:

Trin 1:

Beregn de forventede frekvenser (f e ) svarende til de observerede frekvenser i hvert tilfælde under en teori eller hypotese.

I vores eksempel er teorien af ​​samme sandsynlighed (null hypotese). I den anden række vælges fordelingen af ​​svar, der skal forventes ved nullhypotesen, ligeligt.

Trin 2:

Beregn afvigelserne (f o - f e ) for hver frekvens. Hver af disse forskelle er kvadreret og divideret med dens f e (256/32, 64/32 og 64/32).

Trin 3:

Tilføj disse værdier for at beregne:

Trin 4:

Graden af ​​frihed i bordet beregnes ud fra formlen df = (r - 1) (c - 1) til at være (3 - 1) (2 - 1) eller 2.

Trin 5:

Se op på de beregnede (kritiske) værdier af χ 2 for 2 df på visse niveauer, normalt 5% eller 1%.

Med df = 2 er χ 2- værdien for at være signifikant ved .01-niveau 9, 21 (tabel E). Den opnåede χ 2 værdi på 12> 9, 21.

jeg. Derfor er den markante divergens signifikant.

ii. Nulhypotesen afvises.

iii. Vi konkluderer, at vores gruppe virkelig favoriserer forslaget.

Vi afviser hypotesen "lige svar" og konkluderer, at vores gruppe favoriserer forslaget.

Eksempel 2:

Antallet af bilulykker pr. Uge i et bestemt samfund var som følger:

12, 8, 20, 2, 14, 10, 15, 6, 9, 4

Er disse frekvenser i overensstemmelse med den tro, at ulykkesbetingelserne var de samme i løbet af denne 10-ugers periode?

Opløsning:

Null-hypotesen - Indstil null-hypotesen om, at de givne frekvenser (antal ulykker pr. Uge i et bestemt samfund) er i overensstemmelse med troen på, at ulykkesbetingelserne var de samme i løbet af 10-ugersperioden.

Da det samlede antal ulykker i løbet af de 10 uger er:

12 + 8 + 20 + 2 + 14 + 10 + 15 + 6 + 9 + 4 = 100.

Under nullhypotesen bør disse ulykker fordeles ensartet i 10 uger, og dermed forventes antallet af ulykker for hver af de 10 uger 100/10 = 10.

Da den beregnede værdi af χ 2 = 26, 6 er større end den tabulerede værdi, 21.666. Det er signifikant, og null hypotesen afvist på .01 niveau af betydning. Derfor konkluderer vi, at ulykkesbetingelserne i hvert fald ikke er ensartede i løbet af 10 uger.

2. Test af divergensen af ​​observerede resultater fra de forventede på hypotesen om en normal fordeling:

Hypotesen, i stedet for at være lige sandsynlig, kan følge den normale fordeling. Et eksempel illustrerer hvordan denne hypotese kan testes af chi-square.

Eksempel 3:

To hundrede sælgere er klassificeret i tre grupper meget gode, tilfredsstillende og fattige - ved konsensus af salgschefer.

Afviger denne fordeling af rating betydeligt fra det, der forventes, hvis salgsevnen normalt fordeles i vores befolkning af sælgerne?

Vi opstiller hypotesen om, at salgsevnen normalt fordeles. Den normale kurve strækker sig fra - 3σ til + 3σ. Hvis salgsevnen normalt fordeles, kan basislinjen opdeles i tre lige store segmenter, dvs.

(+ 1σ til + 3σ), (- 1σ til + 1σ) og (- 3σ til - 1σ), der repræsenterer gode, tilfredsstillende og dårlige sælgere. Ved at henvise til tabel A finder vi, at 16% af sagerne ligger mellem + 1σ og + 3σ, 68% mellem - 1σ og + 1σ og 16% mellem - 3σ og - 1σ. I tilfælde af vores problem 16% af 200 = 32 og 68% af 200 = 136.

df = 2. P er mindre end .01

Den beregnede χ 2 = 72, 76

Den beregnede χ 2 af 72, 76> 9, 21. Derfor er P mindre end .01.

.˙. Forskellen mellem observerede frekvenser og forventede frekvenser er ganske signifikant. På denne baggrund må hypotesen om en normal fordeling af salgsmuligheder i denne gruppe afvises. Derfor konkluderer vi, at fordelingen af ​​vurderinger er forskellig fra det, der forventes.

3. Chi-square test, når vores forventninger er baseret på forudbestemte resultater:

Eksempel 4:

I et forsøg på opdræt af ærter opnåede en forsker følgende data:

Teorien forudsiger andelen af ​​bønner i fire grupper A, B, C og D skal være 9: 3: 3: 1. I et forsøg blandt 1.600 bønner var tallene i fire grupper 882, 313, 287 og 118. Gør det Eksperimentresultaterne understøtter den genetiske teori? (Test ved .05 niveau).

Opløsning:

Vi opstiller null hypotesen om, at der ikke er nogen signifikant forskel mellem de eksperimentelle værdier og teorien. Med andre ord er der god korrespondance mellem teori og eksperiment, dvs. teorien støtter eksperimentet.

Siden den beregnede χ 2 værdi på 4.726 <7.81, er den ikke signifikant. Derfor kan nul hypotesen accepteres ved .05 niveau af betydning, og vi kan konkludere, at de eksperimentelle resultater understøtter den genetiske teori.

4. Chi-square testen når tabelindgange er små:

Når tabelindføringer er små, og når bordet er 2 x 2 gange, dvs. df = 1, x 2 er udsat for betydelig fejl, medmindre der foretages en korrektion for kontinuitet (kaldet Yates 'Correction).

Eksempel 5:

Fyrre rotter blev tilbudt mulighed for at vælge mellem to ruter. Det blev fundet, at 13 valgte lysede ruter (dvs. ruter med mere belysning) og 27 valgte mørke ruter.

(i) Test hypotesen om, at belysning ikke gør nogen forskel i rotternes præference for ruter (Test ved .05 niveau).

(ii) Test om rotterne foretrækker mørke ruter.

Opløsning:

Hvis belysningen ikke giver nogen forskel i forhold til ruter, dvs. hvis H 0 er sandt, ville den forholdsmæssige præference være 1/2 for hver rute (dvs. 20).

I vores eksempel skal vi trække fra .5 fra hver (f o - f e ) forskel af følgende grund:

Dataene kan tabuleres som følger:

Når de forventede indtastninger i 2 x 2 gange bord er de samme som i vores problem, kan formlen til chi-square skrives i en noget kortere form som følger:

(i) Den kritiske værdi af χ 2 på .05 niveau er 3.841. Den opnåede χ 2 på 4, 22 er mere end 3, 841. Derfor nul hypotesen afvises på .05 niveau. Tilsyneladende lys eller mørk er en faktor i rotternes valg for ruter.

(ii) I vores eksempel skal vi lave en one-tailed test. Indtastning af tabel E finder vi, at χ 2 på 4, 22 har en P = .043 (ved interpolering).

.˙. P / 2 = .0215 eller 2%. Med andre ord er der 2 chancer i 100 at en sådan divergens ville opstå.

Derfor markerer vi divergensen at være signifikant på 02 niveau.

Derfor konkluderer vi, at rotterne foretrækker mørke ruter.

5. Chi-square testen af ​​uafhængighed i beredskabstabeller:

Nogle gange kan vi støde på situationer, der kræver, at vi tester om der er noget forhold (eller forening) mellem to variabler eller attributter. Med andre ord kan χ 2 laves, når vi ønsker at undersøge forholdet mellem egenskaber eller attributter, som kan klassificeres i to eller flere kategorier.

For eksempel kan vi blive pålagt at teste om farves øjenfarve er forbundet med sønns øjenfarve, om familiens socioøkonomiske status er forbundet med præference af forskellige varemærker af en vare, om uddannelsen af par og familie størrelse er relateret, om en bestemt vaccine har en bestemmende effekt på en bestemt sygdom mv.

For at lave en test udarbejder vi en beredskabstabel slut for at beregne f e (forventet frekvens) for hver celle i beredskabstabellen og derefter beregne x 2 ved hjælp af formel:

Nulhypotesen:

χ 2 beregnes med en antagelse om, at de to attributter er uafhængige af hinanden, dvs. der er intet forhold mellem de to attributter.

Beregningen af ​​den forventede frekvens af en celle er som følger:

Eksempel 6:

I en vis prøve på 2.000 familier er 1.400 familier forbrugere af te, hvor 1236 er hinduistiske familier og 164 er ikke-hinduer.

Og 600 familier er ikke forbrugere af te, hvor 564 er hinduistiske familier og 36 er ikke-hinduer. Brug χ 2 - test og angiv om der er nogen væsentlig forskel mellem forbrug af te blandt hinduistiske og ikke-hinduiske familier.

Opløsning:

Ovennævnte data kan arrangeres i form af en 2 x 2 beredskabstabel som angivet nedenfor:

Vi opstiller nullhypotesen (H 0 ), at de to attributter, nemlig 'forbrug af te' og 'fællesskabet' er uafhængige. Med andre ord er der ingen signifikant forskel mellem forbruget af te blandt hinduistiske og ikke-hinduiske familier.

Da den beregnede værdi af χ 2, nemlig 15, 24 er meget større end den tabulerede værdi af x2 ved .01-niveauet af betydning; værdien af ​​x2 er yderst signifikant, og null hypotesen afvises.

Derfor konkluderer vi, at de to samfund (hinduistiske og ikke-hinduer) afviger væsentligt med hensyn til forbruget af te blandt dem.

Eksempel 7:

Tabellen nedenfor viser data opnået under en koleraepidemi.

Test effektiviteten af ​​podning i forebyggelse af koleraangreb.

Opløsning:

Vi opstiller nullhypotesen (H 0 ), at de to attributter, dvs. inokulation og fravær af angreb fra kolera ikke er forbundet. Disse to attributter i den givne tabel er uafhængige.

Baseret på vores hypotese kan vi beregne de forventede frekvenser som følger:

Beregning af (f e ):

Den fem procentværdi af χ 2 for 1 df er 3.841, hvilket er meget mindre end den beregnede værdi af χ 2 . Så i lyset af dette konkluderes det klart, at hypotesen er ukorrekt, og inokulation og fravær af angreb fra kolera er forbundet.

Betingelser for gyldigheden af ​​Chi-Square test:

Chi-square teststatistik kan bruges, hvis følgende betingelser er opfyldt:

1. N, den samlede frekvens, skal være rimeligt stor, sige større end 50.

2. Prøveobservationerne skal være uafhængige. Dette indebærer, at ingen enkelt emne skal medtages to gange eller mere i prøven.

3. Begrænsningerne på cellefrekvenserne, hvis nogen, skal være lineære (dvs. de bør ikke indebære kvadratfrekvenser og højere frekvenser), såsom Σf o = Σf e = N.

4. Ingen teoretisk frekvens bør være lille. Små er et relativ begreb. Fortrinsvis bør hver teoretisk frekvens være større end 10, men under alle omstændigheder ikke mindre end 5.

Hvis en teoretisk frekvens er mindre end 5, kan vi ikke anvende χ 2- test som sådan. I så fald bruger vi "pooling" teknikken, der består i at tilføje frekvenser, der er mindre end 5 med den foregående eller efterfølgende frekvens (frekvenser), således at den resulterende sum er større end 5 og juster for frihedsgraden i overensstemmelse hermed.

5. Den givne fordeling bør ikke erstattes af relative frekvenser eller proportioner, men dataene skal angives i originale enheder.

6. Yates 'korrektion skal anvendes under særlige omstændigheder, når df = 1 (dvs. i 2 x 2 tabeller) og når celleposterne er små.

7. χ 2- test er for det meste brugt som en non-directional test (dvs. vi laver en to-tailed test.). Der kan dog være tilfælde, hvor χ 2 tests kan anvendes til at lave en one-tailed test.

I en-tailed test fordobler vi P-værdien. For eksempel med df = 1 er den kritiske værdi af x2 på 05 niveau 2.706 (2.706 er værdien skrevet under .10 niveau) og den kritiske værdi af; χ 2 på .01 niveau er 5.412 (værdien er skrevet under .02 niveauet).

Additive Property of Chi-Square Test:

χ 2 har en meget nyttig egenskab ved tilsætning. Hvis en række stikprøveundersøgelser er blevet udført i samme felt, kan resultaterne sammenlægges for at opnå en præcis ide om den virkelige position.

Antag at der er udført ti forsøg med at teste om en bestemt vaccine er effektiv mod en bestemt sygdom. Nu skal vi have ti forskellige værdier af χ 2 og ti forskellige værdier af df.

Vi kan tilføje de ti χ 2 for at opnå en værdi og tilsvarende kan ti værdier af df også tilføjes sammen. Således skal vi have en værdi af χ 2 og en værdi af grader af frihed. Nu kan vi teste resultaterne af alle disse ti eksperimenter kombineret sammen og finde ud af værdien af ​​P.

Antag at fem uafhængige eksperimenter er blevet udført i et bestemt felt. Antag, at der i hvert tilfælde var en df, og der blev opnået følgende værdier af x2.

Nu ved 5% signifikansniveau (eller for P - .05) er værdien χ 2 for en df 3.841. Fra de beregnede værdier af χ 2 givet ovenfor bemærker vi, at i kun en lethed, dvs. eksperiment nr. 3, er den observerede værdi af χ 2 mindre end den tabulerede værdi på 3, 841.

Det betyder, at for så vidt angår dette forsøg er forskellen ubetydelig, men i de resterende fire tilfælde er den beregnede værdi af χ 2 mere end 3.841 og som sådan ved 5% signifikansniveau er forskellen mellem de forventede og de faktiske frekvenser signifikant .

Hvis vi tilføjer alle værdierne af χ 2, får vi (4.3 + 5.7 + 2.1 + 3.9 + 8.3) eller 24.3. Det samlede antal grader af frihed er 5. Det betyder, at den beregnede værdi af χ 2 til 5 df er 24, 3.

Hvis vi ser i tabellen af ​​χ 2, vil vi opdage, at ved 5% niveau af betydning for 5 df er værdien af ​​χ 2 11.070. Den beregnede værdi af χ 2, som er 24, 3, er meget højere end den tabulerede værdi, og som sådan kan vi konkludere, at forskellen mellem observerede og forventede frekvenser er signifikant.

Selvom vi tager 1% niveau af betydning (eller P = .01) er tabelværdien af ​​χ 2 kun 15.086. Sandsynligheden for at få en værdi på χ 2 svarende til eller mere end 24, 3 som følge af stikprøveudsving er således meget mindre end endog .01 eller med andre ord forskellen er signifikant.

Applikationer af Chi-Test:

Anvendelserne af χ 2- teststatistik kan diskuteres som angivet nedenfor:

1. Test af divergensen af ​​observerede resultater fra forventede resultater, når vores forventninger er baseret på hypotesen om lige sandsynlighed.

2. Chi-square test, når forventningerne er baseret på normal distribution.

3. Chi-square test, når vores forventninger er baseret på forudbestemte resultater.

4. Korrektion for diskontinuitet eller Yates 'korrektion ved beregning χ 2 .

5. Chi-square test af uafhængighed i beredskabstabeller.

Anvendelse af Chi-Square-test:

1. Selv om test udføres i frekvenser, kan det bedst ses konceptuelt som en test om proportioner.

2. χ 2 test bruges til at teste hypotesen og er ikke nyttig til estimering.

3. Chi-square test kan anvendes til komplekse beredskabstabel med flere klasser.

4. Chi-square test har en meget nyttig egenskab, dvs 'additivegenskaben'. Hvis en række stikprøveundersøgelser udføres i samme felt, kan resultaterne sammenlægges. Dette betyder at χ 2- værdier kan tilføjes.