Variansanalyse (ANOVA)

Denne artikel vil beskæftige sig med anvendelse af analyse af varians til det vigtige og ofte opståede problem med at bestemme betydningen af ​​forskellen mellem midler.

Varians er i almindelig forstand et mål for spredning af et sæt scoringer. Det beskriver, i hvilket omfang scorerne adskiller sig fra hinanden. Det er defineret som middelværdien af ​​den kvadratiske afvigelse af individuelle score taget fra middelværdien.

hvor x = X - M eller afvigelse af scoren fra middelværdien, dvs. varians = kvadrat af SD

eller variance = σ 2 så σ =

En måling af varians giver os en ide om gruppens homogenitet. Variansen af ​​sæt af scoringer vil være mindre, hvor gruppen er homogen i præstation. På den anden side vil variansen af ​​sæt af scoringer være mere, hvis gruppen er heterogen i præstation.

Analysen af ​​varians er en meget nyttig enhed til analyse af resultaterne af videnskabelige undersøgelser, forskning inden for sociale og fysiske videnskaber. For at få svar på forskningsspørgsmål i eksperimentelle undersøgelser eller for at teste hypoteserne, analyseres varians i forskellige komponenter og afvigelser fra forskellige kilder sammenlignes. I forskning kommer vi på tværs af forskellige eksperimentelle design, og vi formulerer null hypoteser.

Vi anvender teknikken "variansanalyse" (ANOVA eller ANOVAR) for at undersøge, om variansforholdet (F) er signifikant eller ej, og basere på det. Nul hypotesen accepteres eller afvises.

Begrebet variance og ANOVA præciseres gennem et eksempel.

Eksempel 1:

Beregn variansen af ​​den følgende fordeling af score 4, 6, 3, 7, 5.

Her kaldes udtrykket Zx 2 "Summen af ​​firkanter af afvigelse af scoringer fra middelværdien" (kortfattet SS). Når SS er delt med det samlede antal scoringer (N), får vi "Mean square" eller MS. Således kaldes varians også middelfirkant. Symbolsk

V = MS eller V = SS / N

En varians i ANOVA's terminologi kaldes ofte et 'Mean square' (eller MS). I Analyse af Varians (ANOVA) beregnes Middelfirkant eller varians ved at dividere SS ved df . Dermed

Variansens komponenter:

Før man går igennem detaljerede beregninger af varians, er det nødvendigt at få et overblik over to af dens komponenter, nemlig:

(a) Systematisk varians, og

(b) Fejlvariation.

(a) systematisk variation:

Systematisk varians, i en eksperimentel opsætning, er den del af varians som kan tilskrives manipulation af eksperimentelle variable, dvs. uafhængig variabel.

For eksempel ønsker en efterforsker at studere effekten af ​​motivation, dvs. verbal belønning og anerkendelse på akademisk opnåelse af to lige grupper. Han vælger to homogene grupper og manipulerer verbal belønning til en gruppe og anerkendelse til en anden gruppe. Derefter administrerer han en test til begge grupperne og opnår deres score.

(Her er 'Motivation' den uafhængige variabel, og 'opnået score' er den afhængige variabel). Når variansen af ​​alle scores af to grupper beregnes, betegnes den som total varians (V t ). Den del af den samlede varians, der kan tilskrives 'manipulation af motivation', kan kun betegnes som 'Systematisk Varians'. Dette er variansen mellem grupper (eller V b ).

(b) Fejlvariation:

Ud over effekten af ​​eksperimentelle variabler er der også andre kilder til variation på grund af fremmede variabler, der kan påvirke afhængig variabel.

Således er fejlvariation den del af den samlede varians, som kan tilskrives andre ukontrollerede kilder til variation i et forsøg.

Fejlvariationen stammer fra forskellige kilder, nemlig:

1. Ukontrollerede kilder til variation som følge af fremmede variabler.

2. Inherent variabilitet i forsøgsenhederne.

3. Tilfældige udsving i eksperimentet.

4. Fejl i måling på grund af mangel på

(a) Standard eksperimentelle teknikker

b) Ensartethed ved administration

c) fysisk adfærd af eksperiment

(d) Fagets forbigående følelsesmæssige tilstand mv.

Symbolisk Fejlvariation udtrykkes som V e . I ovenstående eksempel beskæftiger vi os hovedsagelig med to variabler, nemlig motivation som uafhængig variabel og præstationsresultater som afhængig variabel.

Udover disse to variabler møder efterforskeren andre variabler, der påvirker den afhængige variabel. Sådanne andre variabler kan være som køn, intelligensniveau, socialøkonomisk status, alder, uddannelse mv, som efterforskeren ikke har taget sig af.

Sådanne variabler, som ikke kontrolleres i en eksperimentel opsætning og påvirker forekomsten af ​​afhængig variabel, kaldes "udenlandske variabler" eller "irrelevante variabler".

Når disse variabler styres i et eksperiment, kan eksperimentelle fejl minimeres. Hvis disse udenlandske variabler ikke kontrolleres, vil det danne den del af fejlvariationen. "Den primære funktion af eksperimentelt design er at maksimere systematisk varians, kontrollere udenlandske kilder til varians og minimere fejlvariation." Således vil enhver efterforsker reducere forsøgsfejlen.

For at minimere fejlvariationen kan følgende måder anvendes:

1. Ekstra variable kan styres af:

en. randomisering,

b. Elimination,

c. Matching,

d. Ved at indføre yderligere uafhængige variable eller variabler, og

e. Ved statistisk kontrol.

2. Målefejl kan styres af :

en. Ved hjælp af standardiserede eksperimentelle teknikker,

b. Brug af pålidelige måleinstrumenter,

c. Sikring af ensartethed ved administration eller udførelse af forsøg,

d. Øget pålidelighed ved at give klare og utvetydige instruktioner mv.

Ovennævnte diskussion bekræfter os at konkludere, at totalvariationen består i to dele, dvs.

V t = V b + V e

hvor V t = totalvariation

V b = mellemgruppevarians (eller systematisk varians)

V e = fejlvariation.

I ANOVA studeres den systematiske varians mod fejlvariationen ved F-test.

Den største værdi af F, jo større er sandsynligheden for, at den systematiske varians er større end eksperimentelle fejl (inden for gruppevariance eller individuelle variationer).

Et numerisk eksempel kan skelne mellem systematisk varians og fejlvariation.

Eksempel 2:

En efterforsker tildeler ti studerende tilfældigt til to grupper (fem i hver gruppe) og manipulerer to behandlinger af motivation til disse to grupper tilfældigt.

Derefter administrerer investigatør en prøve og noterer ned scorerne på ti studerende som angivet nedenfor:

Det ses nu, at midlerne til to grupper er forskellige. Det vil sige, vi finder mellem gruppevarians. Mellemgruppevariansen (Vb) kan beregnes som følger. Lad os bruge middelene 5 og 7 som to score og beregne variansen af ​​disse to scores.

Vi beregner derefter den samlede varians (V t ) ved at tage alle de ti scorer af begge grupper i en søjle.

V t indeholder alle kilder til variation i scorerne. Tidligere har vi beregnet V b (eller mellemgruppevarians) til at være 1, 00.

Lad os nu beregne endnu en varians ved at beregne variansen af ​​hver gruppe separat og derefter middelværdige dem.

Da vi har beregnet afvigelserne særskilt og derefter i gennemsnit, kalder vi denne variant som "inden for gruppevarians" eller Vw .

I vores eksempel Vw = 3, 8

Så 4, 8 ( Vt ) = 1, 00 (Vb) + 3, 8 ( Vw )

eller Vf = V b + V w [Total varians = mellem gruppevarians + indenfor gruppevarians].

Grundlæggende begreber, der blev ramt af ANOVA:

Før vi tager op på numeriske problemer for at teste nullhypotesen ved at anvende ANOVA, bør vi være bekendt med to begreber, nemlig: a) Summen af ​​kvadrater (SS) og (b) Frihedsgraden ( df ), som vi ofte ville støde på i ANOVA.

(a) Beregning af SS (Summen af ​​firkanter):

I ANOVA beregner vi 'mellemgruppevarians' (V b ) og 'indenfor gruppevarians' (V w ). Vi beregner V b og V w som følger:

hvor SS b = Mellem-gruppe summen af ​​firkanter

og SS W = Indenfor grupper summen af ​​firkanter.

Vi sammenligner disse to variationer med et forhold kaldet F hvor F = hvor

Lad os nu lære, hvordan summen af ​​kvadrater (SS) skal beregnes ved hjælp af to metoder.

Eksempel 3:

Beregn summen af ​​kvadrater af følgende fordeling af scoringer.

7, 9, 10, 6, 8

Middel = 40/5 = 8

Metode-II (kort metode):

SS kan beregnes direkte fra scorerne uden beregning af middel og afvigelse. Dette er kendt som kort metode, og SS beregnes ved at bruge formlen,

Her behøver vi ikke at beregne gennemsnittet og afvigelserne fra den enkelte score fra middelværdien. Den anden metode foretrækkes, når der er stort antal scoringer, og det gennemsnitlige betyder decimaler.

Således i ANOVA kan summen af ​​kvadrater beregnes ved anvendelse af formlen.

Beregning mellem grupper summen af ​​kvadrater (SS b ) og inden for grupper summen af ​​kvadrater (SS W )

Følgende to metoder kan anvendes til at beregne SS t, SS b og SS w .

Eksempel 4:

To forskellige behandlinger manipuleres på to grupper af fem fag hver.

Og de opnåede resultater er som følger:

Lad "Grand Mean" (dvs. middelværdien af ​​alle de ti scoringer) betegnes som M

Nu M = 35 + 25/10 = 60/10 = 6

Beregning af SS t, SS b og SS w (Long Method):

Beregning af SS t :

For at beregne SS t skal vi finde ud af summen af ​​kvadrater af afvigelsen for hver af de ovennævnte ti scoringer fra grand mean (dvs. 6)

Beregning af SS b :

For at beregne SS b antager vi, at hvert element i gruppen er lig med gruppegennemsnittet og derefter undersøge variansen mellem forskellige grupper. Her skal vi beregne summen af ​​kvadratet af afvigelsen af ​​midler fra forskellige grupper fra den store middelværdi.

Værdien af ​​hvert element i gruppe-I betragtes som værende 7 og værdien af ​​hvert element i gruppe-II antages at være 5, og summen af ​​kvadrater af disse værdier fra grand mean (M = 6) beregnes.

Vi kan beregne SS b i en tabelformular som følger:

Beregning af SS w :

Til beregning af SS W finder vi ud af summen af ​​kvadrater af afvigelsen af ​​forskellige scoringer i en gruppe fra de respektive gruppers gennemsnit.

Beregningen af ​​SS W er præsenteret i en tabelform:

Samlet antal kvadrater eller SS W = 10 + 6 = 16

I ovenstående beregning har vi fundet SS t, = 26, SS b, = 10 og SS W = 16

Således SS t = SS b + SS w

Beregning af SS t, SS b og SS w (kort metode):

Kort sagt, vi kan nemt beregne SS t SS b og SS W direkte fra scorerne ved at bruge følgende tre formler.

I denne korte metode behøver vi ikke at beregne middelværdierne og afvigelserne. Vi kan beregne forskellige afvigelser direkte fra scorerne. I ANOVA beregnes SS t og SS b normalt ved den korte metode.

Mens vi løser problemer på ANOVA, skal vi beregne SS og SS t ved denne korte metode.

(b) Frihedsgrader (df):

Hver SS bliver en varians, når den divideres med frihedsgraderne ( df ) tildelt den. I ANOVA ville vi komme på tværs af grader af frihed ( df ). Antallet af frihedsgrader for hver varians er en mindre end den V, som den er baseret på.

Hvis N = Antal scorer i alt og K = antal kategorier eller grupper, har vi til den generelle sag at:

df for total SS = (N - 1)

df for mellem grupper SS = (K - 1)

df for indenfor grupper SS = (N - K)

Også:

(N - 1) = (N - K) + (K - 1)

Variansanalyse (One Way):

Separat har vi diskuteret om test af betydning af forskel mellem midler. Normalt er t-test ansat, når vi vil afgøre, om de to prøveorganer adskiller sig væsentligt.

Når vi er bekymrede for eksperimenterne med to grupper, kan vi teste om de to midler adskiller sig væsentligt ved at anvende t-test.

Men t-test er ikke tilstrækkelig, når mere end to måder skal sammenlignes. For eksempel er der fire midler på fire grupper. For at teste om disse fire midler adskiller sig væsentligt fra hinanden, skal vi lave seks t-test.

Hvis de fire midler er M 1, M 2, M 3, M 4, skal vi sammenligne forskellen mellem M 1 og M 2 dvs (M 1 - M 2 ) mellem M 1 og M 3 dvs (M 1 - M 3 mellem M 1 og M 4 dvs (M 1 - M 4 ), mellem M 2 og M 3 dvs (M 2 - M 3 ), mellem M 2 og M 4 dvs (M 2 - M 4 ) mellem M 3 og M 4 dvs. (M 3 - M 4 ). Tilsvarende for 10 betyder, at vi skal lave 45 t-test.

For K betyder vi, at vi skal lave K (K - 1) / 2 t-tester, og det ville medføre mere beregning og arbejde. Men ved at anvende F-test gennem ANOVA kan vi vurdere betydningen af ​​forskel på tre eller flere end tre midler ad gangen.

Forudsætninger, som en F-test hviler på:

Som sædvanlig lyder en statistisk beslutning i det omfang, at visse antagelser er opfyldt i de data, der anvendes.

I ANOVA er der normalt fire angivne krav:

1. Prøveudtagningen inden for sæt skal være tilfældig. De forskellige behandlingsgrupper udvælges tilfældigt fra befolkningen.

2. Afvigelserne fra de forskellige sæt skal være omtrent ens. Dette refererer til antagelse af homogenitet af varians, dvs. grupperne er homogene i variabilitet.

3. Observationer inden for eksperimentelt homogene sæt bør være fra normalfordelte populationer.

4. Bidragene til den samlede varians skal være additiv.

A. Vi vil tage et par eksempler og se, hvordan variance analyseres, når grupper er uafhængige:

Eksempel 5:

I en eksperimentel opsætning tildeles 16 personer tilfældigt to grupper af 8 individer hver. Disse to grupper blev behandlet med to forskellige undervisningsmetoder. Test betydningen af ​​forskellen mellem prøveorganerne.

Opløsning:

Grand Total (dvs. i alt 16 score) = 104 eller ΣX = 104

Grand mean (M) dvs. Middel af alle de 16 scoringer = ΣX / N = 104/16 = 6, 5

Til beregning af F-forhold skal vi følge nedenstående trin:

Trin 1:

Summen af ​​alle de 16 scoringer er 44 + 60 eller 104; og korrektionen (C) er følgelig

Trin 2:

Når hver score af begge grupper er kvadreret og summeret, kommer ΣX 2 til at være (ΣX 1 2 + ΣX 2 2 = 260 + 460) 720.

Derefter trækkes korrektionen 676 fra totalet ved anvendelse af formlen:

I alt SS eller SS 1 = ΣX 2 - C = 720 - 676 ​​= 44.

eller, SS t = 3 2 + 4 2 + 5 2 + ...... .. + 9 2 - 676 ​​= 44

Trin 3:

Summen af ​​kvadrater mellem middel SS b findes ved at kvadrere summen af ​​hver kolonne, dividere den første og anden ved 8 separat og subtrahere C.

Mellem gruppe SS eller SS b

Trin 4:

SS indenfor (eller SS W ) er forskellen mellem SS t og SS b . Således SS W = 44-16 = 28.

Trin 5:

Da der er 16 point i alt

Fortolkning af F Ratio:

Variationsforholdet eller F er 16/2 eller 8. Df for mellemorganer er 1 og df for indengrupper er 14. Indtastning af tabel F med disse df'er læser vi i kolonne 1 og række 14, at .05-niveauet er 4, 60 og .01-niveauet er 8, 86. Vores beregnede F er signifikant på .05 niveau.

Men det er ikke signifikant på .01 niveau. Eller med andre ord er den observerede værdi af F større end .05 niveauværdi men mindre end .01 niveauværdi. Derfor konkluderer vi, at den gennemsnitlige forskel er signifikant på .05 niveau, men ikke signifikant ved .01-niveau af betydning.

Eksempel 6:

(Når størrelsen af ​​grupperne er ulige) En interessetest administreres til 6 drenge i en erhvervsuddannelsesklasse og til 10 drenge i en latinsklasse.

Er den gennemsnitlige forskel mellem de to grupper signifikant på .05 niveau? Test betydningen af ​​forskellen gennem ANOVA.

Fortolkning af F Ratio:

Variationsforholdet eller F er 135/33 eller 4, 09. Df for mellem betyder er 1 og df for indengrupper er 14. Indtastning af tabel F med disse df'er læser vi i kolonne 1 og række 14, at .05 niveauet er 4, 60 og .01 niveauet er 8, 86. Vores beregnede F på 4, 09 når ikke helt .05 niveauet, så vores gennemsnitlige forskel på 6 point skal betragtes som ikke signifikant. Derfor er nulhypotesen accepteret.

Når der kun er to måder at sammenligne, som her; F = t 2 eller t = = √F, og de to test (F og t) giver det samme resultat. For ovenstående eksempel √F = √4.09 = 2.02. Fra bordet D fandt vi, at for 14 df er .05 niveauet af betydning for denne t 2, 14.

Vores t på 2, 02 når ikke helt op på dette niveau, og dermed (som F) er ikke signifikant.

Eksempel 7:

(Mere end to grupper)

Anov ANOVA for at teste om midlerne til fire grupper adskiller sig væsentligt:

Da der er 20 point i fire grupper:

df for total SS (eller SS 1 ) = (N - 1) eller 20 - 1 = 19

df for SS b = (K - 1) eller 4 - 1 = 3

df for SS w = (N - K) eller 20 - 4 = 16

F = 33, 33 / 3, 5 = 9, 52

T = √F = 3, 08

Fortolkning af F-forhold:

Variationsforholdet eller F er 9, 52. Df for mellem betyder 3 og df for indengrupper er 16. Indtastning af tabel F med disse df s vi læser kolonnen 3 og række 16, at .05 niveauet er 3, 24 og .01 niveauet er 5, 29.

Vores beregnede F på 9, 52 er mere end 5, 29. Derfor er F signifikant. Nulhypotesen afvises med den konklusion, at de fire midler adskiller sig væsentligt fra 01-niveauet.

(B) Vi vil tage et andet eksempel op ved at analysere varians, når den samme gruppe måles mere end en gang dvs. i tilfælde af korrelerede grupper:

Når en test gives og gentages, kan variansanalysen anvendes til at bestemme, om den gennemsnitlige ændring er signifikant (dvs. betydningen af ​​forskellen mellem midler opnået fra korrelerede grupper).

Eksempel 8:

(For korrelerede grupper)

Fem emner gives 4 efterfølgende forsøg på en ciffer-symboltest, hvoraf kun scorerne for forsøg 1 og 4 er vist. Er den gennemsnitlige gevinst fra første til sidste forsøg signifikant.

Procedurerne for variansanalysen afviger i øjeblikket på mindst to måder fra de ovenfor beskrevne metoder.

For det første, da der er mulighed for sammenhæng mellem de score, der blev opnået af de 5 forsøgspersoner i første og fjerde prøve, bør de to sæt scoringer ikke i starten behandles som uafhængige (tilfældige) prøver.

For det andet er klassificering nu i form af to kriterier: (a) forsøg og (b) fag.

På grund af disse to kriterier skal den samlede SS opdeles i tre dele:

(a) SS tilskrives forsøg

b) SS kan henføres til emner og

(c) En rest SS kaldes normalt "interaktion"

Fremskridt i beregningen af ​​disse tre afvigelser kan opsummeres som følger:

Trin 1:

Korrektion (C). Som i tidligere procedure, C = (ΣX) 2 / N. I ovenstående eksempel er C 90 2/10 eller 810.

Trin 2:

Samlet antal kvadrater. Igen gentager beregningen proceduren anvendt i eksempel 1, 2 og 3.

I alt SS eller SS t = 7 2 + 8 2 + 4 2 + 6 2 + 5 2 + 10 2 + 15 2 + 5 2 + 20 2 + 10 2 - C

= 1040 - 810 eller 230.

Trin 3:

SS mellem midlerne til forsøg. Der er to forsøg på 5 point hver.

Derfor,

Trin 4:

SS blandt midlerne til emner. En anden "mellem midler" SS er forpligtet til at tage sig af det andet kriterium for klassificering. Der er 5 studerende / fag og hver har to forsøg. Resultaterne af 1. og 4. prøve af hvert fag / elev tilføjes for at få 17, 23, 9, 26, 15.

derfor

Trin 5:

Interaktion SS. Den resterende variation eller interaktion er det, der er tilbage, når de systematiske virkninger af forsøgsforskelle og fagforskelle er fjernet fra den samlede SS.

Interaktion måler tendensen til fagpræstationer at variere sammen med forsøg: det måler de faktorer, der kan tilskrives hverken fag eller forsøg, der handler alene, men snarere at begge virker sammen.

Interaktion er opnået skal simpelthen ved at trække prøver SS plus emner SS fra total SS.

Dermed,

Interaktion SS = SS t - (SS emner + SS forsøg ) = 230 - (90 + 90) = 50.

Trin 6:

Da der er 10 point i alt, har vi (10 - 1) eller 9 df for den samlede SS. To forsøg modtager 1 df og 5 emner, 4. De resterende 4 df er tildelt interaktion. Reglen er, at df for interaktion er produktet af df for de to interaktive variabler, her 1 x 4 = 4. Generelt er N = totalt antal scoringer, r = rækker og K = søjler.

Fortolkning af F-forhold:

F for forsøg er 7, 2. Den beregnede værdi af F for forsøg er mindre end 7, 71, som vi læser i tabel F for .05 punktet når df 1 = 1 og df 2 = 4.

Det betyder, at nullhypotesen med hensyn til forsøg er holdbar og skal accepteres. Beviset er stærkt, at der ikke skete væsentlige forbedringer fra forsøg 1 til forsøg 4.

F for emner er 1, 8 og er langt mindre end .05 punktet på 6, 39 i tabel F for df 1 = 4 og df 2 = 4. Det er indlysende, at emner ikke er konsekvent bedre end andre.

Det betyder, at nullhypotesen med hensyn til emner er holdbar og skal accepteres.

Tovej ANOVA:

At undervise i visse geometriske koncept, hvis forskellige undervisningsmetoder anvendes på to eller flere end to grupper af studerende, kalder vi det som en eksperimentel variabel.

I envejs ANOVA studeres kun en faktor (dvs. en uafhængig variabel). Når vi f.eks. Vil teste om undervisningsmetoder har nogen indvirkning på præstationen, studerer vi effekten af ​​en uafhængig variabel (dvs. metoder undervisning) på den afhængige variabel (dvs. præstation).

Datasætene er differentieret på basis af kun en eksperimentel variation. Der er kun et princip om klassificering, en grund til at adskille data i sæt.

For dette lad os vælge tre grupper tilfældigt og tildele tre forskellige behandlinger viz., Metode 1, metode 2 og metode 3 tilfældigt til disse tre grupper.

I slutningen kan de opnåede resultater af emner fra de tre forskellige grupper opnås ved en passende test.

Derefter ved at ansætte ANOVA kan vi teste om midlerne fra disse tre grupper adskiller sig betydeligt.

I en tovejs klassifikation eller tovejs ANOVA er der to forskellige klassificeringsgrundlag. To eksperimentelle forhold kan variere fra gruppe til gruppe. I de psykologiske laboratorier kan forskellige kunstige luftfelt landingsstrimler, hver med et andet mønster af markeringer, ses gennem en diffusionsskærm for at stimulere syn gennem tåge på forskellige niveauer opaqueness.

I et uddannelsesmæssigt problem kan fire metoder til undervisning af et bestemt geometrisk koncept anvendes af fem forskellige lærere, der hver især bruger hver af de fire metoder. Der vil derfor være 20 kombinationer af lærer og metode.

Følgende tabel kan komme dig videre:

I et eksempel, der er citeret nedenfor, studeres virkningerne af tre undervisningsmetoder på præstationsresultater. Men det forventes, at undervisningsmetoderne vil have forskellig effekt afhængigt af fagets socioøkonomiske status (SES).

Så vi kan designe en undersøgelse, hvor effekten af ​​to variabler, dvs. effekten af ​​undervisningsmetoder og effekten af ​​niveauer af socioøkonomisk status (SES) kan studeres samtidigt. I dette design kan vi også studere interaktionseffekten. Til sådanne konstruktioner anvendes teknikkerne til tovejs ANOVA.

Eksempel 9:

Seks grupper af studerende (fem studerende i hver) er blevet tilfældigt valgt til seks behandlingsbetingelser. Undersøg effekten af ​​to faktorer, nemlig faktor A (socioøkonomisk status) og faktor B (metoder til instruktion) for følgende eksempel.

Opløsning:

I ovenstående eksempel har vi taget to niveauer af SES viz., High SES i A 1 kategori og Low SES i A 2 kategori og tre undervisningsmetoder, B 1 (forelæsning), B 2 (diskussion) og B 3 spille-måde).

Det samlede antal behandlinger i eksperimentet er 2 x 3 = 6. Her er n = 5 og det samlede antal observationer er N = 5 x 6 = 30.

Grand total, ΣX = 30 + 50 + 40 + 25 + 45 + 35 = 225.

Seks forskellige behandlingsgrupper kan præsenteres i en 'Interaktionstabel' som angivet nedenfor:

For tre instruktionsmetoder er der tre kolonner (... c = 3). Rædetallene bruges til beregning af SS for A (SES). Søjletallene anvendes til beregning af SS for B (undervisningsmetoder).

Fremskridt i beregningen af ​​afvigelser kan opsummeres som følger:

Trin 1:

Trin 2:

Samlet SS eller SS t = ΣX 2 - C. Her er alle de tredive scorer kvadreret og tilføjet og C subtraheres.

SS t = 5 2 + 7 2 + ......... + 10 2 + 7 2 - 1687, 5 = 1919 - 1687, 5 = 231, 5

Trin 3:

Mellem gruppe SS eller SS b = Summen af ​​(ΣX) 2 / n for alle de seks behandlingsbetingelser - C.

Trin 4:

Inden for grupper SS eller SS W = SS t - SS b = 231, 5 - 87, 5 = 144

Trin 5:

Nu kan "Mellem gruppe SS" eller SS b på 87, 5 opdeles i tre dele, nemlig SS A, SS B og SS AB dvs. SS b = SS A + SS B + SS AB

Hvor SS A = SS af faktor A (SES), der genererer fra afvigelsen af ​​A 1 og A 2, betyder fra middelværdien af ​​de samlede scores.

SS B = SS af faktor B (metoder) genereret af afvigelserne af B 1, B 2 og B 3 betyder fra middelværdien af ​​de samlede scores.

Trin 6:

Frihedsgrader for forskellige SS

I vores problem har vi 6 grupper

.˙. K = 6

n = 5 og N = 6 xn = 6 x 5 = 30.

I interaktionstabellen er der to rækker og tre kolonner

.˙. r = 2 og C = 3.

Fordeling af df kan foretages som følger:

df for SS t = N - 1 = 30-1 eller 29

df for SS b = K - 1 = 6 - 1 eller 5

df for SS W = K (n - 1) = 6 x 4 eller 24

Df Fox SS B, kan opdeles i tre dele:

(i) df for SSA = r - 1 = 2 - 1 eller 1

(ii) df for SSB = c - 1 = 3 - 1 eller 2

(iii) df for SS AB = (r - 1) (C - 1) = 1 x 2 eller 2

Nu kan vi indtaste ovenstående beregning i en tovejs ANOVA-oversigtstabel:

Fortolkning af F-forhold:

(a) F for SES eller F for A

F = MS A / MS W = 7, 5 / 6, 0 = 1, 25

(.052 er mindre end en)

Som F på 1, 25 <4, 26 ved .05 niveau beholder vi null hypotesen om, at de to grupper, der er valgt tilfældigt, ikke adskiller sig fra præstationsresultater på baggrund af socioøkonomisk status.

Som F på 6, 67> 5, 6 ved .01 niveau, afviser vi null hypotesen. Vi konkluderer, at de tre undervisningsmetoder påvirker resultaterne forskelligt.

Som F på 0, 00 <1 beholder vi nulhypotesen. Vi accepterer null hypotesen om intet interaktion. Vi konkluderer, at effektiviteten af ​​metoder ikke afhænger af niveauet af socioøkonomisk status.