Bestemmelse af pålidelighed af en test: 4 Metoder

Der er fire procedurer til fælles brug til beregning af pålidelighedskoefficienten (undertiden kaldet selvkorrelation) af en test. Disse er: 1. Test-Retest (Repetition) 2. Alternate eller Parallel Forms 3. Split-Half Teknik 4. Rational Equivalence.

1. Test-Retest Metode:

For at estimere pålidelighed ved hjælp af test-retest-metoden, administreres samme test to gange til samme gruppe elever med et givet tidsinterval mellem de to administrationer af testen.

De resulterende testresultater bue korreleres, og denne korrelationskoefficient giver et mål for stabilitet, det vil sige, det angiver, hvor stabilt testresultaterne er over en tidsperiode. Så det er ellers kendt som en måling af stabilitet.

Opgørelsen af ​​pålidelighed varierer i dette tilfælde afhængigt af længden af ​​tidsinterval tilladt mellem de to administrationer. Produktets øjeblikkemetode for korrelation er en signifikant metode til at estimere pålideligheden af ​​to sæt scoringer.

Således indikerer en høj korrelation mellem to sæt scoringer, at testen er pålidelig. Midler viser, at de opnåede resultater i første indgivelse ligner de score, der blev opnået ved anden administration af den samme test.

I denne metode spiller tidsintervallet en vigtig rolle. Hvis det er for lille, siger en dag eller to, vil konsekvensen af ​​resultaterne blive påvirket af overføringseffekten, dvs. eleverne vil huske nogle af resultaterne fra den første administration til den anden.

Hvis tidsintervallet er lang, siger et år, vil resultaterne ikke kun blive påvirket af ulighederne af testprocedurer og -betingelser, men også af de faktiske ændringer i eleverne i løbet af den pågældende periode.

Tidsrum af retest bør ikke være mere end seks måneder. Tidsrum for retesting to uger (2 uger) giver et nøjagtigt indeks for pålidelighed.

Fordele:

Selvkorrelation eller test-retest-metode, til estimering af pålidelighedskoefficient anvendes generelt. Det er værd at bruge i forskellige situationer bekvemt. En test af en passende længde kan anvendes efter et interval på mange dage mellem successiv testning.

Ulemper:

1. Hvis testen gentages med det samme, vil mange motiver genkalde deres første svar og bruge deres tid på nyt materiale og dermed øge deres score - nogle gange med en god del.

2. Udover øjeblikkelige hukommelseseffekter vil praksis og selvtillid fremkaldt af kendskab til materialet næsten helt sikkert påvirke scoringer, når testen tages for anden gang.

3. Indekset af pålidelighed opnået er mindre nøjagtig.

4. Hvis intervallet mellem testene er temmelig lang (mere end seks måneder), vil vækstfaktoren og løbetiden påvirke scorerne og har en tendens til at sænke pålidelighedsindekset.

5. Hvis testen gentages straks eller efter et lille tidsrum, kan der være mulighed for overføringseffekt / overføringseffekt / hukommelse / øvelse effekt.

6. Ved gentagelse af den samme test, på samme gruppe anden gang, bliver eleverne uinteresserede, og de kan derfor ikke lide at deltage helhjertet.

7. Ibland opretholdes ensartethed, som også påvirker testresultaterne.

8. Mulighed for at diskutere nogle spørgsmål efter den første administration, hvilket kan øge scoren ved anden administration, der påvirker pålideligheden.

2. Alternativ eller parallelt formular metode:

Beregning af pålidelighed ved hjælp af den tilsvarende formmetode indebærer anvendelse af to forskellige, men tilsvarende former for testen. Parallel formens pålidelighed er også kendt som alternativ form driftssikkerhed eller tilsvarende pålidelighed eller sammenlignelige form driftssikkerhed.

I denne metode anvendes to parallelle eller tilsvarende former for en test. Ved parallelle former betyder det, at formularerne svarer til indholdet, målene, formatet, vanskeligheden og den diskriminerende værdi af varer, testens længde osv.

Parallelle tests har samme gennemsnitlige score, afvigelser og interrelationsforhold mellem elementer. Det vil sige, at to parallelle former skal være ensartede eller ens i alle henseender, men ikke en gentagelse af testemner. Lad de to former være Form A og Form B.

Pålidelighedskoefficienten kan ses som koefficientkorrelationen mellem scorerne på to ækvivalente testformer. De to tilsvarende former er muligvis ens i indhold, grad, testede mentale processer og vanskelighedsniveau og i andre aspekter.

En form for testen administreres på eleverne, og ved efterbehandling straks leveres en anden form for test til samme gruppe. De opnåede resultater er korrelerede, hvilket giver estimatet om pålidelighed. Således er den pålidelighed, der findes, kaldet ækvivalenskoefficient.

Gulliksen 1950: har defineret parallelle tests, da test har lige muligheder, lige variation og lige interrelationsforhold.

Guilford: Den alternative formmetode angiver både ækvivalens af indhold og stabilitet af ydeevnen.

Fordele:

Denne procedure har visse fordele i forhold til test-retest-metoden:

1. Her gentages den samme test ikke.

2. Hukommelse, praksis, overføringseffekter og tilbagekaldelsesfaktorer minimeres, og de påvirker ikke resultaterne.

3. Den pålidelighedskoefficient, der opnås ved denne metode, er et mål for både tidsmæssig stabilitet og sammenhæng i respons på forskellige vareprøver eller testformer. Denne metode kombinerer således to typer pålidelighed.

4. Nyttig til pålideligheden af ​​præstationsprøver.

5. Denne metode er en af ​​de egnede metoder til at bestemme pålideligheden af ​​pædagogiske og psykologiske tests.

Begrænsninger:

1. Det er svært at have to parallelle former for en test. I visse situationer (dvs. i Rorschach) er det næsten umuligt.

2. Når testene ikke er nøjagtigt ens i forhold til indholdsproblemer, længde, kan sammenligningen mellem to sæt scoringer opnået fra disse tests føre til fejlagtige beslutninger.

3. Øvelses- og overførselsfaktorer kan ikke kontrolleres fuldstændigt.

4. Desuden skaber administration af to former samtidig kedsomhed. Derfor foretrækker folk sådanne metoder, hvor kun en administration af testen er nødvendig.

5. Testbetingelserne under administration af Form B kan ikke være de samme. Desuden kan testiklerne ikke ligge i samme fysiske, mentale eller følelsesmæssige tilstand på begge administrations tidspunkter.

6. Testresultater af anden form for testen er generelt høje.

Selv om vanskelige, omhyggeligt og forsigtigt konstruerede parallelle former giver os rimeligt en tilfredsstillende måling af pålidelighed. For velfremstillede standardiserede tests er parallelformmetoden sædvanligvis den mest tilfredsstillende måde at bestemme pålideligheden på.

3. Split-halv metode eller opdelt testmetode:

Split-halv metode er en forbedring i forhold til de to tidligere metoder, og det involverer både karakteristika for stabilitet og ækvivalens. De ovenfor diskuterede to metoder til estimering af pålidelighed forekommer undertiden vanskeligt.

Det kan ikke være muligt at bruge den samme test to gange og få en tilsvarende form for test. For at overvinde disse vanskeligheder og for at reducere hukommelsesvirkning såvel som at økonomere testen er det ønskeligt at estimere pålidelighed ved en enkelt administration af testen.

I denne metode administreres testen en gang på prøven, og den er den mest hensigtsmæssige metode til homogene test. Denne metode giver den interne konsistens af en test score.

Alle testens elementer arrangeres generelt i stigende rækkefølge og administreres en gang på prøve. Efter administration af testen er den opdelt i to sammenlignelige eller ens eller lige dele eller halvdele.

Scorerne er arrangeret eller lavet i to sæt opnået fra ulige antal emner og lige antal emner separat. For eksempel administreres en test på 100 poster.

Antallet af personer baseret på 50 ulige numre som 1, 3, 5, .. 99 og scoringer baseret på lige antal 2, 4, 6 ... 10 er arrangeret separat. Til dels er 'A' ulige antal elementer tildelt og del 'B' vil bestå af lige antal poster.

Efter at have opnået to point på ulige og lige antal testemner, beregnes koefficienten for korrelation. Det er virkelig en sammenhæng mellem to tilsvarende halvdele af scoringer opnået i et møde. For at estimere pålidelighed anvendes Spearman-Brown Prophecy formel.

Spearman-Brown formel er givet af:

i hvilken r 11 = pålideligheden af ​​hele testen.

r 11/22 = korrelationskoefficienten mellem to halvtest.

Eksempel 1:

En test indeholder 100 genstande. Alle disse ting er arrangeret i sværhedsgrad, da man går fra den første til den hundrede. Studerende besvarer testen og testen er scoret.

Scorerne opnås af eleverne i ulige antal emner, og lige antal emner opgøres særskilt. Korrelationskoefficienten mellem disse to sæt scoringer er 0, 8.

Pålideligheden af ​​hele testen (eller)

Når man bruger denne formel, skal man huske på, at variansen af ​​ulige og lige halvdele skal være lige, dvs.

Hvis det ikke er muligt, kan Flanagan og Rulon formler anvendes. Disse formler er enklere og involverer ikke beregning af korrelationskoefficient mellem to halvdele.

Fordele:

1. Her gentager vi ikke testen eller bruger den parallelle form, og testen testes derfor ikke to gange. Som sådan er overføringseffekten eller øveffekten ikke der.

2. I denne metode er svingningerne i individets evne på grund af miljømæssige eller fysiske forhold minimeret.

3. På grund af en enkelt administration af testen forstyrrer de daglige funktioner og problemer ikke.

4. Vanskeligheden ved at konstruere parallelle former for test elimineres.

Begrænsninger:

1. En test kan opdeles i to lige halvdele på en række måder, og korrelationskoefficienten kan i hvert tilfælde være anderledes.

2. Denne metode kan ikke bruges til at estimere pålideligheden af ​​hastighedsprøver.

3. Da lest er administreret en gang, kan chancelfejlene påvirke scorerne på de to halvdele på samme måde og således have en tendens til at gøre pålidelighedskoefficienten for høj.

4. Denne metode kan ikke bruges i magtest og heterogene test.

Til trods for alle disse begrænsninger betragtes split-halvmetoden som det bedste af alle metoder til måling af testpålidelighed, da dataene til bestemmelse af pålidelighed opnås ved lejlighedsvis og dermed reducerer tid, arbejdskraft og vanskeligheder, der er involveret i tilfælde af anden eller gentagen administration.

4. Metode for rationel ækvivalens:

Denne metode er også kendt som "Kuder-Richardson Pålidelighed" eller "Inter-Item Consistency". Det er en metode baseret på en enkelt administration. Det er baseret på sammenhæng i svar på alle elementer.

Den mest almindelige måde at finde inter-item konsistens på er gennem formlen udviklet af Kuder og Richardson (1937). Denne metode gør det muligt at beregne interkorrelationen mellem punkterne i testen og korrelationen af ​​hvert element med alle testens elementer. J. Cronbach kaldte det som intern koefficient.

I denne metode antages det, at alle elementer har samme eller lige sværhedsværdi, er sammenhængen mellem elementerne ens, alle elementer måler i det væsentlige samme evne, og testen er homogen i naturen.

Ligesom split-halve metode giver denne metode også en måling af intern konsistens.

Den mest populære formel er Kuder-Richardson, dvs. KR-21, som er angivet nedenfor:

q = - p

p = 1 - q

Et eksempel kan hjælpe os med at beregne p og q.

Eksempel 2:

60 studerende optrådte en prøve, og ud af dem har 40 studerende givet korrekt svar på et bestemt testelement.

p = 40/60 = 2/3

Det betyder, at en del af eleverne har givet korrekt svar på en bestemt prøveemne. I hvilke 20 studerende har der givet ukorrekt svar på det pågældende emne.

Således er q = 20/60 eller 1 - 40/60

For hvert emne skal vi finde ud af værdien af ​​p og q, så summeres pq over alle elementer for at få Σpq. Multiplicér p og q for hver vare og sum for alle elementer. Dette giver Σpq.

Fordele:

1. Denne koefficient giver nogle indikationer på, hvordan prøven er internt konsistente eller homogene.

2. Rationel ækvivalens er bedre end split-halvteknikken i visse teoretiske aspekter, men den faktiske forskel i pålidelighedskoefficienter fundet ved de to metoder er ofte ubetydelig.

3. Split-halve metode måler kun ækvivalensen, men den rationelle ækvivalensmetode måler både ækvivalens og homogenitet.

4. Økonomisk metode, da testen administreres en gang.

5. Det kræver heller ikke administration af to ækvivalente former for test, og det kræves heller ikke at dele testene i to lige store halvdele.

Begrænsninger:

1. Koefficienten opnået ved denne metode er generelt noget mindre end koefficienter opnået ved andre metoder.

2. Hvis prøverne ikke er meget homogene, vil denne metode give lavere pålidelighedskoefficient.

3. Kuder-Richardson og split-halve metode er ikke egnede til hastighedstest.

4. Forskellige KR formel giver forskellige pålidelighedsindeks.