Gyldighedsperiode for en test: 5 faktorer

Denne artikel sætter lys på de fem hovedfaktorer, der påvirker gyldigheden af ​​en test. Faktorerne er: 1. Faktorer i selve testen 2. Funktionelt indhold og undervisningsprocedure 3. Faktorer i testadministration og scoring 4. Faktorer i elevers respons 5. Gruppens art og kriterium.

1. Faktorer i selve testen:

Hver test indeholder elementer og en nøje undersøgelse af testelementer vil indikere, om testen ser ud til at måle indholdsmaterialet og de mentale funktioner, som læreren ønsker at teste.

Følgende faktorer i selve testen kan forhindre testelementerne i at fungere som ønsket og derved sænke validiteten:

a) Prøvens længde:

En test repræsenterer normalt en stikprøve af mange spørgsmål. Hvis testen er for kort til at blive en repræsentativ, vil gyldigheden blive påvirket i overensstemmelse hermed. Homogen forlængelse af en test forøger både validitet og pålidelighed.

Formlen der bestemmer længden til hvilken en test kan forøges er:

Hvori:

n = antal gange en test skal forlænges

r t = pålidelighed af testen

r tc = korrelation af testen med kriteriet

r tx = gyldighed fra testen

For eksempel er pålidelighedskoefficienten for en test 0, 57 og den korrelerer .65 med lærerens bedømmelse. Hvor mange gange skal det forlænges, hvis der søges en validitetskoefficient på .80.

(b) Uklar retning:

Hvis anvisninger vedrørende hvordan man svarer på emnerne, uanset om det er tilladt at gætte og hvordan man registrerer svarene, ikke er klart for eleven, så vil gyldigheden være tilbøjelig til at reducere.

c) læsning af ordforråd og sætningsstrukturer, som er for vanskelige:

Det komplicerede ordforråd og sætningsstruktur, der er beregnet til, at eleverne tager testen, kan mislykkes i at måle aspekterne af elevernes ydeevne; hvilket sænker gyldigheden.

d) uhensigtsmæssigt vanskelighedsniveau for testemnerne:

Når testemnerne har et uhensigtsmæssigt vanskelighedsniveau, påvirker det værktøjets gyldighed. For eksempel vil manglende overensstemmelse med det problem, der er angivet i læringsresultatet, reducere gyldigheden i kriterium-refererede tests.

(e) dårlig konstruerede testartikler:

De prøveartikler, der giver utilsigtede spor til svaret, vil have en tendens til at måle elevernes opmærksomhed ved at opdage spor samt aspekter af elevers ydeevne, som i sidste ende påvirker gyldigheden.

(f) tvetydighed:

Tvetydighed i udsagn i testemnerne fører til fejlfortolkning, forskellig fortolkning og forvirring. Nogle gange kan det forvirre de bedre elever mere end de fattigere, der resulterer i forskelsbehandling af genstande i en negativ retning. Som følge heraf sænkes testens gyldighed.

(g) Test punkter, der er uegnede for de målte resultater:

Mange gange, hvad der sker, er at vi forsøger at måle visse komplekse typer præstation, forståelse, tænkning, færdigheder mv. Med testformularer, der kun er egnede til at måle faktuel viden. Dette påvirker resultaterne og fører til en forvrængning af gyldigheden.

(h) Ukorrekt arrangement af varer:

Varer i testen er generelt arrangeret i sværhedsgrad med de nemmeste ting først. Hvis de vanskelige genstande placeres tidligt i testen, kan det gøre eleverne tilbringe for meget af deres tid på disse og undlader at nå andre ting, som de kunne svare nemt.

Et sådant ukorrekt arrangement kan også påvirke gyldigheden ved at have en negativ effekt på elev motivation.

(i) Identificerbart mønster af svar:

Når eleverne identificerer det systematiske mønster af korrekt svar (f.eks. TTFF eller ABCD, ABCD) kan de klogt gætte svarene, og dette vil påvirke validiteten.

2. Funktionelt indhold og undervisningsprocedure:

Ved præstationsprøvning kan det fungerende indhold af testemner ikke kun bestemmes ved at undersøge form og indhold af testen. Læreren skal fuldt ud undervise i, hvordan man løser et bestemt problem, inden det indgår i testen.

Test af komplekse læringsresultater synes at være gyldigt, hvis testelementerne fungerer som beregnet. Hvis eleverne har tidligere erfaring med løsningen af ​​det problem, der er inkluderet i testen, er sådanne tests ikke mere et gyldigt instrument til måling af de mere komplekse mentale processer, og de påvirker således validiteten.

3. Faktorer i testadministration og scoring:

Testadministrationen og scoringsproceduren kan også påvirke fortolkningenes gyldighed fra resultaterne. F.eks. I lærerfremstillede tests kan faktorer som utilstrækkelig tid til at afslutte testen, uretfærdig hjælpe de enkelte studerende, snyde under undersøgelsen, og den upålidelige scoring af essay svar kan føre til lavere validitet.

På samme måde i standardiserede forsøg vil manglen på at følge standardretninger og tidsfrister, uautoriseret hjælp til elever og fejl i scoring, have tendens til at sænke validiteten.

Uanset om det er en lærer foretaget test eller standardiseret test, kan negative fysiske og psykiske tilstande under testtiden påvirke gyldigheden.

4. Faktorer i Elevernes svar:

Der er visse personlige faktorer, der påvirker elevernes reaktion på testsituationen og ugyldiggør testtolkningen. De følelsesmæssigt forstyrrede elever, manglende elevernes motivation og eleverne, der er bange for testsituationen, svarer måske ikke normalt, og dette kan i sidste ende påvirke gyldigheden.

Response sæt påvirker også testresultaterne. Det er testen, der tager vane, som påvirker eleverne. Hvis en test bruges igen og igen, kan dens gyldighed reduceres.

5. Gruppens art og kriteriet:

Det er allerede blevet forklaret for dig, at gyldigheden altid er specifik for en bestemt gruppe. For eksempel kan en aritmetisk test baseret på historieproblemer hjælpe os med at måle resoneringsevne i en langsom gruppe og en kombination af simpel tilbagekaldelse af information og beregningsfærdigheder i en mere avanceret gruppe.

Der er visse faktorer som alder, køn, evneniveau, uddannelsesmæssig baggrund og kulturel baggrund, der påvirker testforanstaltningerne. Derfor bør valideringsgruppens karakter finde en omtale i testmanualerne.

Kriteriumets karakter er en anden vigtig overvejelse, når man vurderer validitetskoefficienten. For eksempel vil scorer på en videnskabelig egnethedsprøve sandsynligvis give en mere præcis forudsigelse af præstation i et miljøstudie kursus.

I øvrigt er jo større ligheden mellem præstationen målt ved testen og præstationen repræsenteret i kriteriet, jo større er validitetskoefficienten.