Gyldighed af en test: 6 Typer

Følgende seks typer af gyldighed er almindeligt anvendte, f.eks. Ansigtsgyldighed, Indholdsgyldighed, Prediktiv validitet, Samtidig, Konstruer og Faktorisk validitet. Ud af disse er indholdet, prædiktiv, samtidig og konstruktiv validitet de vigtige, der anvendes inden for psykologi og uddannelse.

Disse diskuteres nedenfor:

Type # 1. Ansigtsgyldighed:

Ansigtsgyldighed i det omfang testen ser ud til at måle, hvad der skal måles.

Ansigtsgyldighed refererer til, hvorvidt en test synes at være gyldig eller ej, dvs. fra udvendigt udseende, om emnerne synes at måle det ønskede aspekt eller ej. Hvis en test måler, hvad testforfatteren ønsker at måle, siger vi, at testen har gyldighed. Ansigtsgyldighed refererer således ikke til, hvad testen måler, men hvad testen ser ud til at måle. Testets indhold skal ikke tydeligvis være uhensigtsmæssigt irrelevant.

For eksempel skal en test til måling "Færdighed i tillæg" kun indeholde elementer på tilføjelse. Når man går gennem emnerne og føler, at alle emnerne synes at måle færdighederne, så kan man sige, at testen er valideret af ansigt.

Selv om det ikke er en effektiv metode til at vurdere validiteten af ​​en test og som sådan ikke altid bruges, kan den bruges som et første trin i valideringen af ​​testen. Når testen er valideret på ansigt, kan vi fortsætte videre med at beregne validitetskoefficienten.

Desuden hjælper denne metode en testmaskine til at revidere testemnerne for at passe til formålet. Når en test skal konstrueres hurtigt eller når der er et presserende behov for en test, og der ikke er tid eller omfang til at bestemme gyldigheden ved hjælp af andre effektive metoder, kan ansigtets gyldighed bestemmes.

Denne type gyldighed er ikke tilstrækkelig, da den opererer på ansigtsniveau og dermed kan bruges som en sidste udvej.

Type # 2. Indhold Gyldighed:

Indhold Gyldighed en proces, der matcher testelementerne med de instruktionsmål.

Indholdsgyldighed er det vigtigste kriterium for brugen af ​​en test, især af en præstationsprøve. Det kaldes også som rationel gyldighed eller logisk gyldighed eller kurrikulær gyldighed eller intern gyldighed eller intrinsisk gyldighed.

Indholdsgyldighed refererer til graden eller omfanget af en test består af elementer, der repræsenterer de adfærd, som testproducenten ønsker at måle. Hvorvidt en prøve er sande, der er repræsentativ for hele indholdet og målene for undervisningen, kaldes testens indholdsvaliditet.

Indholdsgyldigheden estimeres ved at evaluere relevansen af ​​testelementerne; dvs. testelementerne skal behørigt dække alle indholds- og adfærdsmæssige områder af det træk, der skal måles. Det giver idé om emne eller ændring i adfærd.

På denne måde refererer indholdsgyldigheden til, i hvilket omfang en test indeholder elementer, der repræsenterer den adfærd, vi skal måle. Prøveelementerne skal indeholde alle relevante karakteristika for hele indholdsområdet og målene i den rigtige andel.

Før testen udarbejdes, udarbejder prøveproducenten en tovejs tabel over indhold og mål, der i almindelighed er kendt som "Specifikationstabel".

Antag en præstationstest i matematik er forberedt. Det skal indeholde genstande fra Algebra, Aritmetik, Geometri, Mensuration og Trigonometri, og desuden skal emnerne måle de forskellige adfærdsmæssige mål som viden, forståelse, færdighed, ansøgning mv. Derfor er det afgørende, at der skal gives vægt på forskellige indholdsområder og mål.

Et eksempel på 'specifikationstabel' i matematik er vist i følgende tabel:

Tabel afspejler prøven af ​​læringsopgaver, som skal måles. Jo tættere testemnerne svarer til den specificerede prøve, desto større er muligheden for at have tilfredsstillende indholdsgyldighed. Derfor er det ønskeligt, at emnerne i en test screenes af et ekspertgruppe. De bør kontrollere, om placeringen af ​​de forskellige elementer i cellerne i tabellen er passende, og om alle celler i tabellen har et passende antal elementer.

Tilstrækkeligheden skal bedømmes i forhold til den vægt, der er givet til den forskellige indholdsbaserede tabel i henhold til ekspertgruppen, der har udarbejdet læseplanen.

Nogle generelle punkter for at sikre indholdets gyldighed er angivet nedenfor:

1. Test skal tjene det krævede niveau af studerende, hverken over eller under deres standard.

2. Sprog skal være op til niveauet af studerende.

3. Alt, der ikke er i studieplanen, bør ikke medtages i testartikler.

4. Hver del af studieordningen skal gives den nødvendige vægtning. Flere elementer skal vælges fra mere vigtige dele af læseplanen.

Begrænsninger:

1. Den vægt, der skal gives til forskellige dele af indholdet, er subjektiv.

2. Det er vanskeligt at konstruere den perfekte objektive test.

3. Indholdsgyldighed er ikke tilstrækkelig eller tilstrækkelig til test af Intelligence, Achievement, Attitude og til en vis grad tests af Personlighed.

4. Vægt givet på forskellige adfærdsændringer er ikke objektiv.

Type nr. 3. Forudsigende gyldighed:

Prediktiv gyldighed, hvorvidt test forudsiger fremtidens præstationer for eleverne.

Prediktiv validitet vedrører prædiktiv kapacitet af en test. Det angiver effektiviteten af ​​en test i prognoser eller forudsige fremtidige resultater i et bestemt område. Testbrugeren ønsker at forudsige en persons fremtidige præstationer. Testresultater kan bruges til at forudsige fremtidig adfærd eller ydeevne og dermed kaldes som forudsigende validitet.

For at finde forudsigelig gyldighed korrelerer testen testresultaterne med testens efterfølgende ydeevne, teknisk kendt som "Kriterium". Kriteriet er en uafhængig, ekstern og direkte måling af det, som testen er designet til at forudsige eller måle. Derfor er det også kendt som "kriteriumrelateret gyldighed".

Den prædiktive eller empiriske validitet er defineret af Cureton (1965) som et estimat af korrelationskoefficienten mellem testresultaterne og det sande kriterium.

Et eksempel kan tydeliggøre konceptet bedre.

Eksempel:

Medicinsk indgangstest er opbygget og administreret for at vælge kandidat til optagelse i MBBS kurser. Baseret på de score, som kandidaterne har lavet på denne prøve, indrømmer vi kandidaterne.

Efter afslutningen af ​​kurset vises de ved den endelige MBBS eksamen. Resultatet af den endelige MBBS-eksamen er kriteriet. Partituret af indgangstest og afsluttende eksamen (kriterium) er korreleret. Høj korrelation indebærer høj prædiktiv validitet.

Lignende eksempler som andre rekrutteringsprøver eller indgangstest i landbrug, teknik, bank, jernbane mv. Kan her nævnes, som skal have høj forudsigelsesgyldighed.

Det er test, der anvendes til rekruttering, klassificering og adgangsundersøgelse skal have høj prædiktiv validitet. Denne type gyldighed betegnes undertiden som "Empirisk validitet" eller "Statistisk validitet", da vores evaluering primært er empirisk og statistisk.

Begrænsning:

Hvis vi får et passende kriterieforanstaltning, som vores testresultater skal korreleres med, kan vi bestemme den forudsigelige validitet af en test. Men det er meget svært at få et godt kriterium. Desuden kan vi ikke få kriterieforanstaltninger til alle typer psykologiske test.

Type nr. 4. Samtidig gyldighed:

Samtidig gyldighed korrelerer testresultaterne med et andet sæt kriterier.

Samtidig gyldighed refererer til, i hvilket omfang testresultaterne svarer til allerede etableret eller accepteret præstation, kendt som kriterium. For at kende gyldigheden af ​​en nybygget test er den korreleret eller sammenlignet med nogle tilgængelige oplysninger.

Således valideres en test mod nogle samtidige tilgængelige oplysninger. Scorerne opnået fra en nybygget test er korreleret med forudbestemt testydelse. Antag, at vi har udarbejdet en test af efterretninger.

Vi administrerer det til en gruppe elever. Stanford-Binet testen administreres også til samme gruppe. Nu test scores lavet på vores nybyggede test og testresultater foretaget af elever på Stanford-Binet Intelligence Test er korrelerede. Hvis korrelationskoefficienten er høj, siges vores intelligensprøve at have høj samtidig gyldighed.

Ordbogen betegnelsen "samtidige" er "eksisterende" eller "udført på samme tid". Således anvendes udtrykket "samtidig gyldighed" til at indikere processen for validering af en ny test ved at korrelere sine scoringer med en eksisterende eller tilgængelig informationskilde (kriterium), som kunne være opnået kort før eller kort efter den nye test er givet.

For at fastslå den samtidige gyldighed af en præstationsprøve opbygget frisk, er dens score korreleret med de score, der blev opnået af de samme studerende i deres seneste første terminal eller terminal eksamen. Således valideres en test mod nogle samtidige tilgængelige oplysninger. For at få et kriterium må vi ikke vente længe.

Den prædiktive validitet adskiller sig fra samtidig gyldighed i den forstand, at vi i tidligere gyldighed venter på fremtiden for at få kriterieforanstaltning. Men i lethed af samtidig gyldighed behøver vi ikke vente på længere huller.

Udtrykket "samtidige" her indebærer følgende egenskaber:

1. De to prøver - den, hvis gyldighed undersøges, og den med bevist gyldighed - skal dække det samme indholdsområde på et givet niveau og det samme mål

2. Befolkningen for begge prøver forbliver den samme, og de to prøver administreres i næsten samme miljøer; og

3. Præstationsdataene på begge testene kan opnås næsten samtidigt.

Denne type gyldighed er også kendt som "ekstern gyldighed" eller "funktionel gyldighed". Samtidig validitet er relevant for tests anvendt til diagnose, ikke til forudsigelse af fremtidig succes.

Type # 5. Konstruer gyldighed:

Konstruer Gyldighed omfanget er, som testen må siges at måle en teoretisk konstruktion eller psykologisk variabel.

En konstruktion er hovedsageligt psykologisk. Normalt refererer det til et træk eller en mental proces. Konstruktion validering er processen med at bestemme, i hvilket omfang en bestemt test måler de psykologiske konstruktioner, som testproducenten har til hensigt at måle.

Det angiver i hvilket omfang en test måler de abstrakte attributter eller kvaliteter, som ikke er operativt defineret.

Gronlund og Linn udtaler, "Konstruktion validering kan måske defineres som processen med at bestemme, i hvilket omfang testpræstationen kan fortolkes med hensyn til en eller flere psykologiske konstruktioner."

Ebel og Frisbie beskriver, "Construct validation er processen med at indsamle bevis for at understøtte det påstand om, at en given test faktisk måler den psykologiske konstruktion, som testproducenterne har til hensigt at måle."

Konstruktionsgyldighed er også kendt som "Psychological Validity" eller "Trait Validity" eller "Logical Validity". Konstruktionsgyldighed betyder, at testresultaterne undersøges i form af en konstruktion. Den studerer konstruktionen eller de psykologiske egenskaber, som en test måler.

I hvilket omfang testen måler personlighedstræk eller mentale processer som defineret af testmanden er kendt som testens konstruktiv validitet.

Under konstruktionen af ​​test på intelligens, attitude, matematisk egnethed, kritisk tænkning, studiekompetencer, angst, logisk begrundelse, forståelse af forståelse mv. Skal vi gå til konstruktiv validitet. Tag for eksempel 'en test af oprigtighed'.

Inden konstruktionen af ​​sådanne typer af test konfronteres prøveproducenten med spørgsmålene:

1. Hvad skal definitionen af ​​udtrykket oprigtighed være?

2. Hvilke former for adfærd kan man forvente af en person, der er oprigtig?

3. Hvilken type adfærd skelner mellem oprigtighed og uendelighed?

Hver konstruktion har en underliggende teori, der kan bæres i at beskrive og forudsige en elevs adfærd.

Gronlund (1981) foreslår følgende tre trin til bestemmelse af konstruktiv validitet:

(i) Identificere de konstruktioner, der formodes at tage højde for testpræstationen.

(ii) Afled hypoteser vedrørende testpræstation fra teorien bag hver konstruktion.

(iii) Bekræft hypoteserne ved hjælp af logiske og empiriske midler.

Det skal bemærkes, at konstruktiv validitet er inferentiel. Den bruges primært, når andre typer af validitet er utilstrækkelige til at angive testens gyldighed. Konstruktionsgyldighed er normalt involveret i studiernes vaner, påskønnelse, ærlighed, følelsesmæssig stabilitet, sympati osv.

Type nr. 6. Faktorisk gyldighed:

Faktorisk gyldighed omfanget af sammenhængen mellem de forskellige faktorer med hele testen.

Faktorial validitet bestemmes af en statistisk teknik kendt som faktor analyse. Den anvender metoder til at forklare interkorrelationer for at identificere faktorer (som kan blive verbaliseret som evner), der udgør testen.

Med andre ord anvendes metoder til interkorrelation og andre statistiske metoder til at estimere faktorial validitet. Korrelationen af ​​testen med hver faktor beregnes for at bestemme den vægt, der bidrager af hver sådan faktor til testens samlede præstation.

Dette fortæller os om faktorbelastningerne. Dette forhold mellem de forskellige faktorer med hele testen hedder den faktorielle gyldighed. Guilford (1950) foreslog, at faktorial validitet er den klareste beskrivelse af, hvad en test måler og på alle måder bør gives præference over andre typer af validitet.