Top 4 trin til konstruktion af en test

Denne artikel sætter lys på de fire hovedtrin i standardiseret testkonstruktion. Disse trin og procedurer hjælper os med at producere en gyldig, pålidelig og objektiv standardiseret test. De fire vigtigste trin er: 1. Planlægning af testen. 2. Forberedelse af testen. 3. Prøv testen. 4. Evaluering af testen.

Trin # 1. Planlægning af testen:

Planlægning af testen er det første vigtige trin i testkonstruktionen. Hovedmålet med evalueringsprocessen er at indsamle gyldige, pålidelige og nyttige data om den studerende.

Derfor skal vi være opmærksom på, at inden vi forbereder en test,

(1) Hvad skal måles?

(2) Hvilke indholdsområder skal inkluderes og

(3) Hvilke typer testemner skal medtages.

Derfor omfatter det første trin tre hovedhensyn.

1. Bestemmelse af målsætningerne for testning.

2. Forbereder testspecifikationer.

3. Valg af relevante varetyper.

1. Bestemmelse af målsætningerne for testning:

En prøve kan bruges til forskellige formål i en læringsproces. Det kan bruges til at måle præstationspræstationen, fremskridtene under undervisningsforløbsprocessen og bestemme det masterniveau, der opnås af eleverne. Tester tjener som et godt instrument til at måle deltagernes præstationer. Det svarer på spørgsmålene, om eleverne har den fornødne færdighed til at gå ind i kurset eller ej, hvilken tidligere viden har eleverne. Derfor skal det afgøres, om testen vil blive brugt til at måle præstationspræstationen eller den tidligere viden erhvervet af den studerende om emnet.

Test kan også bruges til formativ evaluering. Det hjælper med at fortsætte læringsprocessen, at finde ud af de umiddelbare indlæringsvanskeligheder og at foreslå sine retsmidler. Når vanskelighederne stadig er uløste, kan vi bruge diagnostiske tests. Diagnostiske test skal udarbejdes med høj teknik. Derfor skal specifikke emner til diagnosticering af specifikke vanskeligheder inddrages i testen.

Tester bruges til at tildele karakterer eller for at bestemme masteruddannelsesniveauet for de studerende. Disse summative test skal dække hele uddannelsens mål og indholdsområder. Derfor skal der tages hensyn til dette aspekt under forberedelsen af ​​en test.

2. Forberedelse af testspecifikationer:

Det andet vigtige trin i testkonstruktionen er at forberede testspecifikationerne. For at være sikker på at testen skal måle en repræsentativ prøve af de instruktionsmæssige mål og indholdsområder, skal vi udarbejde testspecifikationer. Så et udførligt design er nødvendigt for testkonstruktion. En af de mest almindeligt anvendte enheder til dette formål er 'Specification Table' eller 'Blue Print'.

Forberedelse af specifikationstabel / Blåtryk:

Udarbejdelse af specifikationskort er den vigtigste opgave i planlægningsfasen. Det fungerer som en vejledning til testkonstruktionen. Specifikationsoversigt eller 'Blåtryk' er et tredimensionelt diagram, der viser en liste over instruktionsmål, indholdsområder og typer af elementer i dens dimensioner.

Det indeholder fire hovedtrin:

(i) Bestemmelse af vægten til forskellige instruktionsmål.

(ii) Bestemmelse af vægten til forskellige indholdsområder.

(iii) Bestemmelse af varetyper, der skal medtages.

(iv) Udarbejdelse af specifikationstabellen.

(i) Bestemmelse af vægten til forskellige instruktionsmål:

Der er store opstillinger af instruktionsmål. Vi kan ikke inkludere alt i en enkelt test. I en skriftlig test kan vi ikke måle det psykomotoriske domæne og affektive domæne. Vi kan kun måle det kognitive domæne. Det er også sandt, at alle fagfolk ikke indeholder forskellige læringsmål som viden, forståelse, anvendelse og færdigheder i lige stor grad. Derfor må det planlægges, hvor meget vægt der siden skal gives til forskellige undervisningsmål. Mens vi beslutter dette, skal vi huske betydningen af ​​det specifikke mål for det pågældende emne eller kapitel.

For eksempel, hvis vi skal forberede en prøve i General Science for Class-X, kan vi give vægten til forskellige instruktionsmål som følger:

Tabel 3.1. Viser vægten givet til forskellige instruktionsmål i en test på 100 karakterer:

(ii) Bestemmelse af vægten til forskellige indholdsområder:

Det andet trin i udarbejdelsen af ​​specifikationstabellen er at skitsere indholdsområdet. Det angiver det område, hvor eleverne forventes at vise deres præstationer. Det hjælper med at få en repræsentativ prøve af hele indholdsområdet.

Det forhindrer også gentagelse eller udeladelse af enheden. Nu spørger spørgsmålet, hvor meget vægt der skal gives til hvilken enhed. Nogle eksperter siger det, det bør afgøres af den berørte lærer, der holder vigtigheden af ​​kapitlet i tankerne.

Andre siger, at det bør afgøres i henhold til det område, der er omfattet af emnet i tekstbogen. Generelt er det besluttet på grundlag af sider af emnet, den samlede side i bogen og antallet af elementer, der skal udarbejdes. For eksempel hvis en test på 100 karakterer skal udarbejdes, vil vægten til forskellige emner blive givet som følger.

Vægt af et emne:

Hvis en bog indeholder 250 sider og 100 test / emner (karakterer) skal konstrueres, vil vægten blive givet som følger:

Tabel 3.2. Tabel, der viser vægten givet til forskellige indholdsområder:

(iii) Bestemmelse af varetyperne:

Det tredje vigtige skridt i udarbejdelsen af ​​specifikationsspecifikationen er at bestemme passende varetyper. Elementer, der anvendes i testkonstruktionen, kan i vid udstrækning opdeles i to typer som objektiv typer og essay-typen. Til nogle instruktionsmæssige formål er de objektiv type elementer mest effektive, hvor som for andre er essayspørgsmålene tilfredsstillende.

Passende varetyper skal vælges i henhold til de læringsresultater, der skal måles. For eksempel når udfaldet skriver, er navngivningstilstandstyper nyttige. Hvis udfaldet er at identificere en korrekt svarvalgstype eller genkendelsestype, er elementer nyttige. Så læreren skal beslutte og vælge egnede emnetyper i henhold til læringsresultaterne.

(iv) Forberedelse af trevejsdiagrammet:

Forberedelse af trevejsdiagrammet er sidste trin i udarbejdelsen af ​​specifikationstabellen. Dette diagram vedrører instruktionsmålene for indholdsområdet og typer af genstande. I en oversigt over specifikationer er instruktionsmålene anført øverst på bordet, indholdsområder er angivet ned til venstre på tabellen, og under hvert mål er typerne af elementer listet indholdsvist. Tabel 3.3 er en model tabel af specifikation for X klasse videnskab.

Trin # 2. Forbereder testen:

Efter planlægning er forberedelsen det næste vigtige skridt i testkonstruktionen. I dette trin er testelementerne konstrueret i overensstemmelse med tabellen i specifikationen. Hver type testemne behøver særlig pleje til konstruktion.

Forberedelsesfasen indeholder følgende tre funktioner:

(i) Forberedelse af testemner.

(ii) Forbereder instruktion til testen.

(iii) Forberedelse af scoringsnøglen.

(i) Forberedelse af testelementerne:

Forberedelse af testemner er den vigtigste opgave i forberedelsestrin. Derfor skal man tage sig af med at udarbejde en testemne. Følgende principper hjælper med at udarbejde relevante testartikler.

1. Testemner skal være passende for at måle resultatet:

Testelementerne skal være konstrueret således, at de vil måle den præstation, der er beskrevet i de specifikke læringsresultater. For at prøveemnerne skal være i overensstemmelse med præstationen beskrevet i det specifikke læringsudbytte.

For eksempel:

Specifikt læringsudbytte-Kender grundlæggende termer

Test element-En person anses for overvægtig, når hans vægt er% mere end den anbefalede vægt.

2. Testemner skal måle alle typer af instruktionsmål og hele indholdsområdet:

Prøverne skal være så forberedt, at de dækker alle undervisningsmålene - Viden, forståelse, tankegang og matcher de specifikke læringsresultater og indholdsmateriale, der måles. Når varerne er konstrueret på basis af specifikationstabellen, blev varerne relevante.

3. Prøveposterne skal være fri for tvetydighed:

Objektet skal være klart. Uhensigtsmæssigt ordforråd og akavet sætningsstruktur bør undgås. Varerne skal være så formulerede, at alle elever forstår opgaven.

Eksempel:

Dårlig ting - Hvor blev Gandhi født

Bedre - i hvilken by fødte Gandhi?

4. Testelementerne skal være af passende vanskelighedsniveau:

Testelementerne skal være ordentligt vanskeligt niveau, så det kan diskriminere korrekt. Hvis emnet er beregnet til en kriterie-refereret test, skal dens vanskelighedsniveau være som det sværhedsniveau, der er angivet ved udsagnet om det specifikke læringsudbytte. Derfor, hvis læringsopgaven er let, skal testelementet være let, og hvis læringsopgaven er vanskelig, må testelementet være svært.

I en norm-refereret test er hovedformålet at diskriminere elever efter præstation. Så testen skal være så designet, at der skal være en bred spredning af testresultater. Derfor bør emnerne ikke være så lette at alle svarer korrekt, og det bør heller ikke være så svært, at alle ikke besvarer det. Varerne skal være af gennemsnitlig sværhedsgrad.

5. Testelementet skal være fri for tekniske fejl og irrelevante spor:

Nogle gange er der nogle utilsigtede spor i erklæringen af ​​emnet, som hjælper eleven til at svare korrekt. For eksempel grammatiske inkonsekvenser, verbale foreninger, ekstreme ord (altid sjældent altid) og mekaniske funktioner (korrekt sætning er længere end den forkerte). Derfor skal der tages et forsigtigt skridt for at undgå de fleste spor i forbindelse med konstruktionen af ​​en testartikel.

6. Testartikler skal være fri for race, etnisk og seksuel biashed:

Varerne skal være universelle. Der skal udvises forsigtighed for at skabe en kulturel retfærdig genstand. Under udførelsen af ​​en rolle bør alle samfundets faciliteter have lige stor betydning. Vilkårene, der anvendes i testelementet, skal have en universel betydning for alle medlemmer af gruppen.

(ii) Forberedelse af testen:

Dette er det mest forsømte aspekt af testkonstruktionen. Generelt giver alle opmærksom på konstruktionen af ​​testartikler. Så testværktøjerne vedlægger ikke retninger med testemnerne.

Men testposternes gyldighed og pålidelighed afhænger i høj grad af instruktionerne til testen. NE Gronlund har foreslået, at testmesteren skal give en klar retning omkring;

en. Formålet med testningen.

b. Tidsfristen for besvarelse.

c. Grundlaget for besvarelsen.

d. Proceduren for optagelse af svar.

e. Metoderne til at håndtere gætte.

Retning om formålet med testning:

En skriftlig erklæring om formålet med testen fastholder testens ensartethed. Derfor skal der være en skriftlig instruktion om formålet med testen før testemnerne.

Undervisning om tidspunktet for besvarelse:

Klar skæring instruktion skal leveres til eleverne om den tid, der er tilladt for hele testen. Det er også bedre at angive den omtrentlige tid, der kræves for at besvare hvert element, især i tilfælde af essay type spørgsmål. For at prøveproducenten skal vurdere, hvor lang tid det tager at tage de typer af emner, alder og evner hos eleverne og arten af ​​de forventede læringsresultater. Eksperter er af den opfattelse, at det er bedre at tillade mere tid end at fratage en langsommere elev at besvare spørgsmålet.

Instruktioner vedrørende svargrundlag:

Testproducenten skal angive en specifik retning på grundlag af hvilke de studerende vil svare på emnet. Retningen skal tydeligt angive, om eleverne vælger svaret eller leverer svaret. I matchende artikler skal der gives basis for at matche lokalerne og svarene (stater med hovedstad eller land med produktion). Særlige anvisninger er nødvendige for fortolkende poster. I essay-typen skal der gives klar retning om de forventede typer svar fra eleverne.

Instruktion om optagelse svar:

Studerende skal instrueres hvor og hvordan man registrerer svarene. Svar kan optages på de separate svarark eller på selve testpapiret. Hvis de skal svare i selve testpapiret, skal de rettes, om de skal skrive det korrekte svar eller for at angive det korrekte svar blandt de alternative. I tilfælde af at separate svarark, der bruges til at besvare testretningen, kan gives enten i testpapiret eller i svararket.

Instruktion om gætte:

Retningen skal gives til eleverne, om de skal gætte usikre ting eller ikke i tilfælde af genkendelsestype af testartikler. Hvis der ikke er angivet noget om gætteri, så vil de dristige elever gætte disse ting, og andre vil kun svare på de ting, som de er sikre på. Så de dristige elever ved en tilfældighed vil svare på nogle ting korrekt og sikre en højere score. Derfor må der gives 'retning til at gætte men ikke vilde gæt'.

(iii) Forberedelse af scoringsnøglen:

En scoringsnøgle øger pålideligheden af ​​en test. Så testmaskinen bør give proceduren for at scorere svarskriptene. Retninger skal angives, om scoringen vil blive lavet med en scoringsnøgle (når svaret er optaget på testpapiret) eller med en scoringsstensil (når svaret er optaget på særskilt svarark) og hvordan mærker vil blive tildelt testelementerne .

I tilfælde af essay type poster skal det angives, om man skal score med 'point metode' eller med 'rating' metoden. ' I punktmetoden sammenlignes hvert svar med et sæt ideelle svar i scoringen Hey. Så tildeles et givet antal point.

I vurderingsmetoden vurderes svarene på grundlag af kvalitetsgrader og bestemmer den kredit, der er tildelt hvert svar. Således hjælper en scoringsnøgle med at opnå en ensartet data om elevernes præstation. Så testmesteren skal udarbejde en omfattende scoring procedure sammen med testelementerne.

Trin # 3. Prøv ud af testen:

Når testen er forberedt, er det tid til at bekræfte testens gyldighed, pålidelighed og anvendelighed. Forsøg hjælper os med at identificere defekte og tvetydige genstande, for at bestemme testets sværhedsniveau og for at bestemme den diskriminerende effekt af emnerne.

Prøv ud omfatter to vigtige funktioner:

(en) Administration af testen.

(B) Scoring af testen.

(a) Administration af testen:

Administration betyder administration af den forberedte test på en prøve af elever. Så effektiviteten af ​​den endelige formtest afhænger af en retfærdig administration. Gronlund og Linn har udtalt, at »styringsprincippet ved administration af enhver klasseværelsetest er, at alle elever skal have en fair chance for at demonstrere, at deres opnåelse af læringsresultater er målt. ' Det indebærer, at eleverne skal have et behageligt fysisk og psykologisk miljø under testperioden. Enhver anden faktor, der kan påvirke testproceduren, bør kontrolleres.

Fysisk miljø betyder korrekt siddende arrangement, korrekt lys og ventilation og tilstrækkelig plads til opsigelse. Psykologisk miljø refererer til disse aspekter, som påvirker elevens mentale tilstand. Derfor skal der træffes foranstaltninger for at reducere elevernes angst. Prøven bør ikke administreres lige før eller efter en stor lejlighed som årlig sport på årligt drama mv.

Man bør følge følgende principper under testadministrationen:

1. Læreren skal tale så lidt som muligt.

2. Læreren bør ikke afbryde eleverne på forsøgstidspunktet.

3. Læreren bør ikke give noget råd til nogen studerende, der har bedt om noget emne.

4. Læreren skal sørge for korrekt opsigelse for at forhindre eleverne i at snyde.

(b) Scoring af testen:

Når testen er administreret og svarskripterne er opnået, er næste trin at scorere svarskriptene. En scoringsnøgle kan stilles til scoring, når svaret er på selve testpapiret Scoringsnøgle er et prøve svarskript, som de korrekte svar registreres på.

Når svaret er på et særskilt svarark på det tidspunkt, kan en scorings stencil bruges til at besvare emnerne. Scoring stencil er et prøve svar ark, hvor de rigtige alternativer er stanset. Ved at sætte scoring stencilen på eleverne svar script kan korrekt svar markeres. For essay-typer kan der gives separate instruktioner til scoring af hvert læringsmål.

Korrektion for gætte:

Når eleverne ikke har tilstrækkelig tid til at besvare prøven, eller eleverne ikke er klar til at tage testen på det tidspunkt, gætter de på det korrekte svar i genkendelsestype.

I så fald for at eliminere virkningen af ​​at gætte, anvendes følgende formel:

Men der er en mangel på enighed blandt psykometrikere om værdien af ​​korrektionsformlen for så vidt angår validitet og pålidelighed. I Ebels ord "vil hverken instruktionen eller straffen afhjælpe problemet med at gætte."

Guilford er af den opfattelse, at "når midten er udelukket i vareanalyse, er spørgsmålet om, hvorvidt de samlede scores skal rettes eller ikke rettes, ret akademiske." Lite sagt, "korrigering kan enten under eller over rette elevernes score." Holde ind se ovenstående udtalelser, bør testmesteren beslutte ikke at anvende korrektionen til gætte. For at undgå denne situation bør han give tilstrækkelig tid til at besvare testen.

Trin # 4. Evaluering af testen:

Evaluering af testen er det vigtigste trin i testkonstruktionen. Evaluering er nødvendig for at bestemme kvaliteten af ​​testen og kvaliteten af ​​svarene. Kvaliteten af ​​testen indebærer, at hvor god og pålidelig testen er? (Gyldighed og pålidelighed). Kvaliteten af ​​svarene betyder, hvilke ting der mangler i testen. Det giver os også mulighed for at evaluere testets anvendelighed i klasseværelset.

Evaluering af testen indebærer følgende funktioner:

(a) Vareanalyse.

(b) Bestemmelse af testens gyldighed.

(c) Bestemmelse af testens pålidelighed.

(D) Bestemmelse af anvendelighed af testen.

(a) Vareanalyse:

Vareanalyse er en procedure, som hjælper os med at finde ud af svarene på følgende spørgsmål:

en. Om varerne fungerer som beregnet?

b. Om testemnerne har passende sværhedsniveau?

c. Hvorvidt varen er fri for irrelevante spor og andre fejl?

d. Hvorvidt distraktorerne i flere valgtyper er effektive?

Elementanalysedata hjælper os også:

en. At danne grundlag for en effektiv diskussion af testresultatet

b. At danne grundlag for de afhjælpende værker

c. At øge færdigheden i testkonstruktion

d. For at forbedre diskussionen i klasseværelset.

Vareanalysemetode:

Vareanalyseproceduren lægger særlig vægt på varens problemniveau og elementets diskriminerende kraft.

Elementanalyseproceduren følger følgende trin:

1. Prøvepapirerne skal placeres fra højeste til laveste.

2. Vælg 27% testpapirer fra højeste og 27% fra laveste ende.

For eksempel hvis testen administreres på 60 studerende, så vælg 16 testpapirer fra højeste ende og 16 testpapirer fra laveste ende.

3. Bibeholde de andre testpapirer, da de ikke er nødvendige i vareanalysen.

4. Tabuler antallet af elever i den øverste og den nederste gruppe, der valgte hvert alternativ for hvert testelement. Dette kan gøres på bagsiden af ​​testpapiret, eller der kan bruges et separat test-punktkort (figur 3.1)

5. Beregne vareproblemer for hvert element ved hjælp af formel:

Hvor R = Samlet antal studerende fik varen korrekt.

T = Samlet antal studerende forsøgte varen.

I vores eksempel (figur 3.1) ud af 32 studerende fra begge grupperne 20 har eleverne besvaret varen korrekt og 30 studerende har prøvet varen.

Problemet er som følger:

Det indebærer, at varen har et ordentligt sværhedsniveau. Fordi det er sædvanligt at følge 25% til 75% regel for at overveje problemstillingen. Det betyder, at hvis en vare har en varighedsproblem på mere end 75%, så er det for nemt, hvis det er mindre end 25%, er varen en for vanskelig vare.

6. Beregn elementets diskriminerende effekt ved at bruge følgende formel:

Artikel diskriminerende effekt =

Hvor R U = Studerende fra øverste gruppe, der fik svaret korrekt.

R L = Studerende fra lavere gruppe, der fik svaret korrekt.

T / 2 = halvdelen af ​​det samlede antal elever, der er medtaget i elementanalysen.

I vores eksempel (figur 3.1) svarede 15 studerende fra den øverste gruppe varen korrekt, og 5 fra den nederste gruppe reagerede varen korrekt.

Et højt positivt forhold angiver den høje diskriminerende effekt. Her .63 angiver en gennemsnitlig diskriminerende kraft. Hvis alle 16 elever fra lavere gruppe og 16 elever fra øverste gruppe svarer på varen korrekt, vil den diskriminerende effekt være 0, 00.

Det indikerer, at varen ikke har nogen diskriminerende kraft. Hvis alle de 16 studerende fra den øverste gruppe svarer på varen korrekt, og alle elever fra lavere gruppe svarer på varen korrekt, så vil elementets diskriminerende effekt være 1, 00. Det angiver et emne med maksimal positiv diskriminerende effekt.

7. Find ud af effektiviteten af ​​distraktorerne. En distraktor anses for at være en god distraktor, når den tiltrækker mere elev fra den lavere gruppe end den øvre gruppe. Distraktorerne, som ikke vælges i det hele eller meget sjældent udvalgt, bør revideres. I vores eksempel (fig. 3.1) tiltrækker distraktor 'D' flere elever fra.

Øverste gruppe end den nedre gruppe. Det indikerer, at distraherer 'D' ikke er en effektiv distraherer. 'E' er en distraherer, som ikke reageres af nogen. Derfor har det også brug for revision. Distraktor 'A' og 'B' viser sig at være effektive, da det tiltrækker flere elever fra lavere gruppe.

Forbereder en test element fil:

Når elementanalyseprocessen er overstået, kan vi få en liste over effektive genstande. Nu er opgaven at lave en fil af de effektive elementer. Det kan gøres med vareanalysekort. Varerne skal arrangeres efter sværhedsbestemmelsen. Ved indsendelse af emnerne skal målene og indholdsområdet, der måles, tages i betragtning. Dette hjælper i den fremtidige brug af varen.

(b) Bestemmelse af testens gyldighed:

På evalueringstidspunktet anslås det, at i hvilket omfang testen måler, hvad testproducenten har til hensigt at måle.

(c) Bestemmelse af testens pålidelighed:

Evalueringsprocessen vurderer også, i hvilket omfang en test er konsistent fra en måling til en anden. Ellers kan resultaterne af testen ikke være pålidelige.

(d) Bestemmelse af testens anvendelighed:

Prøv ud, og evalueringsprocessen angiver, i hvilket omfang en test kan bruges i almindelig klasseværelse. Det indebærer, at hvor langt en test kan anvendes fra administration, scoring, tid og økonomi synspunkt.