Ikke-parametriske test: Begreber, forholdsregler og fordele

Efter at have læst denne artikel vil du lære om: - 1. Koncepter af ikke-parametriske test 2. Forudsætninger for ikke-parametriske test 3. Forholdsregler 4. Nogle ikke-parametriske test 5. Fordele 6. Ulemper.

Begreber af ikke-parametriske test:

Noget for nylig har vi set udviklingen af ​​et stort antal indledende teknikker, som ikke gør mange eller strenge antagelser om den befolkning, hvorfra vi har samplet dataene. Disse fordelingsfrie eller ikke-parametriske teknikker resulterer i konklusioner, der kræver færre kvalifikationer.

Når vi har brugt en af ​​dem, kan vi måske sige det: "Uanset befolkningens form kan vi konkludere, at ...."

De to alternative navne, der ofte gives til disse tests, er:

Distribution-Free:

Ikke-parametriske test er "distributionsfri". De antager ikke, at de undersøgte scoringer trækkes fra en befolkning fordelt på en bestemt måde, fx fra en normalt distribueret befolkning.

Når vi gør test af betydningen af ​​forskellen mellem to midler (for eksempel i CR eller t) antager vi, at scoringer, som vores statistikker bygger på, normalt fordeles i befolkningen. Hvad der egentlig gør - under null-hypotesen - er at estimere fra vores stikprøvestatistik sandsynligheden for en sand forskel mellem de to parametre.

Når N er ret lille eller dataene er meget skævt, så at antagelsen om normalitet er tvivlsom, er "parametriske metoder" tvivlsomme eller slet ikke anvendelige. Det, vi har brug for i sådanne tilfælde, er teknikker, der gør det muligt for os at sammenligne prøver og foretage afledninger eller tester af betydning uden at skulle antage normalitet i befolkningen.

Sådanne metoder kaldes ikke-parametrisk eller distributionsfri. Eksempelvis er den kvadratiske test X 2- test en ikke-parametrisk teknik. Betydningen af ​​X 2 afhænger kun af graden af ​​frihed i bordet; Der kræves ingen formodning om fordelingsform for de variabler, der er klassificeret i kategorierne af X 2- tabellen.

Rangeringsforskellen korrelationskoefficienten (rho) er også en ikke-parametrisk teknik. Når p beregnes fra scoringer rangeret i rækkefølge af fortjeneste, er den fordeling, hvorfra scorerne tages, sandsynligvis dårligt skævt, og N er næsten altid lille.

Ranking Tests:

Alternativt er mange af disse tests identificeret som "rangeringstest", og denne titel antyder deres anden primære fortjeneste: Ikke-parametriske teknikker kan anvendes med score, som ikke er nøjagtige i nogen numerisk forstand, men som i virkeligheden simpelthen rækker.

Forudsætninger for ikke-parametriske test:

En ikke-parametrisk statistisk test er baseret på en model, der kun angiver meget generelle forhold og ingen angående den specifikke form for fordelingen, hvorfra prøven blev tegnet.

Visse forudsætninger er forbundet med de fleste ikke-parametriske statistiske tests, nemlig:

1. At bemærkningerne er uafhængige

2. Den undersøgte variabel har underliggende kontinuitet;

3. Ikke-parametriske procedurer, ikke en anden hypotes om befolkningen end parametriske procedurer;

4. I modsætning til parametriske test er der ikke-parametriske test, der kan anvendes korrekt på data målt i ordinært skala og andre til data i nominel eller kategorisk skala.

Forholdsregler ved brug af ikke-parametriske test:

Ved brug af ikke-parametriske test advares eleven mod følgende bortfald:

1. Når målinger er i forhold til interval og forhold skalaer, vil omdannelsen af ​​målingerne på nominelle eller ordinære skalaer føre til tab af meget information. Derfor bør parametriske test så vidt muligt anvendes i sådanne situationer. Ved at bruge en ikke-parametrisk metode som en genvej kaster vi væk dollars for at spare pennies.

2. I situationer hvor de antagelser, der ligger til grund for en parametrisk test, er tilfredse, og både parametriske og ikke-parametriske test kan anvendes, bør valget være på parametrisk test, fordi de fleste parametriske test har større effekt i sådanne situationer.

3. Ikke-parametriske test giver uden tvivl et middel til at undgå en forudsætning om distributionens normalitet. Men disse metoder gør intet for at undgå antagelserne om uafhængighed af homoscedasticitet, hvor det er relevant.

4. Behavioral videnskabsmand skal angive null hypotesen, alternativ hypotese, statistisk test, prøveudtagning og niveau af betydning forud for indsamling af data. At kigge efter en statistisk test efter dataene er indsamlet har en tendens til at maksimere virkningerne af eventuelle chancerforskelle, der favoriserer en test over en anden.

Som følge heraf øges muligheden for at afvise nulhypotesen, når den er sand (type I-fejl). Denne forsigtighed gælder dog ligeledes for parametriske såvel som ikke-parametriske test.

5. Vi har ikke problemer med at vælge statistiske tests for kategoriske variabler. Ikke-parametriske test alene er egnet til talende data.

6. F- og t-testene anses generelt for at være robuste test, fordi overtrædelsen af ​​de underliggende antagelser ikke ugyldiggør afledningerne.

Det er sædvanligt at retfærdiggøre brugen af ​​en normal teoriprøve i en situation, hvor normalitet ikke kan garanteres ved at hævde, at den er robust under ikke-normalitet.

Nogle ikke-parametriske test:

Vi skal diskutere et par fælles ikke parametriske test.

1. Sign Test:

Tegnetesten er den enkleste af alle distributionsfrie statistikker og har et meget højt niveau af generel anvendelighed. Det kan anvendes i situationer, hvor kritisk forhold, t, test for korrelerede prøver ikke kan anvendes, fordi forudsætningerne om normalitet og homoscedasticitet ikke er opfyldt.

Eleverne er opmærksomme på, at visse forhold i forsøgets indstilling indfører elementet af forholdet mellem de to datasæt.

Disse betingelser er generelt en pre-test, post-test situation; en test og re-test situation afprøvning af en gruppe fag på to prøver dannelse af "matchede grupper" ved at parre på nogle fremmede variabler, som ikke er genstand for undersøgelse, men som kan påvirke observationerne.

I underskriftstest tester vi betydningen af ​​tegn på forskel (som plus eller minus). Denne test anvendes, når N er mindre end 25.

Følgende eksempel vil gøre os opmærksom på tegntest:

Eksempel:

Scorerne underkastes ofte under to forskellige forhold, A og B er angivet nedenfor. Anvend tegn-test og test hypotesen om at A er bedre end B.

Uden 0 (nul) har vi ni forskelle, hvoraf syv er plus.

Vi skal nu udvide binomialet, (p + q) 9

(p + q) 9 = p 9 + 9p 8 q + 36 p 7 q 2 + 84 p 6 q 3 + 126 p 5 q 4 + 126 p 4 q 5 + 84 p 3 q 6 + 36 p 2 q 7 + 9 pq 8 + q 9 .

Det samlede antal kombinationer er 2 9 eller 512. Tilføjelse af de første 3 vilkår (nemlig p 9 + 9p 8 q + 36 p 7 q 2 ), vi har i alt 46 kombinationer (dvs. 1 af 9, 9 af 8, og 36 af 7), som indeholder 7 eller flere plustegn.

Nogle 46 gange i 512 forsøg 7 eller flere plus tegn ud af 9 vil forekomme, når det gennemsnitlige antal + tegn under null-hypotesen er 4, 5. Sandsynligheden for 7 eller flere + tegn er derfor 46/512 eller .09 og er klart ikke signifikant.

Dette er en-tailed test, da vores hypotese siger, at A er bedre end B. Hvis hypotesen i starten var, at A og B er forskellige uden at specificere, hvilket er overlegen, ville vi have haft en 2-tailed test, for hvilken P = 0, 18.

Der findes tabeller, der giver antallet af tegn, der er nødvendige for betydning på forskellige niveauer, når N varierer i størrelse. Når antallet af par er så stort som 20, kan den normale kurve bruges som en tilnærmelse til binomialudvidelsen eller den anvendte x 2- test.

2. Median Test:

Median testen bruges til at sammenligne præstationen af ​​to uafhængige grupper som for eksempel en eksperimentel gruppe og en kontrolgruppe. For det første smides de to grupper sammen og en fælles median beregnes.

Hvis de to grupper er trukket tilfældigt fra samme befolkning, skal 1/2 af scoren i hver gruppe ligge over og 1/2 under den fælles median. For at teste denne nulhypotese skal vi udarbejde et 2 x 2 bord og beregne x 2 .

Metoden er vist i følgende eksempel:

Eksempel:

En klinisk psykolog ønsker at undersøge virkningerne af et beroligende lægemiddel ved hånden tremor. Fjorten psykiatriske patienter får lægemidlet, og 18 andre patienter får en uskadelig dosis. Den første gruppe er den eksperimentelle, den anden kontrolgruppen.

Stiger lægemidlet stabilitet - som vist ved lavere score i forsøgsgruppen? Da vi kun er bekymrede, hvis stoffet reducerer tremor, er det en en-tailed test.

Median test anvendt til forsøgs- og kontrolgrupper. Plus tegn angiver score over den fælles median, minus tegn scorer under den fælles median.

N = 14 N = 18

Fælles median = 49, 5

Den fælles median er 49, 5. I den eksperimentelle gruppe 4 er scorerne over og 10 under den fælles median i stedet for de 7 ovenfor og 7 nedenfor, der forventes ved en tilfældighed. I kontrolgruppen er 12 scorer over og 6 under den fælles median i stedet for de forventede 9 i hver kategori.

Disse frekvenser er angivet i nedenstående tabel, og X 2 beregnes med formlen (angivet nedenfor) med korrektion for kontinuitet:

AX 2 c på 3, 17 med 1 frihedsgrad giver ap som ligger ved .08 omkring midtvejs mellem .05 og .10. Vi ønskede at vide, om den eksperimentelle gruppes median var signifikant lavere end for kontrollen (hvilket tyder på mere stabilitet og mindre tremor).

Til denne hypotese er en en-tailed test, p / 2, cirka .04 og X2c er signifikant på 0, 5-niveauet. Havde vores hypotese været, at de to grupper adskiller sig uden at angive retningen, ville vi have haft en to-tailed test og X 2 ville have været markeret ikke signifikant.

Vores konklusion, lavet noget forsigtigt, er, at stoffet frembringer en vis reduktion i tremor. Men på grund af de små prøver og manglen på et meget vigtigt fund, ville den kliniske psykolog næsten helt sikkert gentage eksperimentet - måske flere gange.

X 2 er generelt anvendelig i median testen. Men når N 1 og N 2 er små (f.eks. Mindre end ca. 10) og X 2 test ikke er nøjagtige, og den nøjagtige metode til beregning af sandsynligheder skal anvendes.

Fordele ved ikke-parametriske test:

1. Hvis prøvestørrelsen er meget lille, kan der ikke være noget alternativ til at anvende en ikke-parametrisk statistisk test, medmindre populationsfordelingens art er nøjagtigt kendt.

2. Ikke-parametriske test gør typisk færre antagelser om dataene og kan være mere relevante for en bestemt situation. Desuden kan hypotesen, der testes ved den ikke-parametriske test, være mere hensigtsmæssig til forskningsundersøgelsen.

3. Ikke-parametriske statistiske tests er tilgængelige for at analysere data, som er iboende i rækker, samt data, hvis tilsyneladende numeriske score har styrken af ​​rækker. Det vil sige, at forskeren kun kan sige om hans eller hendes emner, at man har mere eller mindre karakteristika end en anden uden at kunne sige hvor meget mere eller mindre.

For eksempel ved at studere en sådan variabel som angst, kan vi muligvis angive, at emne A er mere ivrig end emne B uden at vide helt præcis, hvor meget mere ivrig A er.

Hvis data er iboende i rækker, eller selvom de kun kan kategoriseres som plus eller minus (mere eller mindre bedre eller værre), kan de behandles ved ikke-parametriske metoder, mens de ikke kan behandles ved parametriske metoder, medmindre usikre og, måske bliver der gjort urealistiske antagelser om de underliggende distributioner.

4. Ikke-parametriske metoder er tilgængelige for behandling af data, der blot er klassificerende eller kategoriske, dvs. måles i nominel skala. Ingen parametrisk teknik gælder for sådanne data.

5. Der findes egnede ikke-parametriske statistiske prøver til behandling af prøver udarbejdet af observationer fra flere forskellige populationer. Parametriske test kan ofte ikke håndtere sådanne data uden at kræve, at vi gør tilsyneladende urealistiske forudsætninger eller kræver besværlige beregninger.

6. Ikke-parametriske statistiske prøver er typisk meget lettere at lære og anvende end parametriske test. Desuden er deres fortolkning ofte mere direkte end tolkningen af ​​parametriske test.

Ulemper ved ikke-parametriske test:

1. Hvis alle antagelser af en parametrisk statistisk metode faktisk er opfyldt i dataene, og forskningshypotesen kan testes med en parametrisk test, så er ikke-parametriske statistiske tests spildende.

2. Graden af ​​spild er udtrykt ved effektiviteten af ​​den ikke-parametriske test.

3. En anden indvending mod ikke-parametriske statistiske tests er, at de ikke er systematiske, mens parametriske statistiske tests er blevet systematiseret, og forskellige test er simpelthen variationer på et centralt tema.

4. En anden indsigelse mod ikke-parametriske statistiske tests har at gøre med bekvemmeligheden. Tabeller, der er nødvendige for at gennemføre ikke-parametriske test, er spredt bredt og vises i forskellige formater.