Standardfejl for middelværdien

Efter at have læst denne artikel vil du lære om standard af den gennemsnitlige.

Statistisk indledning hjælper os også til at teste hypotesen om, at "statistikken baseret på prøven ikke er signifikant forskellig fra befolkningsparameteren, og at forskellen, hvis nogen bemærket kun skyldes tilfældig variation" .

Standardfejl af middelværdien (SE M eller σ M )

Standardfejl af middelværdien (SE M ) er ret vigtigt at teste repræsentativiteten eller troværdigheden eller betydningen af ​​middelværdien.

Antag at vi har beregnet den gennemsnitlige score på 200 drenge i 10. klasse i Delhi i Numerical Ability Test til at være 40. Således er 40 middelværdien af ​​kun én prøve trukket fra befolkningen (alle drengene læser i klasse X i Delhi).

Vi kan lige så godt tegne forskellige tilfældige prøver af 200 drenge fra befolkningen. Antag at vi tilfældigt vælger 100 forskellige prøver, hver prøve bestående af 200 drenge fra samme population og beregne middelværdien af ​​hver prøve.

Selvom 'n' er 200 i hvert tilfælde, er 200 drenge valgt tilfældigt for at udgøre de forskellige prøver ikke identiske, og så på grund af udsving i prøveudtagning vil vi få 100 middelværdier fra disse 100 forskellige prøver.

Disse middelværdier vil have en tendens til at afvige fra hinanden, og de ville danne en serie. Disse værdier udgør prøveudtagningsfordelingen af ​​midler. Det kan udtrykkes matematisk, at disse prøvemidler distribueres normalt.

De 100 middelværdier (i vores eksempel) vil falde i en normal fordeling omkring M pop, M- popen er middelværdien af ​​prøveudtagningen af ​​midler. Standardafvigelsen for disse 100 prøveorganer kaldes SE M eller Standardfejl af middelværdien, som vil være lig med standardafvigelsen for befolkningen divideret med kvadratroden af ​​(prøveformat).

SE M viser spredningen af ​​prøveorganerne omkring M pop . Således er SE M et mål for variabilitet af prøveorganerne. Det er et mål for divergens af prøveorganer fra M pop . SE M er også skrevet som σ M.

Standard fejl af middelværdien (SE M eller σ M ) beregnes ved hjælp af formlen (for store prøver)

(A) Beregning af SE M i store prøver :

hvor σ = standardafvigelse af befolkningen og

n = antal tilfælde inkluderet i prøven

(Som vi sjældent har SD af en population, for σ bruger vi værdien af ​​SD af prøveorganerne).

Konfidensinterval:

De to konfidensintervaller, dvs. 95% og 99%, anvendes generelt. RA Fisher navngiver grænserne for konfidensintervallet, som indeholder parameteren som "fiduciary limits" og betegner den tillid, der er placeret i intervallet som fiduciary sandsynlighed.

(a) 95% af konfidensinterval:

Med henvisning til tabellen over arealet under normal kurve finder vi, at 95% af sager ligger mellem M ± 1, 96 SE M. At vi er 95% sikre eller korrekte at sige M pop ville ligge i intervallet M + 1, 96 SE M og M + 1, 96 SE M og vi er 5% forkert at sige at M pop vil ligge ud side dette interval.

Med andre ord sandsynligheden for at M pop er i området M ± 1, 96 SE M er 95% (eller .95), og sandsynligheden for at M pop ligger uden for området er 5% (eller .05). Værdien, 1, 96 er den kritiske værdi ved .05 niveau af betydning.

(b) 99% af konfidensinterval:

Med henvisning til tabellen over arealet under normal kurve finder vi, at 99% af sager ligger mellem M ± 2, 58 SE M. At vi er 99% sikre eller korrekte at sige M pop ville ligge i intervallet M - 2.58 SE M og M + 2.58 SE M, og vi er 1% forkert at sige at M pop vil ligge uden for dette interval.

Med andre ord sandsynligheden for at M pop er i området M ± 2, 58 SE M er 99% (eller .99), og sandsynligheden for, at M pop er uden for området, er 1% (eller .01). Værdien, 2, 58 er den kritiske værdi ved .01 niveau af betydning.

Her finder vi, at niveauet af betydning er omvendt relateret til omfanget af præcision. I 05-niveau af betydning ville vi være præcise i 95% af tilfældene og i .01-niveau af betydning ville vi være præcise i 99% af lettere.

Tabellen angivet nedenfor vil forudgå dig yderligere:

Eksempel 1:

Den gennemsnitlige og SD på 225 drenge i klasse XII i Delhi i en test af Numerisk Evighed var henholdsvis 48 og 6. Hvor godt betyder det dette repræsenterer M pop eller skøn M pop . (n = 225, σ = 6, middel = 48]

Ved at henvise til tabellen over normalfordeling (tabel A) finder vi, at alle de fleste (99, 7) tilfælde ligger i ± 3σ. I tilfælde af vores eksempel vil alle prøveorganer ligge mellem M pop + 3σ m og M pop - 3σ M. Så vil ethvert prøve middelværdi være bedst 3σ m mindre end M pop på 3σ M mere end M pop .

Således hvis vi kender værdien af ​​σ M, kan vi konkludere om M- popen fra vores sample mean. Her er 4 standardafvigelsen for fordelingen af ​​prøveorganer, som vores gennemsnit er en. Alle prøveorganerne, der normalt fordeles rundt M pop, ligger mellem M pop + 3 SE M og M pop - 3 SE M.

3 SE M = 3 x .4 = 1, 2

Selv om vi ikke kender den nøjagtige værdi af M pop, kan vi i det mindste sige med tillid, at M pop ligger imellem

(48 -1, 2) og (48 + 1, 2) eller 46, 8 → 49, 2

Fra tabel A finder vi, at 95% af lettere ligger mellem ± 1, 96 σ. I tilfælde af vores eksempel er 95% konfidensinterval for M pop- områder fra M - 1, 96 SE M til M + 1, 96 SE M.

Nu, 1, 96 SE M = 1, 96 x .4 = .78

. . . M-1, 96 SE M = 48 - .78 = 47, 22 og M + 1, 96 SE M = 48 + .78 = 48, 78

. . . 95% konfidensinterval spænder fra 47, 22 til 48, 78. 99% konfidensintervallet for M pop spænder fra M - 2, 58 SE M til M + 2, 58 SE M.

Nu er 2, 58 SE M = 2, 58 X, 4 = 1, 03

. . . M - 2, 58 SE M = 48 -1, 03 = 46, 97 og M + 2, 58 SE M = 48 + 1, 03 = 49, 03

. . . 99% konfidensinterval for M pop- områder fra 46, 97 til 49, 03.

Eksempel 2:

Middelværdien og SD'en på 400 elever i en test viste sig at være 42 og 8. Kan du estimere gennemsnitlig score for befolkningen med både 99% og 95% konfidensinterval?

Opløsning:

(i) 95% konfidensinterval for M popområder fra M - 1, 96 SE M til M + 1, 96 SE M.

Nu 1, 96 SE M = 1, 96 x .4 = .784

. . . M-1, 96 SE M = 42 -784 = 41, 22

og M + 1, 96 SE M = 42 + .784 = 42, 78 (op til to decimaler).

Således ligger 95% konfidensinterval fra 41, 22 til 42, 78. Vi er 95% nøjagtige, at M pop ligger mellem 41, 22 og 42, 78.

(ii) 99% konfidensinterval for M popområder fra M - 2, 58 SE M til M + 2, 58 SE M

Nu er 2, 58 SE M = 2, 58 x 4 = 1, 03

. . . M - 2, 58 SE M = 42-1, 03 = 40, 97

og M + 2, 58 SE M = 42 + 1, 03 = 43, 03

Således ligger 99% konfidensinterval fra 40, 97 til 43, 03. Vi er 99% sikre på, at M pop ligger mellem 40, 97 og 43, 03.

Eksempel 3:

Midlerne og SD'en af ​​en prøve på 169 drenge i en test af Numerisk Evighed er henholdsvis 50 og 6:

(i) Bestem 95% intervallet for populationens middel og fortolke det.

(ii) Bestem den acceptable prøveudtagningsfejl ved .05 og .01-niveauet.

(iii) Bestem 99% konfidensinterval for M pop .

Opløsning:

M = 50

(i) 95% konfidensinterval for Mp 0p spænder fra M - 1, 96 SE M til M + 1, 96 SE M.

Nu 1, 96 SE m = 1, 96 x .46 = .90

Således M-1, 96 SE M = 50 -90 = 49, 10

og M + 1, 96 SE M = 50 +90 = 50, 90

. . . 95% konfidensinterval for M pop- områder fra 49, 10 til 50, 90. Fra stikprøveindretningen på 50 anslår vi M- popen til at være en vis fast værdi i mellem 49, 10 og 50, 90 og ved at sige, så er vi 95% sikre.

Med andre ord vil vores gennemsnitsmiddel på 50 ikke gå glip af M- popen med mere end .90, og det gælder for 95 tilfælde på 100. Alternativt vil kun i 5 tilfælde på 100 vores sample gennemsnit på 50 savne M pop ved mere end .90.

(ii) Kritisk værdi ved .05 niveau af betydning = 1, 96

Kritisk værdi ved .01 niveau af betydning = 2, 58

"Prøvetagningsfejl = kritisk værdi x SE M "

Således er prøveudtagningsfejl ved .05-niveau af betydning 1, 96 SE M og at ved .01-niveau af betydning er 2, 58 SE M

Acceptabel prøveudtagningsfejl ved .05 niveau = 1, 96 SE M = 1, 96 x .46 = .90

Tilladelig prøveudtagningsfejl ved .01 niveau = 2, 58 SE M = 2, 58 X .46 = 1, 19

(iii) 99% konfidensintervallet ligger fra M - 2, 58 SE M til M + 2, 58 SE M

Nu er 2, 58 SE M = 2, 58 X, 46 = 1, 19

Således M-2, 58 SE M = 50-1, 19 = 48, 81

og M + 2, 58 SE M = 50 + 1, 19 = 51, 19

99% konfidensinterval spænder fra 48, 81 til 51, 19.

Eksempel 4:

For en given gruppe på 500 soldater er den gennemsnitlige AGCT-score 95, 00 og SD er 25.

(ii) Bestem .99 konfidensintervallet for det ægte gennemsnit.

(ii) Det er usandsynligt, at det sande middel er større end hvad værdi?

Opløsning:

(i) 99% konfidensintervallet ligger fra M - 2, 58 SE M til M + 2, 58 SE M.

Nu er 2, 58 SE M = 2, 58 x 1, 12 = 2, 89

Således M-2, 58 SE M = 95, 0-2, 89 = 92, 11

og M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89

. . . 99% konfidensinterval spænder fra 92, 11 til 97, 89.

Fra vores prøveværktøj på 95, 0 estimerer vi det sande middelværdi for at være en fast værdi i mellem 92, 11 og 97, 89 og i så fald er vi 99% sikre.

(ii) Vores prøve gennemsnit på 95, 0 vil ikke gå glip af det sande middel med mere end 2, 89 dvs. den sande er ikke større end 97, 89.

(B) Beregning af SE M i lille prøve:

Det er konventionelt at kalde enhver prøve større end 30 som stor prøve. Når N er stor, er det ikke umagen værd at foretage korrektionen. Men når N er "lille" (mindre end 30), er det tilrådeligt at bruge (N - 1), og det er absolut nødvendigt, når N er ret lille - sig mindre end 10.

Den studerende skal huske (i) at teoretisk (N - 1) altid skal bruges, når SD skal være et skøn over befolkningen a; og at (ii) sondringen mellem "stor stikprøvestatistik" og "lille stikprøvestatistik" i form af et skæringspunkt på N = 30 er vilkårlig og delvis er et spørgsmål om bekvemmelighed.

Når N er mindre end ca. 30, skal formlen for σ M eller SE M læses:

Eksempel 5:

Efter fem studerende har sikret scorer i en test:

Bestem grænserne for 95% konfidensgrænse for populationens gennemsnit.

Scorerne er - 11, 13, 9, 12, 15:

Opløsning:

M = 12

Her df = n-1 = 5-1 = 4

Ved henvisning til tabel D med df = 4 er t- værdien ved .05-niveauet af betydning (dvs. 95% konfidensniveau) 2, 78.

95% konfidensintervallet definerer M ± 2, 78 SE M

2, 78 SE M = 2, 78 x 1, 0 = 2, 78

M - 2, 78 SE M = 12 - 2, 78 x 1, 0 = 9, 22 og

M + 2, 78 SE M = 12 + 2, 78 x 1, 0 = 14, 78

. . . Grænserne for 95% konfidensinterval er 9, 22 og 14, 78.

Det betyder at P = .95 at M pop ligger i intervallet 9.22 til 14.78.

Eksempel 6:

Ti foranstaltninger af reaktionstid til lys er taget fra en praktiseret observatør. Middelværdien er 175, 50 ms (millisekunder) og S er 5, 82 ms. Bestem .95 konfidensinterval for M pop ; .99-konfidensintervallet.

Opløsning:

n = 10, S = 5, 82 ms, M = 175, 50 ms

Df (frihedsgrader) til rådighed for bestemmelse af t er (n - 1) eller (10 - 1) = 9

(i) Bestemmelse af 95% (eller 95) konfidensinterval:

Indtastning af tabel D med 9 df, vi læser, at t = 2.26 ved .05 punktet.

95% konfidensinterval for M popområder fra M - 2.26 SE M til M + 2.26 SE M.

Nu 2, 26 SE M = 2, 26 x 1, 84 = 4, 16

Således M-2.26 SE M = 175.50 -4.16 = 171.34

og M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66

. . . 95% konfidensinterval for M pop- områder fra 171, 34 til 179, 66. P er .95, at M-popen er mindst 171, 34 eller højere end 179, 66. Hvis vi konkluderer, at M pop ligger inden for dette interval, skal vi i en lang række eksperimenter have ret 95% af tiden og forkert 5%.

(ii) Bestemmelse af 99% (eller .99) konfidensinterval:

Indtastning af tabel D med 9 df læser vi, at t = 3, 25 ved .01 point. 99% konfidensinterval for M pop- områder fra M - 3, 25 SE M til M + 3, 25 SE M.

Nu 3, 25 SE M = 3, 25 x 1, 84 = 5, 98

Således M - 3, 25 SE M = 175, 50 - 5, 98 = 169, 52

og M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48

. . . 99% konfidensinterval for M pop- områder fra 169, 52 til 181, 48.

P er .99, at M-popen er mindst 169, 52 eller højere end 181, 48. Hvis vi konkluderer, at M pop ligger inden for dette interval, skal vi over en lang række eksperimenter være lige -99% af tiden og forkerte 1%.

Pålydelser vedrørende anden statistik:

Da al statistik har stikprøvefordelinger og standardfejl kan betydningen af ​​median, kvartilafvigelse, standardafvigelse, procentdele og anden statistik fortolkes som gennemsnittet, og vi kan estimere parameteren.

(i) Standardfejl for medianen (eller SE Mdn -):

Med hensyn til SD og Q kan SE's af medianen for store prøver beregnes ved hjælp af følgende formler:

hvor σ = SD af prøven, n = størrelse af prøven og Q = kvartilafvigelse af prøven.

Et eksempel vil illustrere brugen og fortolkningen af ​​formlerne:

Eksempel 7:

På Trabue Language Scale A fremlagde 801 elleve årige drenge følgende post:

Median = 21, 40 og Q = 4, 90. Hvor godt repræsenterer denne median den median for befolkningen, hvorfra denne prøve er tegnet?

Opløsning:

n = 801, Mdn = 21, 40, Q = 4, 90.

Ved at anvende den anden formel, den

Da N er stor, kan prøveudtagningsfordelingen anses for at være normal, og konfidensintervallet findes fra den sidste linje i tabel D. 99-konfidensintervallet for Mdn-popen er 21, 40 ± 2, 58 x .32 eller 21, 40 ± .83.

Vi kan være overbevist om, at medianen af ​​befolkningen ikke er mindre end 20, 57 eller mere end 22, 23. Dette snævre område viser en høj grad af troværdighed i stikprøven medianen.

(ii) Standardfejl ved standardafvigelse (SE σ ):

Standardfejlen for standardafvigelsen, som SE M, findes ved at beregne den sandsynlige divergens af prøven SD fra dens parameter (population SD). Formlen for SE σ er

Eksempel 8:

n = 400, a = 6

Hvor godt repræsenterer SD'en SD af den population, hvorfra prøven er tegnet?

Opløsning:

Når prøver er store og trukket tilfældigt fra deres befolkning, kan ovenstående formel påføres og fortolkes på samme måde som SE M.

Da N er stor, kan .99 konfidensintervallet for SD pop sikkert tages ved grænserne ± 2, 58 σ σ . Ved at erstatte σ σ har vi 6 ± 2, 58 x .21 dvs. grænserne mellem (6 - .54) og (6 + .54) eller 5, 46 og 6, 54.

Hvis vi antager at SD pop ligger mellem grænserne 5, 46 og 6, 54, skal vi have ret 99% af tiden og forkert 1%.

(iii) Standardfejl for kvartilafvigelsen (eller SE Q eller σ q ):

SE Q kan findes fra formlerne:

Eksempel 9:

n = 801, Q = 4, 90

Hvor godt repræsenterer Q denne befolkning Quartile Deviation?

Opløsning:

Ved at anvende formlen

.99-konfidensintervallet for Q- popen er fra 4, 90 ± 2, 58 x .203 dvs. fra 4, 38 til 5, 42. Dette interval viser, at prøven Q er en yderst pålidelig statistik.

(iv) Standardfejl for procentdel (eller SE% eller σ%):

Giv den procentvise forekomst af en adfærd, spørgsmålet opstår ofte om, hvor meget tillid vi kan placere i figuren. Hvor pålideligt et indeks er vores procentdel af forekomsten af ​​den adfærd, som vi er interesserede i? For at besvare dette spørgsmål,

Vi må beregne SE af en procentdel med formlen:

hvori

p = den procentvise forekomst af adfærd, q = (1 - p)

n = antal sager.

Eksempel 10:

I en undersøgelse af bedrageri blandt grundskolebørn viste sig 100 eller 25% af de 400 børn fra boliger med høj socioøkonomisk status at have snydt på forskellige tests. Hvor godt repræsenterer det befolkningsprocenten?

Opløsning:

p = 25% (procent forekomst)

q = 75% (100% - 25%)

99% konfidensinterval for befolkningsprocenten ligger fra

25% ± 2, 58 x 2, 17%.

25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%

og 25% + 2, 58 x 2, 17% = 25% + 5, 60 = 30, 60%

Vi kan med 99% tillid antage, at folkeskolebørn med høj socioøkonomisk status ville snyde med mindst 19, 4% og ikke være større end 30, 60%.

(v) Standardfejl for korrelationskoefficienten (SE r eller σ r ):

Den klassiske formel for SE af a-er

(SE af en koefficient for korrelation r, når N er stor)

Eksempel 11:

n = 120, r = .60.

Hvad er grænserne for 99% konfidensinterval for befolkning r

Opløsning:

99% konfidensinterval

= r ± 2, 58 SE r = .60 ± 2, 58 SE r

= .60 ± .15 eller .45 til .75

Vigtige statistiske vilkår:

(i) Niveauer:

0, 05:

Sandsynligheden for at gå galt i 5 prøver ud af 100 prøver.

0, 01:

Sandsynligheden for at gå galt i 1 prøve ud af 100 prøver.

(ii) Tillid:

I .05 niveau af betydning har eksperimentet 95% tillid til, at dataene skal repræsentere befolkningen.

I .01-niveauet har eksperimentet 99% tillid til, at stikstatistik skal repræsentere befolkningen.

iii) Betydningsniveauer:

Før vi tester hypotesen, skal vi bestemme de kriterier, som vi ønsker at acceptere eller afvise nulhypotesen. Vi skal indstille niveauet af betydning før testen. To niveauer af betydning er generelt anvendte, nemlig .05 niveau og .01 niveau.

(a) .05 niveau af betydning:

Vi læser fra tabel A, at 95% af sagerne i en normal fordeling falder inden for grænserne ± 1, 96 SE M. Hvis vi sætter grænserne specificeret af M ± 1, 96 SE M, definerer vi et interval, hvor konfidensniveauet er .95. Baseret på vores vurdering, som i størrelsen af ​​M pop på disse grænser, står vi for at være ret 95% af tiden og forkert 5%.

Området mellem - 1, 96 SE M og + 1, 96 SE M er kendt som acceptområdet for H o og området ud over - 1, 96 SE M og + 1, 96 SE M er kendt som afvisningsområdet. Hvis en prøve betyder løgn i acceptområdet, accepterer vi H o . Ved afvisning af H o indrømmer vi, at stikprøven kan falde udenfor ± 1, 96 SE M.

Således ved at afvise H o gør vi 5% fejl, fordi i 5% ud af 100 lettere kan en sådan prøve forekomme. Vi er villige til at tage så meget som 5% risiko ved at afvise H o, når det er tilfældet. Kriteriet for at afvise H o er således skinnet niveauet af betydning.

(b) .01 niveau af betydning:

Vi læser fra tabel A, at 99% af lempene i en normal fordeling falder inden for grænserne ± 2, 58 SE M. Hvis vi sætter grænserne specificeret af M ± 2, 58 SE M, definerer vi et interval, hvor konfidensniveauet er .99. Basere vores vurdering om størrelsen af ​​M pop på disse grænser, står vi for at være ret 99% af tiden og forkert 1%.

Området mellem - 2, 58 SE M og + 2, 58 SE M ville være acceptområdet for H 0, og området uden for det ville være området for afvisning af H o . Vi er villige til at tage så meget som 1% risiko ved at afvise H o når det er tilfældet.

.01 niveau af betydning er mere krævende end .05 niveauet fordi i .01 niveau fejlen i afvisning H o er 1% mens i .05 niveau sådan fejl er 5%.

(iv) t-distribution:

Når N er mindre end ca. 30, dvs. når prøven er lille, kaldes prøveudtagningsfordelingen " t- distribution".

T-fordeling adskiller sig ikke meget fra det normale, medmindre N er ret lille. Når N forøges i størrelse, nærmer t- fordeling sig mere og mere tæt på den normale form.

Egenskaber ved t-distribution:

1. Det ligner en klokkeformet kurve. Men fordelingen er mere variabel med null skævhed og 'Ku' større end 3.

2. Det er symmetrisk omkring linjen t = 0.

3. Det er unimodalt med maksimale ordinat ved t = 0.

4. Når N er lille ligger t- distributionen under den normale kurve, men kurvens haler eller ender er højere end de tilsvarende dele af den normale kurve.

5. Enhederne langs basislinjen for t- distributionen er faktisk σ-score, dvs.

(v) Frihedsgrader (df):

Begrebet frihedsgrader er meget vigtigt i små stikprøvestatistikker. Det er også afgørende i analysen af ​​varians og i andre procedurer. Frihedsgrader betyder frihed til at variere.

Lad os vælge fem point, hvis gennemsnit skal være 15. Nu antages de fire scorer er 18, 10, 20, 15. For gennemsnittet at være lig med 15, skal den femte score være 12. Vi har selvfølgelig frihed til at vælge fire scorer.

Men vi har ingen frihed til at vælge den femte score, fordi den femte score gør justeringer i variationen frembragt af de første fire scoringer og med en antagelse om, at gennemsnittet vil være 15. Her indføres N = 5 og en restriktion dvs. Middelværdien skal være 15. Derfor er graden af ​​frihed N-1 eller 4.

Hvis vi har 5 point 5, 6, 7, 8 og 9, er gennemsnittet 7; og afvigelserne fra vores score fra 7 er - 2, - 1, 0, 1 og 2. Summen af ​​disse afvigelser er nul. Af de 5 afvigelser kan kun 4 (N - 1) vælges "frit" som betingelsen om, at summen lig nul straks begrænser værdien af ​​den femte afvigelse.

SD'en er selvfølgelig baseret på kvadraterne af afvigelserne omkring gennemsnittet. Der er N df til beregning af middelværdien, men kun (N - 1) tilgængelig for 'S' (SD), da en df går tabt ved beregning af middelværdien.

I et andet eksempel, hvor N = 10, blev df til estimering af M pop givet som 9 eller (N - 1), dvs en mindre end antallet af observationer, nemlig 10. En df går tabt ved beregning af M og i overensstemmelse hermed kun 9 er tilbage til estimering af M pop ved hjælp af 'S' og t-distributionen.

Når en statistik bruges til at estimere en parameter, er reglen, at den tilgængelige df er lig med N minus antallet af parametre, der allerede er estimeret fra prøven. M er et estimat af M pop og ved beregning af det taber vi 1 df .

Ved estimering af en rs pålidelighed, for eksempel (som afhænger af afvigelserne fra to midler), er df (N - 2). I tilfælde af chi-square test og variansanalyse adskilles adskilte procedurer ved bestemmelse af df .

(vi) Null hypotesen:

Nulhypotesen er et nyttigt redskab til at teste betydningen af ​​forskelle. Denne hypotese hævder, at der ikke er nogen sand forskel mellem to befolkningsmidler, og at forskellen mellem prøveorganer derfor er utilsigtet og ubetydelig.

Nulhypotesen er relateret til det juridiske princip om, at "en mand er uskyldig, indtil han er blevet skyldig." Det er en udfordring, og eksperimentets funktion er at give fakta en chance for at afvise (eller undlade at afvise) denne udfordring.

For at illustrere, antages det hævdes, at "instruktionsstandarder for enkeltskiftskoler er bedre end dobbeltskiftskolerne". Denne hypotese er vagt udtalt og kan ikke testes præcist.

Hvis vi hævder, at "single shift skoler ikke giver bedre instruktionsstandarder end dobbeltskift skole" (den sande forskel er nul). Denne null hypotese er nøjagtig og kan testes. Hvis vores nullhypotese ikke er skattepligtig, skal den afvises. Manglende forskel erklæringen forudsætter, at de to grupper bliver testet og fundet at være ens.

Nulformen foretrækkes af de fleste erfarne forskerpersonale. Denne form for erklæring definerer lettere den matematiske model, der skal anvendes i den statistiske hypotesestest.

En null hypotese er aldrig bevist eller bestridt. Det kan accepteres eller afvises med en vis grad af selvtillid (eller på et visst niveau).

Før vi tester en hypotese skal vi tage hensyn til følgende:

1. Hvorvidt prøven er stor eller lille.

2. Hvad er niveauet af betydning.

3. Hvorvidt testen er en to-tailed test eller en-tailed test.

(vii) Fejl ved afgivelser:

Mens man accepterer eller afviser null hypotese, er der mulighed for at begå to typer fejl og lyst regnes med af forskerne.

Hvad der kaldes Type I og Type II fejl kan forklares nedenfor:

Type I fejl:

Sådanne fejl er forpligtet, når vi afviser en null hypotese ved at markere en forskel signifikant, selv om der ikke er nogen sand forskel. Antag at forskellen mellem to befolkningsorganer (M pop -M pop = 0) faktisk er nul. (For eksempel kan drenge og piger betragtes som den samme population med hensyn til de fleste mentale tests). Hvis test af betydning af to prøveorganer afspejler en kendsgerning, at forskellen i befolkningsmidler er signifikant, begår vi Type I-fejl.

Type II fejl:

En sådan type fejl er begået, når vi accepterer en null-hypotese ved at markere en forskel, der ikke er signifikant, selv om der er en sand forskel. Antag, at der er en sand forskel mellem de to befolkningsmidler.

Hvis vores test af betydning anvendt på de to prøvemidler betyder, at vi tror at forskellen i befolkningsmidler betyder ikke, at vi begår en type II-fejl.

Forskellige forholdsregler kan træffes for at undgå begge slags fejl. Hvis vi opstiller et lavt niveau af betydning (P er større end .05), øger vi sandsynligheden for type I-fejl. hvorimod, hvis vi opretter et højt niveau af betydning (P er mindre end .05), vil Type I fejlene være mindre. Muligheden for at tegne fejlagtige afledninger af type II sorteres, når vi sætter et meget højt niveau af betydning.

(viii) To-tailed og One-tailed tests af betydning:

I nullhypotesen kan forskelle mellem opnåede midler (dvs. M 1 - M 2 ) være enten plus eller minus. Ved bestemmelse af sandsynligheder tager vi begge haler af prøveudtagningsfordelingen.

(ix) kritisk forhold (CR):

Kritisk forhold (CR) findes ved at dividere forskellen mellem prøveorganerne ved dets standardfejl (CR = D / SE D ). Når N'er af prøverne er store (30 eller mere er "store"), er distributionen af ​​CR'er kendt som normal omkring den sande forskel mellem befolkningsorganerne, t er et kritisk forhold, hvor et mere præcist estimat af σ D anvendes. Prøvetagningsfordelingen af ​​t er ikke normal, når N er lille (mindre end 30 siger), t er en CR; men alle CR'er er ikke t'er.

To-tailed test:

1. I to-tailed test tager vi hensyn til både den normale kurves haler.

2. I tilfælde af non-tailed alternative hypoteser foretager vi en to-tailed test.

3. Eksempel:

En interesse test administreres til bestemte drenge i en faglig. Uddannelsesklasse og til visse drenge i en latinsklasse. Er den gennemsnitlige forskel mellem de to grupper signifikant på .05-niveauet?

4. Prøveværdien afviger fra M pop i enten retning + eller -.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. Værdi at være betydelig:

1, 96 ved .05 niveau

2, 58 ved .01 niveau

7. Afvisningsområdet er delt i begge ender (haler) af normal kurve (dvs. 05 til .025 og .025, 01 til .005 og .005).

One-tailed test:

1. Vi skal tage en høj dvs. i venstre eller højre side af normal kurve.

2. I tilfælde af retningsmæssig alternativ hypotese laves en-tailed test viz., M 1 > M 2 . I så fald er retningen meget klar - ensidig.

3.Example:

Ti emner gives 5 på hinanden følgende stier ved en ciffer-symboltest, hvor kun scorerne for stier 1 og 5 er vist. Er den gennemsnitlige gevinst fra første til sidste prøve væsentlig?

4. Prøveværdien afviger fra populationsmidlet i en retning.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 eller M 1 <m 2

6. Værdi at være betydelig:

1, 62 ved .05 niveau

2, 33 på .01 niveau

7. Der er et afvisningsområde i højre hale af fordelingen eller venstre hale af fordelingen.