5 Metoder til afbildning af frekvensfordeling

Følgende metoder anvendes almindeligt til at skildre frekvensfordeling i grafisk form: 1. Histogram eller kolonne Diagram 2. Bardiagram eller Bardiagram 3. Frekvenspolygon 4. Glatfrekvenspolygon 5. Piediagram.

Metode # 1. Histogram eller kolonne Diagram:

Det er en af ​​de mest populære og udbredte mødte havde at præsentere en frekvensfordeling. Et histogram er et sæt rektangler, hvis områder er i forhold til klassefrekvenser. Det er en graf, hvor frekvenserne er repræsenteret af søjler. Histogrammet fremkommer som en række stanggrafer placeret lodret ved siden af ​​hinanden.

Bemærk de følgende egenskaber i histogrammet:

(i) Frekvenser er langs den lodrette akse, og scorerne (CI) er langs den vandrette akse.

(ii) Man antager, at scorerne fordeles jævnt inden for klasseintervallet, hvilket giver os rektangulære søjler.

(iii) Frekvenserne inden for hvert interval af et histogram er repræsenteret af et rektangel, hvor intervallets størrelse er basen og hyppigheden af ​​dette interval højden.

(iv) Arealet af hvert rektangel i et histogram svarer til frekvensen inden for et givet interval, mens det samlede område af et histogram svarer til den totale frekvens (N) af fordelingen.

(v) Et histogram kan bedst konstrueres på et grafpapir, der styres med lige mellemliggende vandrette og lodrette linjer.

Lad os se, hvordan histogrammet til frekvensfordelingen kan konstrueres i to situationer, dvs. når klassens intervaller er lige, og når klassens intervaller er ulige.

Histogram (lige klasseinterval):

Trin 1:

I Tabel 2.12 indgår inkluderende klasser, og som et første skridt skal disse omdannes til klasser med ægte eller egentlige klassegrænser som angivet i anden kolonne i samme tabel.

Trin 2:

Generelt er en ledig klasse også tilladt i hver ende af klasserne og afspejles i to ekstreme ender af den vandrette skala, dvs. 9, 5 og 99, 5 (se figur 2.1). Dette forbedrer læsbarheden af ​​grafen og er også nyttig ved konstruktionen af ​​en frekvenspolygon.

Trin 3:

Derefter tegnes disse sande klassegrænser sammen med den vandrette akse (X-akse) ved hjælp af en passende målestok. For at give symmetri og balance til histogram eller en grafisk repræsentation, skal man være forsigtig med valget af enhedsafstande for at repræsentere klasse grænsen på X-aksen og frekvenserne på Y-aksen.

For at repræsentere disse afstande er målevægten på to akser valgt således, at histogrammets højde eller enhver anden grafisk præsentation er ca. 75 procent af dens bredde.

Trin-4:

Når den nederste grænse er en fjern score fra oprindelsen, giver du en pause i X-aksen (∫∫) for at angive, at den lodrette akse er blevet flyttet for nemheds skyld. Start derefter X-aksen med den nederste grænse for det laveste klasseinterval.

Et histogram, der repræsenterer frekvensfordelingen af ​​scoringer i tabel 2.12, er vist i figur 2.1. I denne figur er højden af ​​rektanglet dannet over klasse 19.5-29.5 4 enheder langs den lodrette skala, og dermed bliver området 4 x 1 = 4 kvadrat enheder, hvilket svarer til klassens frekvens. På samme måde tages højder af andre rektangler dannet over på hinanden følgende klasser som henholdsvis 6, 8, 12, 9, 7 og 4.

Histogram (Ujævnt klasseinterval):

For at tage et eksempel, lad os vilkårligt gruppere klasserne 150 - 154 og 155-159 i en klasse som 150 - 159 * og 185 - 189 og 190 - 194 i en klasse som 185 - 194 ** i tabel 2.13.

Klasseintervallet for fjerde og tiende klasse er dobbelt så meget som resten af ​​klasserne. Frekvenserne i disse to klasser er således ikke sammenlignelige med andre klasser. For at fastslå denne sammenlignelighed skal frekvenserne i de større klasser halveres eller divideres med to.

Således skal alle større klasser, før de danner histogram for frekvensfordeling med ulige klasseintervaller, udtrykkes som multipler af mindre klasser; og delte derefter de tilsvarende klassefrekvenser af disse multipler.

Denne division giver derefter højden af ​​rektangler som vist i tabel 2.14. Højder af andre rektangler dannet over klasser af enhedslængder forbliver dog lig med tilsvarende klassefrekvenser. Frekvensfordelingen af ​​scoringer i tabel 2.14 afspejles i figur 2.3.

Fordele:

1. Det er enkelt og let lavet.

2. Alle fordelene ved den grafiske repræsentation som vist tidligere gælder her.

Begrænsninger:

1. Det er svært at overlejre mere end et histogram på samme graf.

2. Sammenligninger af flere frekvensfordelinger kan ikke let foretages via histogrammer. Frekvenspolygoner er meget bedre egnet til dette formål.

3. Forudsætningen om, at scoren er jævnt fordelt inden for CI, giver en større fejl, når N er lille, end når N er stor.

4. Det kan ikke udglattes.

Metode # 2. Stregdiagram eller stregdiagram:

Bardiagram er en af ​​de nemmeste og mest anvendte enheder til at præsentere diskrete seriedata. Disse er særligt tilfredsstillende for kategoriske data eller serier. De består af en gruppe af ækvivalente rektangler, en for hver gruppe eller kategori af de data, hvor værdierne eller størrelserne er repræsenteret af længden eller højden af ​​rektanglerne, hvor rektanglernes bredde er vilkårlig og uvæsentlig.

Disse diagrammer kaldes endimensionelle, fordi der i sådanne diagrammer kun tages hensyn til en dimension, dvs. højden (eller længden) af rektanglerne for at præsentere de givne værdier.

Følgende punkter kan tages i betragtning for at tegne stregdiagrammer:

(i) Alle stænger, der trækkes i en enkelt undersøgelse, skal være ensartede (dog vilkårlige) bredde afhængigt af antallet af stænger, der skal trækkes og pladsen til rådighed.

(ii) Korrekt men ensartet afstand skal gives mellem forskellige stænger for at gøre diagrammet mere attraktivt og elegant.

(iii) Højden (længden) af rektanglerne eller bjælkerne er taget i forhold til størrelsen af ​​observationerne, idet skalaen vælges under hensyntagen til størrelsen af ​​den største observation.

(iv) Alle stængerne skal bygges på samme basislinie.

(v) Det er ønskeligt at skrive tallene (størrelser) repræsenteret ved stængerne øverst på stængerne for at sætte læseren i stand til at have en præcis ide om værdien uden at se på skalaen.

(vi) Stænger kan trækkes lodret eller vandret. I praksis anvendes lodrette stænger generelt, fordi de giver en attraktiv og tiltalende opstigning.

(vii) Stængerne bør så vidt muligt arrangeres fra venstre mod højre (fra top til bund i tilfælde af vandrette stænger) i størrelsesorden for at give en behagelig effekt.

I en bestemt by er det samlede antal skoler 24 og skolens ledelsesmæssige fordeling som vist i tabel 2.15.

For en diskret variabel er måleenheden på den vandrette akse ikke vigtig. Hverken er klasserne relateret til hinanden. Så stængerne er lige adskilt og har lige bredde på den vandrette akse.

Højden af ​​stængerne er imidlertid proportional med de respektive frekvenser. Streggrafer bruges ofte til billedpræsentation af diskrete data. Hvis to variabler anvendes samtidigt, kan lige så bardiagrammer være ret effektive.

For eksempel, hvis der sammen med det samlede antal skoler (ledelsesmæssigt) også skal angives antallet af drenge skoler, piger og skoler, så kan dette ske på samme grafpapir ved hjælp af forskellige farver, der hver angiver den seksuelle kategori. For hver ledelse vil der være 4 søjler med forskellige farver, der angiver forskellige kategorier.

Metode # 3. Frekvens Polygon:

En polygon er et mangevinklet nærbillede. Frekvenspolygonen er en grafisk repræsentation af frekvensfordeling, hvor midtpunktet for CI'et er tegnet mod frekvenserne.

Lad os diskutere, hvordan man tegner en frekvenspolygon:

Trin 1:

Tegn to lige linjer vinkelret på hinanden, den vertikale linje nær venstre side af papiret, den vandrette linje nær bunden. Mærk den lodrette linje (Y-akse) OY, og den vandrette linje (X-akse) OX. Sæt den O, hvor de to linjer krydser. Dette punkt er oprindelsen.

For at give symmetri og balance til polygonen skal der udvises omhu ved valg af enhedsafstande på begge akser. En god generel regel er at vælge X- og Y-enheder, som vil gøre højderne af figuren ca. 75% af bredden.

Trin 2:

Næste skal man angive midtpunktet for CI'en på den vandrette akse, i stedet for at angive grænserne for integralet. Her skal midtpunktet for intervallerne lige før det laveste interval og lige efter det højeste interval også angives (midtpunkterne 137 og 202 henholdsvis i tabel 2.16). Langs den lodrette linje markerer enhederne for at repræsentere frekvenserne af klasseintervallerne.

Trin 3:

I midten af ​​hvert interval på X-aksen går Y-retningen en afstand svarende til antallet af scoringer på intervallet. Placer punkter på disse steder.

Trin-4:

Efter plottning af alle punkterne på graffugen peges disse af en række korte lige linjer for at danne frekvenspolygonen.

Metode # 4. Glat Frekvens Polygon:

En frekvenspolygon bør udglattes:

jeg. At udjævne udilsigtede uregelmæssigheder

ii. For at få et bedre overblik over, hvordan figuren kan se ud, hvis data var mere talrige;

iii. At vide, hvordan en polygon ville se ud, hvis gruppering af fejl og prøveudtagningsfejl fjernes fra det; og

iv. For at fastslå den form, som den ville tage, hvis den repræsenterer betingelser frigivet fra mindre uheldige udsving.

Ved udjævning af en frekvenspolygon tages der en række bevægelige eller løbende gennemsnit, hvorfra nye eller justerede frekvenser bestemmes. For at finde en justeret eller udjævnet ' f, tilføj f på det givne interval og f s på de to tilstødende intervaller (intervallet lige under og intervallet lige ovenfor) og divider dem med 3.

For eksempel er den glatte f for intervallet 170-174 i 2, 17 Tabel (8 + 10 + 6) / 3 eller 8, 00. For at finde den glatte fs for de to intervaller ved fordelingens ekstremer, nemlig 140-144 og 195-199, er en lidt anden procedure nødvendig. Først tilføjer vi 0, f på trinintervallet under eller over, til f på det givne interval og til f i det tilstødende interval og divideres med 3. Den glatte f for 140-144 er (0 + 1 + 3) / 3 er eller 1, 33; og den glatte f for 195-199 er (2 + 1 + 0) / 3 eller 1, 00.

Vi må tage to CI på 135-139 og den anden 200-204, for hvilken f er taget som 0. Deres glatte f er i hvert tilfælde (0 + 0 + 1) / 3 eller .33 og (0 + 0 + 1) / 3 eller .33. Inkluderingen af ​​disse sidste to intervaller gør N = 50, 00 til den glatte distribution.

Hvis N er stor, kan udglatning muligvis ikke ændre formen af ​​en graf i høj grad og er derfor ofte unødvendig.

Fordele:

(i) Det er enkelt og let lavet.

(Ii) Det er muligt at overlejre mere end en frekvenspolygon på samme graf ved at bruge farvede linjer, brudte linjer, punkterede linjer mv.

(iii) Sammenligninger af flere frekvensfordelinger kan let foretages via frekvenspolygoner.

(iv) Alle fordelene ved den grafiske repræsentation som diskuteret tidligere er anvendelige her.

(v) Det kan glattes. Begrænsninger.

Begrænsning:

(ii) Den del af området, der ligger over et givet interval, kan ikke betragtes som proportional med frekvensen af ​​det pågældende CI på grund af uregelmæssigheder i frekvensoverfladen.

(Ii) Antagelsen om, at alle scoringerne inden for et CI falder ved midtpunktet for dette interval giver en større fejl, når N er større end N er lille.

(Iii) Det er mindre præcist end histogrammet, idet det ikke repræsenterer nøjagtigt, dvs. i forhold til område, frekvensen for hvert interval.

Den kumulative frekvensgraf:

Den kumulative frekvensgraf er en anden måde at repræsentere en frekvensfordeling ved hjælp af et diagram. Før vi kan plotte en kumulativ frekvensgraf, skal fordelingenes scores tilføjes serielt eller kumuleret som vist i tabel 2.18.

For at bestemme Cum.f for hver række skal vi fortsætte med at tilføje f s gradvist fra bunden. For at illustrere, i fordelingen af ​​scoringer er den første kumulative frekvens 1; 1 + 3, fra den lave ende af fordelingen, giver 4 som næste indgang; 4 + 2 = 6; 6 + 4 = 10 osv. Den sidste kumulative / er naturligvis til 50 eller N, den totale frekvens.

Ved plottning af frekvenspolygonen tages frekvensen på hvert interval i midten af ​​klassens interval. Men ved konstruktion af en kumulativ frekvenskurve er hver kumulativ frekvens afbildet ved den nøjagtige øvre grænse for det interval, hvorpå det falder.

Dette skyldes, at man gradvist fra bunden tilføjer hver kumulative frekvensbærer gennem til den nøjagtige øvre grænse for klasseintervallet. Med en valgt skala, hvis vi tager de øvre grænser af ci langs X-aksen og tager Cumf s langs Y-aksen, kan vi tegne en graf for den kumulative frekvensfordeling.

I en kumulativ frekvenskurve er hver kumulativ frekvens afbildet ved den øvre grænse af intervallet. For at få kurven til at begynde på X-aksen, startes den på 139, 5 (nøjagtig øvre grænse på 134, 5-139, 5), hvis kumulative frekvens er 0.

Den Kumulative Procentkurve eller Ogiv:

Ved tegning af en 'Ogive' skal vi beregne de kumulative procentfrekvenser ved den øvre grænse for hver ci 'Kumulativ procentfrekvens', hvilken procent af N er Cumf. Den kumulative procentvise kurve eller ogiv adskiller sig fra den kumulative frekvensdiagram i disse frekvenser udtrykkes som kumulative procent af N på Y-aksen i stedet for som kumulative frekvenser. Tabel 2.19 viser, hvordan kumulative frekvenser kan omdannes til procent af N.

I kolonne (1), (2) og (3) klasses intervaller er øvre grænser for ci og frekvenser angivet; og i søjle (4) er f s kumuleret fra den lave ende af fordeling opad. Disse Cum- f er udtrykt som procentdel af N i kolonne (5). Omdannelsen af ​​Cumf s til kumulative procent kan udføres ved at dividere hver kumulativ / ved N; fx 2 + 40 = .05, 6 + 40 = .15, og så videre.

En bedre metode - især når en beregningsmaskine er tilgængelig - for først at bestemme den gensidige. 1 / N, kaldet Rate, og multiplicere hver kumulativ f i rækkefølge af denne brøkdel. Som vist i tabel 2.19 er satsen 1/40 eller .025. Derfor multiplicerer vi 2 med .025, får vi .05 eller 5%; 6 X. 025 =. 15 eller 15% osv.

Kurven i figur 2.8 repræsenterer en ogiv afbildet fra dataene i kolonne (5), tabel 2.19. De nøjagtige intervalgrænser er blevet aflejret på X-aksen, og en skala bestående af 10 lige afstande, der hver repræsenterer 10% af fordelingen, er markeret på Y-aksen. Det første punkt på ogiven er placeret 5 Y enheder lige over 35, 5. Det sidste punkt er 100 Y enheder over 56, 5 eksakt øvre grænse for højeste klasse interval.

Fra ogiv kan vi læse PR. af forskellige scores og også percentilerne:

(a) Læsning af percentiler fra den ogive:

Antag at vi vil finde ud af P 2 5- Som vi ved, er P 25 et punkt under, hvor 25% af sagerne ligger. Lad os finde 25 på Y-aksen og derefter tegne en vandret linje fra dette punkt. Det vil mødes ogive på et tidspunkt.

Træk fra dette punkt en vinkelret på X-aksen. Fra X-aksen kan vi læse scoren. Fra ogiv kan vi læse, at P 2 5 = 41, 5. På samme måde kan vi læse, at P 50 = 46, 7 og P 75 = 49. Vi kan læse andre procentiler på samme måde fra ogive.

(b) Aflæsning af percentil rangering af scoringer:

Antag, at vi vil vide, at PR af en score på 53, 5. Vi skal finde denne score på X-akse og tegne en lodret linie fra dette punkt. Linjen vil mødes ogive på et tidspunkt, hvorfra vi kan tegne en vandret linje til venstre, og denne linje vil møde Y-aksen på et punkt. Vi kan læse cum% f på dette tidspunkt. Denne cum% / værdi er PR. af partituret.

Således kan vi læse det:

PR af en score, 40 = 20

PR af en score, 53 = 90.

Vi kan læse PR's af enhver anden score fra den ogive på en lignende måde.

Metode # 5. Pie Diagram:

Pie diagrammer er meget populært brugt til at angive procentdel sammenbrud. Det er såkaldt, fordi hele grafen ligner en tærte, og kageens komponenter ligner skiver, der skæres fra kagen. Det præsenterer procentdelene og ikke absolutte tal.

Pie diagrammer er meget nyttige i at vise udgifterne til en Govt., Eller af et firma mv fordelt over forskellige hoveder. Det bruges også til undervisning i Geografi, Videnskab osv.

Følgende trin kunne følges ved konstruktion af et cirkeldiagram:

1. Tegn en cirkel af passende størrelse med et kompas. Størrelsen af ​​radius afhænger af ledig plads og andre faktorer.

2. Forbered dataene i form af% under forskellige hoveder. Disse% for forskellige sektorer bør omsættes til tilsvarende grader i cirklen.

Til dette formål er det nødvendigt at finde ud af vinkelværdien af ​​hver underafdeling. Vi ved, at værdien af ​​alle vinklerne på et hvilket som helst punkt er lig med 360 °, dvs. hele cirklen er 360 °, hvilket repræsenterer 100%. Således betyder en% 360 ° / 100 = 3, 6 °.

Følgende formel gælder derfor for at finde vinkelværdien af ​​hver undergruppe:

3. Antag, at der er 3 komponenter med værdien 60% som høje præstanter, 25% som middelpræster og 15% som lavpræstationer. Derfor bør de repræsentere henholdsvis 216 ° (60 x 3, 6 °), 90 ° (25 x 3, 6 °) og 54 ° (15 x 3, 6 °).

4. Når værdierne for alle vinklerne er blevet bestemt, kan deres samlede ikke være nøjagtigt 360 ° på grund af tilnærmelsen. Hvis dette er tilfældet, skal nogle af vinkelværdien muligvis justeres lidt for at gøre summen lig med 360 °.

5. Mål punkterne på cirklen for at repræsentere størrelsen af ​​hver sektor ved hjælp af en grader. Det er en almindelig praksis at arrangere sektorer efter størrelse, med den største sektor øverst og andre i

sekvens kører med uret. Sektorerne kan mærkes. Etiketterne kan placeres inden for sektoren eller uden for cirklen.