3 trin med normalisering af data

Nogle af de vigtige faser, der er involveret i processen med normalisering af data, er som følger:

Der er flere måder at gruppere dataelementer i tabeller på. Databasedesigneren ville være interesseret i at vælge den måde, der sikrer ingen uregelmæssigheder i datagruppering. Disse uregelmæssigheder omfatter data redundans, tab af data og falske relationer i data.

Image Courtesy: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

Normalisering sigter mod at eliminere uregelmæssighederne i data. Normaliseringsprocessen omfatter tre faser, hvor hvert trin genererer et bord i normal form.

1. Første normale form:

Det første trin i normalisering er at sætte alle gentagne felter i separate filer og tildele passende taster til dem.

Med eksemplet på indkøbsordrebehandling kan følgende dataelementer identificeres i en købsordre:

Leverandør ID

Leverandørens navn

Adresse

Købsordrenummer

Dato

Betalingsbetingelser

Forsendelsesvilkår

S. nr.

Produktkode

Beskrivelse

Måleenhed

Pris

Antal bestilt

Beløb

Som beskrevet ovenfor gentages forsendelsesvilkårene for hver S. nr. Og der vil være flere af registreringer for det i hver købsordre. I den første fase af normalisering placeres de gentagne dataelementer i separate tabeller. Således deler vi dataelementerne i to tabeller som vist nedenfor:

Nøgleelementelementerne er vist med store bogstaver. Tabellen er nu i den første normale form (INF), fordi alle gentagne dataelementer (felter) er i et separat bord (tabel 1.2), og hentningstasterne er blevet tildelt til hver tabel. Da der er to nøgleelementer i begge tabellerne, kan man sige, at hver tabel har sammensatte / sammensatte nøgler. Denne proces med normalisering har forenklet dataene.

2. Anden normal form:

I dette trin af normalisering er alle ikke-nøgleelementer, der er fuldt specificeret af noget andet end den komplette nøgle, placeret i en separat tabel. Normalt er disse ikke-nøgleelementer afhængige af kun en del af en sammensat nøgle.

Under hensyntagen til tabel 1.1, en sammensat nøgle bestående af leverandør ID og indkøbsordren nr. bliver brugt. De nøgleelementer som leverandørens navn og adresse er dog kun afhængige af leverandør-id og ikke på indkøbsordrenummer. Således placeres disse ikke-centrale dataelementer i separate tabeller sammen med nøgledataelementet-leverandør-id.

På samme måde er de ikke-centrale dataelementer som dato, betalingsbetingelser og forsendelsesbetingelser kun afhængige af købsordrenummer. og er således placeret i et separat bord sammen med indkøbsordren nr. som nøgleelement. Nu har vi tre tabeller i stedet for tabel 1.1:

På samme måde kan vi opdele Tabel 1.2 ved at adskille ikke-centrale elementer som beskrivelse, måleenhed og pris, der kun afhænger af en produktkode i en tabel. Ligeledes er produktkoden, mængden og mængden afhængig af indkøbsordren og S. nr. Placeret i et separat bord.

Den anden normale formular (2NF) er klar nu, og der er fem tabeller.

3. Tredje normal form:

Denne fase af normalisering muliggør eliminering af overflødige dataelementer og tabeller, der er undergrupper af andre tabeller. De overflødige elementer er de ikke-centrale dataelementer, der er placeret i mere end en tabel af de virtuelle dataelementer.

De virtuelle dataelementer er de elementer, hvis værdi kan beregnes ved hjælp af andre elementer, når og når værdien kræves. Værdien af mængdataelementet i tabel 1.2.2 kan beregnes ved at multiplicere mængden med prisen og derved eliminere sådanne overflødige dataelementer.

Hvis der også opretholdes en anden tabel, kaldet leverandørens hovedtabel, i databasen, er det sandsynligt, at tabel 1.1.2 ville være en delmængde af leverandørens masterbord. Således kan denne tabel også elimineres.

Den tredje normale formular (3NF) tilbyder gruppering af data, der er enkel, let vedligeholdt og med minimum redundans.

Således kan normalisering bidrage til at reducere redundans samt eliminere andre uregelmæssigheder i data. Den tre-trins normaliseringsproces, der er diskuteret ovenfor, er kun suggestiv. Yderligere forsøg kan udføres under udformningen af databaser, om nødvendigt baseret på dataernes karakter.