Q:
Waarom zouden managers moeten waken tegen redundantie van de database?
EEN:Databasebeheerders en andere IT-professionals moeten waken tegen "database redundantie" of "data redundantie" vanwege alle negatieve gevolgen die redundantie kan hebben in een database-systeem of omgeving. Waar een bepaald stuk gegevens wordt gedupliceerd, hetzij in twee velden in een database, hetzij in twee verschillende database-omgevingen, kan dit gevolgen hebben voor het ophalen van gegevens.
Een van de eerste redenen om gegevensredundantie te voorkomen, is dat het verspillend of buitensporig kan zijn.
Het is belangrijk erop te wijzen dat sommige soorten gegevensredundantie zijn gepland, om gegevens te beschermen en hiervan een back-up te maken. Anderen komen echter voort uit slechte of inefficiënte codering of het gebrek aan aandacht voor best practices. In veel gevallen zorgen grote hoeveelheden gegevensredundantie ervoor dat de database snel groter wordt dan een redelijke omvang. Met dit in gedachten worden veel inspanningen gedaan om gegevensredundantie te bestrijden om ruimte in een database te besparen en bijgevolg kosten en onderhoud te verminderen. Dit moet echter worden gedaan met het oog op bruikbaarheid - ingenieurs kunnen iets oefenen dat gegevensontdubbeling wordt genoemd, maar het moet op een manier worden gedaan die efficiënt is.
Databasebeheerders kunnen bijvoorbeeld iets onderzoeken zoals het weghalen van een string uit een herhaald veld, zoals een gedeelde klant of bedrijfsnaam, en deze vervangen door een eenvoudige variabele referentie waar de string ergens anders wordt bewaard. Dit kan ruimte in een database besparen, maar het kan ook meer serveractiviteit vereisen om een bepaalde query uit te voeren, dus het is mogelijk niet zo efficiënt als het lijkt.
Een andere grote reden om gegevens te dedupliceren of gegevensredundantie te vermijden, is vanwege de verwarring die kan ontstaan. Overbodige gegevens in een database kunnen verschillende soorten anomalieën veroorzaken. Een van deze wordt een update-afwijking genoemd - update-afwijkingen treden op wanneer een record opnieuw wordt ingevoerd met bijgewerkte informatie, maar de update haalt niet het oorspronkelijke record. In een dergelijke situatie kunnen er drie verschillende records zijn voor een bepaalde medewerker van het bedrijf, met drie verschillende functietitels en drie verschillende adressen, omdat de informatie van de persoon niet in de hele database is bijgewerkt, maar alleen in het record dat het laatst is ingevoerd.
Zoals experts suggereren, kunnen databasebeheerders ontwerpredundantie voorkomen. Ze kunnen ook deelnemen aan datanormalisatiepraktijken die update-anomalieën en andere soorten anomalieën kunnen repareren door de manieren te standaardiseren waarop de records van databasetabellen worden bewaard. Databasebeheerders kunnen ook gegevensontdubbeling inspanningen leveren die gegevens op andere manieren opschonen en standaardiseren. Dit alles met het doel schonere databasetabellen te maken, database-records consistenter te maken en alle hoofdpijn en complexe problemen in verband met niet-geplande gegevensredundantie te voorkomen.