Inhoudsopgave:
Definitie - Wat betekent gegevensontdubbeling?
Gegevensontdubbeling is een gegevenscompressietechniek waarbij overtollige of herhaalde kopieën van gegevens uit een systeem worden verwijderd. Het is geïmplementeerd in gegevensback-up en netwerkgegevensmechanismen en maakt de opslag mogelijk van één uniek exemplaar van gegevens in een database of informatiesysteem (IS).
Gegevensontdubbeling is ook bekend als intelligente compressie, single-instance-opslag, gemeenschappelijke factoren of gegevensreductie.
Techopedia legt Data Deduplication uit
Gegevensontdubbeling werkt door inkomende gegevenssegmenten te analyseren en te vergelijken met eerder opgeslagen gegevens. Als er al gegevens aanwezig zijn, verwijderen de deduplicatie-algoritmen de nieuwe gegevens en maken ze een referentie. Als er bijvoorbeeld een back-up van een documentbestand met wijzigingen wordt gemaakt, worden het vorige bestand en de toegepaste wijzigingen toegevoegd aan het gegevenssegment. Als er echter geen verschil is, wordt het nieuwere gegevensbestand verwijderd en wordt een verwijzing gemaakt. Op dezelfde manier scant een data-deduplicatie-algoritme uitgaande gegevens op een netwerkverbinding om te controleren op duplicaten, die worden verwijderd om de gegevensoverdrachtsnelheid te verhogen.