dataduplicatie
Dataduplicatie is het bestaan van identieke gegevens in meerdere opslagplaatsen of records. Het kan onbedoeld ontstaan bij migraties, back-ups of synchronisatie tussen systemen. Het onderscheid met replicatie is cruciaal: duplicatie betreft ongewenste data, terwijl replicatie meerdere kopieën voor beschikbaarheid impliceert; deduplicatie probeert duplicaten te verwijderen of te verminderen.
Meerdere invoerpunten registreren dezelfde data, er is vaak geen volledige consolidatie bij integratie, en back-ups kunnen
Duplicatie leidt tot hogere opslagkosten, langere back-ups en herstelprocessen, en verhoogt het risico op inconsistentie bij
Deduplicatie maakt gebruik van technieken zoals hashing en fingerprinting om identieke data te herkennen. Er zijn
Back-upomgevingen, cloudopslag, bestandssystemen en databases zijn typische plekken waar dataduplicatie optreedt. Het doel is minder opslagruimte,