dataduplicering - Infinite Lexicon - Infinite Lexicon

dataduplicering

Dataduplicering is het voorkomen of ontstaan van meerdere kopieën van dezelfde gegevens binnen een informatiesysteem of tussen systemen. Het kan bewust gebeuren, bijvoorbeeld bij redundante backups, denormaliseerde datamodellen in datawarehousing of wanneer dezelfde klant- of productinformatie in meerdere applicaties wordt opgeslagen. Het kan ook onbedoeld ontstaan door integratieverschillen, foutieve synchronisatie, of ETL-processen die niet eenduidig reconciliëren.

De aanwezigheid van data duplicaten heeft verschillende gevolgen. Opslagkosten nemen toe; maar ook wordt de data

Vormen van duplicatie omvatten exacte duplicaten (identieke rijen of bestanden), evenals near-duplicates waarbij vergelijkbare maar niet

Beheer en mitigatie vereist doorgaans een combinatie van normalisatie, master data management en governance. Technieken omvatten

In business intelligence en datawarehouse-omgevingen wordt duplicatie soms bewust geaccepteerd of geprefereerd voor prestatie- en analysetoepassingen,

gegevenskwaliteit

gesynchroniseerd.

Deduplicatietools

opslaggebaseerde

duplicatieniveaus

inconsistenties