dataduplicering
Dataduplicering is het voorkomen of ontstaan van meerdere kopieën van dezelfde gegevens binnen een informatiesysteem of tussen systemen. Het kan bewust gebeuren, bijvoorbeeld bij redundante backups, denormaliseerde datamodellen in datawarehousing of wanneer dezelfde klant- of productinformatie in meerdere applicaties wordt opgeslagen. Het kan ook onbedoeld ontstaan door integratieverschillen, foutieve synchronisatie, of ETL-processen die niet eenduidig reconciliëren.
De aanwezigheid van data duplicaten heeft verschillende gevolgen. Opslagkosten nemen toe; maar ook wordt de data
Vormen van duplicatie omvatten exacte duplicaten (identieke rijen of bestanden), evenals near-duplicates waarbij vergelijkbare maar niet
Beheer en mitigatie vereist doorgaans een combinatie van normalisatie, master data management en governance. Technieken omvatten
In business intelligence en datawarehouse-omgevingen wordt duplicatie soms bewust geaccepteerd of geprefereerd voor prestatie- en analysetoepassingen,