Deduplicasjon
Deduplicasjon er en datareduksjonsteknikk som eliminerer dupliserte data ved å lagre bare unike innholdsenheter og referere til dem flere ganger. Den brukes i sikkerhetskopieringssystemer, arkivlagring og skyleverandører for å redusere lagringsplass og nettverkstrafikk. Deduplicasjon kan være blokkbasert (chunkbasert) eller filbasert; blokknivå gir ofte høyere reduksjon, mens filnivå er enklere å implementere.
Slik fungerer det generelt: data deles inn i blokker eller chunks. Hver blokk genererer et innholdsbart hashverdier
Fordeler inkluderer betydelig redusert lagringsbehov og båndbredde for sikkerhetskopier og replikasjon, lavere kostnader og potensielt raskere
Utfordringer og hensyn inkluderer økt CPU- og minnebruk for beregning av hash og håndtering av metadata, risiko
Viktige vurderinger inkluderer valg mellom inline og post-prosess deduplicasjon, overvåkning av dedupe-ratio og ytelse, og regelmessig