Home

deduplicazione

La deduplicazione dei dati, o deduplicazione, è una tecnica di gestione dello spazio di archiviazione volta a eliminare duplicazioni di contenuto all'interno di un insieme di dati. Conservando una sola copia di dati identici, consente di ridurre lo spazio occupato su supporti di memorizzazione e di migliorare l’efficienza della trasmissione dei dati in reti e durante i backup.

Il principio di funzionamento si fonda sull’analisi dei dati in unità chiamate chunk o blocchi. Per ogni

Esistono diverse modalità: deduplicazione a livello di file, che elimina duplicati tra file identici, e deduplicazione

Gli ambiti di impiego principali sono i sistemi di backup, le architetture di archiviazione, le infrastrutture

pezzo
viene
calcolato
un
fingerprint
o
hash;
se
l’hash
corrisponde
a
una
copia
già
presente,
il
sistema
memorizza
solo
un’istanza
e
sostituisce
la
duplicazione
con
un
riferimento.
Questo
consente
di
conservare
l’informazione
originale
senza
duplicare
i
dati.
a
livello
di
blocchi,
che
può
rilevare
duplicazioni
all’interno
di
file
diversi.
Le
operazioni
possono
essere
inline,
cioè
eseguite
al
momento
della
scrittura,
oppure
post-processo,
eseguite
dopo
la
scrittura
sui
dati.
di
virtualizzazione
e
i
servizi
di
cloud.
I
benefici
includono
risparmio
di
spazio,
riduzione
della
banda
di
rete
e
minori
costi
di
storage.
Tra
i
limiti
vi
sono
l’overhead
computazionale,
la
gestione
complessa
dei
metadati
e,
in
alcuni
casi,
una
resa
non
proporzionale
se
i
dati
sono
già
poco
ridondanti;
inoltre
la
perdita
di
metadati
di
deduplicazione
può
influire
sull’integrità
se
non
adeguatamente
protetta.