Duplikatraten
Duplikatraten bezeichnen den Anteil von Duplikaten in einem Datensatz oder die Häufigkeit, mit der identische Elemente mehrmals auftreten. Sie dienen als Qualitäts- und Effizienzmaß in verschiedenen Anwendungsfeldern, etwa in der Genomik, der Datenspeicherung oder der Konsolidierung von Datensätzen.
In der Genomik bzw. Sequenzierung beschreibt die Duplikatrate den Anteil der Reads, die als Duplikate gelten.
In der Datenverwaltung beschreibt die Duplikat- beziehungsweise Deduplizierungsrate den Anteil der Daten, der durch das Eliminieren
In bibliografischen und Content-Datenbanken misst die Duplikatrate den Anteil der Records, die als Duplikate identifiziert und