HyperLogLograkenteita
HyperLogLog-rakenteet ovat probabilistisia tietorakenteita, joita käytetään suurten tietojoukkojen erilaisten alkioiden lukumäärän estimointiin. Ne tarjoavat tilatehokkaan tavan arvioida, kuinka monia eri arvoja joukossa esiintyy, ilman että kaikki alkiot tallennetaan erikseen. HyperLogLog-rakenteet soveltuvat erityisesti virta- ja suurdataprojekteihin, joissa nopeus ja muistitehokkuus ovat tärkeitä.
Toimintaperiaate: Jokainen alkio hajautetaan ja hajautusarvo jaetaan m rekisteriin. Rekisteriindeksi j valitaan hajautusarvon etuosi bitin perusteella,
Parannukset ja variaatiot: HyperLogLog on kehitetty LogLog-rakenteesta parantamaan tarkkuutta ja muistinkäyttöä. HyperLogLog++ lisää pienille kartinileille tehtävää
Käyttökohteet ja rajoitukset: Käytetään laajasti verkkosivujen analytiikassa, verkkoliikenteen monitoroinnissa, tietovarastoinnissa ja massadatan deduplicointiongelmissa. Se tarjoaa nopean