Surrogaatkoodit
Surrogaatkoodit ovat keinotekoisia koodeja, joita käytetään korvaamaan todellisia arvoja tietojoukoissa, jotta arkaluontoista dataa voidaan analysoida ilman suoraa tunnistettavuutta. Ne toimivat korvaavina tunnisteina alkuperäiselle tiedolle, kuten nimekkeille, osoitteille tai asiakasnumeroille. Surrogaatkoodit voivat olla deterministisiä (sama syöte samaan surrogaatkoodiin) tai non-deterministisiä (jokaisella esiintymällä voi olla uusi surrogaatkoodi). Ne voivat olla globaaleja koko dataryhmälle tai rajoitettuja tiettyyn tutkimukseen tai järjestelmään.
Käytännössä surrogaatkoodit laaditaan esimerkiksi hajautusta tai salaukseen perustuvia tokenisointeja käyttämällä, tai satunnaisia koodeja luomalla. Hajautusmenetelmät ovat
Käyttökohteita ovat tutkimusdatojen jakaminen, terveydenhuollon tiedon anonymisointi, asiakasdatan analysointi sekä GDPR:n kaltaisten tietosuoja-asetusten noudattaminen. Surrogaatkoodit mahdollistavat
Tietoturva- ja hallinnolliset näkökulmat ovat keskeisiä: pääsykartoitus toteuttajille, minimointiperiaate, auditointi ja säilytysajat. Suositellaan myös privacy impact