Verkkodatan
Verkkodatan on yleistermi dataan liittyen internetin välityksellä syntyvästi, julkaistusta tai kerätystä aineistosta. Siihen kuuluvat sekä julkisesti saatavilla oleva verkkosisältö – teksti, kuvat, video sekä verkkosivujen metatiedot – että palveluiden tuottama data, kuten API-rajapintojen vastaukset, järjestelmien lokit sekä IoT-laitteiden ja verkkoliikenteen tapahtumat. Verkkodata voidaan luokitella rakenteelliseen, puolistrukturoituun tai epästrukturoituun sen mukaan, miten se on järjestetty.
Verkkodatan lähteet ovat moninaisia: verkkosivustot ja niiden indeksoima sisältö, hakukoneet, sosiaalinen media ja foorumit sekä viranomaisten
Käyttö ja hankinta tapahtuvat monin tavoin. Verkkodataa käytetään tutkimuksessa, liiketoiminnan analytiikassa sekä tekoälyn ja koneoppimisen koulutuksessa,
Käsittelyyn liittyy lisäksi laadunvarmistus, datan alkuperän todentaminen sekä metatietojen standardointi. Tietosuoja- ja yksilön suojan säädökset, kuten