dataformaatit
Dataformaatit tarkoittavat tapoja, joilla tietoa järjestellään ja esitetään tallennusta, siirtoa tai käsittelyä varten. Ne voivat olla tekstipohjaisia (esim. CSV, JSON, XML) tai binäärisiä (esim. Avro, Parquet, protobuf), ja ne eroavat muun muassa luettavuuden, tehokkuuden ja tuen mukaan.
Tekstipohjaiset formaatit ovat usein ihmisen luettavissa ja helpompia debugata, mutta vievät enemmän tilaa kuin optimoidut binäärimuodot.
Käytännössä valinta riippuu sovelluksen vaatimuksista: tiedonsiirrossa ja API-yhteyksissä suositaan usein JSON:ia tai protobufia; analytiikassa ja sarakepohjaisessa
Työkaluilla voi muuntaa, validoida ja optimoida formaatteja. Tärkeitä huomioita ovat yhteensopivuus, suorituskyky, tallennustila, turvallisuus ja pitkän