columnarformaatteja
Columnarformaatit ovat tiedostomuotoja, joissa tiedot tallennetaan sarakkeittain rivien sijaan. Tämä sarakkeittainen tallennusmuoto tukee tehokasta pakkaamista ja kyselyjä, joissa luetaan vain tarvittavat kentät, mikä pienentää I/O:a ja parantaa analyyttisen työkuorman suorituskykyä.
Ominaisuuksia ovat sarakekohtainen pakkaus ja koodaus (esim. dictionary- tai run-length-koodaus), tilastotiedot jokaisesta sarakkeesta sekä mahdollisuus lukea
Esimerkkejä ovat Parquet ja ORC. Parquet on avoin standardi, jossa tiedot jaetaan row group -lohkoihin ja jokaiselle