datamatriisista
Datamatriisi on matriisi, jonka riveinä ovat havainnot ja sarakkeina muuttujat. Yleisesti sitä merkitään X ∈ R^{n×p}, missä n on havaintoja ja p muuttujien lukumäärä. Jokaisessa solussa x_{ij} on i:nnen havainnon ja j:nnen muuttujan arvo. Datamatriisi voi olla tiivis (dense) tai harva (sparse), ja sen elementit voivat olla numeerisia tai kategorisia arvoja usein enkoodattuna.
Datamatriisia käytetään tilastotieteen ja koneoppimisen perusrakenteena. Sen avulla voidaan muodostaa malleja, kuten lineaarinen regressio, monimuuttujamallit ja
Datamatriisiin liittyy usein käsitteitä kuten rivit versus sarakkeet, havainnot versus muuttujat ja puuttuvat arvot. Puuttuvien arvojen