datavektoroinnin
Datavektoroinnin on prosessi, jossa erilaiset datalähteet muunnetaan numeerisiksi vektoreiksi siten, että ne soveltuvat koneoppimis- ja tilastolliseen analyysiin. Tavoitteena on säilyttää olennaiset rakenteet ja suhteet siten, että dataa voidaan vertailla, yhdistää ja syötää mallien koulutukseen. Vektorien laatu riippuu sekä datan luonteesta että valitusta reprezentaatio‑menetelmästä.
Erot datatyyppien vektoroinnissa liittyvät siihen, miten tekijät kuten kategoria, sana tai kuva ilmaistaan numeerisesti. Kategorisille muuttujille
Datavektoroinnin tarkoituksena on muuttaa dataan liittyvät ominaisuudet siten, että ne ovat käyttökelpoisia suorituskykyisten mallien syötteinä. Oikea
Haasteita ja harkittavia tekijöitä ovat muun muassa ulottuvuuden lisääntyminen, harvajen vektorien sparsity, datan laatu ja edustus,