adathalmazt
Adathalmazt vagy adathalmaz olyan adatok összességét jelenti, amelyet elemzésre, statisztikai feldolgozásra vagy gépi tanulási feladatokra gyűjtöttek össze. Gyakran felépítése rekordokból (egyedi megfigyelések) és jellemzőkből (változók, attribútumok) áll, és lehet strukturált vagy strukturálatlan.
A kifejezés gyakorlati szempontból alapvetően a készen rendelkezésre álló adatokra utal. Strukturált adathalmazok táblázatos formában jelennek
Adatminőség és előkészítés szempontjából fontos a méret, teljesség és konzisztencia. Hiányzó értékek kezelése, normalizálás, hibák kijavítása
Használatában a adathalmazt alapvetően adatok elemzésére, kijelentések vagy modellek megtanítására és értékelésére használják. Gyakori felosztás a