adatgyjtemény
Az adatgyűjtemény olyan rendszer vagy állomány, amely adott célhoz kapcsolódó adatok összegyűjtött és rendezett halmazát képezi. Gyakran adatkészletnek vagy adathalmaznak is nevezik; a hangsúly az adatok szervezésén és a későbbi elemzésre való felkészítésen van. Az adatgyűjtemény lehet strukturált, például táblázatos adatokkal, vagy részben strukturált, például szabad szövegeket tartalmazó állományokkal.
Kialakításához gyakran az adatok gyűjtése, tisztítása, normalizálása és a leíró metaadatok megadása járul hozzá. A leggyakoribb
Az adatminőség és a jogi megfelelés érdekében elvégzik az adatok tisztítását, duplikátumok kizárását, hiányzó értékek kezelését
Az adatgyűjtemények alapot adnak tudományos kutatásokhoz, statisztikai elemzésekhez, döntéstámogatási rendszerekhez és gépi tanulási feladatokhoz. A megbízhatóság
Adatgyűjtemények kezelését és megosztását jogi előírások szabályozzák, így például a GDPR és más adatvédelmi rendelkezések kerülnek