adatkészletekkel
Adatkészlet, magyarul adatcsomag vagy állomány, az adatokat struktúrált vagy strukturálatlan formában összegyűjtő, kutatási vagy gyakorlati célokra használt gyűjtség. Az ötlet a 19. század körül fejlődött, amikor a tudományos kutatók és statisztikai intézetek először rendszerezett műveleteket végeztek parti adatgyűjtésekre. A modern számítástechnika és a digitális korrelációk előrelátása előtt az adatgyűjtés manuálisan vagy naplócartálás útján történt, szabadon elérhető vagy korlátozott pontokkal betöltve. A 20. század végén kezdődött az adatállományok elektronikailag kezelésére ösztönző kutatás, majd a 2000-es években, a webesközösségek és az open data mozgalommal együtt, a nagyméretű, publikusan elérhető adatkészletek terjedése egy új korszakot kezdett. Időközben a mesterséges intelligencia és a gépi tanulás fokozta az adatkészletek iránti keresletet és izgalmat az új elemzési módszerek és algoritmusok révén. A mai adatkészletek formátuma széles skáláját foglalja magába: CSV, JSON, SQL adatbázis, kép- és hangfájlok, valamint nyomtatott dokumentum szkennelése. Ezen formátumokat a különböző tudományos, üzleti és technológiai ágazatok használják, így az adatkészlet fogalma kritikus szerepet játszik a digitális tudományterületeken.