Datenmenge
Datenmenge bezeichnet im Allgemeinen die Menge an Daten, die in einer bestimmten Quelle oder über einen Zeitraum hinweg erzeugt, gesammelt oder gespeichert wird. Die Datenmenge wird üblicherweise in Byte-Einheiten ausgedrückt, zum Beispiel Bytes, Kilobyte, Megabyte, Gigabyte oder Terabyte. In der Praxis wird der Begriff oft als Synonym für die Größe eines Datensatzes verwendet.
Ein Datensatz (Dataset) ist dagegen eine strukturierte oder semi- bzw. unstrukturiert zusammengesetzte Sammlung von Daten, die
Datenmenge bzw. Datensatz weisen unterschiedliche Merkmale auf, darunter Aufbau, Formate und Metadaten. Wichtige Kategorien sind Schema,
Anwendungsgebiete umfassen Statistik, wissenschaftliche Forschung, maschinelles Lernen und Business-Intelligence. Datensätze dienen als Trainings- oder Testdaten, Ausgangspunkt