verisetleri
Verisetleri (datasets), analiz, model eğitimi ve testleri için kullanılan, bir araya getirilmiş veri örneklerinden oluşan koleksiyonlardır. Bir verisetinde çoğu zaman satırlar örnekleri, sütunlar ise değişkenleri temsil eder; hedef değişken varsa bu etiket veya çıktı olarak kullanılır. Yapılandırılmış verisetleri tablo şeklinde olurken, yapısal olmayan verisetleri metin, görüntü, ses gibi biçimlerde bulunabilir. Dosya biçimleri arasında CSV, TSV, JSON, XML ve Parquet gibi formatlar yaygındır.
Verisetlerinin kaynağı sensörler, deneyler, anketler, kayıt sistemleri veya simülasyonlar olabilir; farklı kaynaklar birleştirilebilir. Ayrıca bazı verisetleri,
Verisetleri, keşifsel veri analizi, istatistiksel modellleme ve makine öğrenmesi başta olmak üzere çeşitli amaçlarla kullanılır. Uygulamalarda
Önemli örnekler arasında Iris, MNIST ve CIFAR-10 gibi benchmark verisetleri ile UCI Makine Öğrenimi Deposu, OpenML