OutofBagFehler
OutofBagFehler, oft als Out-of-Bag-Fehler oder OOB-Fehler bezeichnet, ist eine Schätzung der Generalisierungsleistung eines baggingbasierten Modells wie Random Forests. Beim Bagging werden für jeden Basis- bzw. Entscheidungsbaum Bootstrap-Stichproben aus dem Trainingsdatensatz gezogen. Die Stichprobe enthält im Mittel etwa 63 Prozent der Originaldaten; die verbleibenden Daten, die sogenannten Out-of-Bag-Beispiele, dienen als integriertes Validierungssample.
Zur Berechnung des OOB-Fehlers werden für jedes Datenbeispiel alle Bäume herangezogen, deren Bootstrap-Stichprobe es nicht enthält.
Vorteile: Der OOB-Fehler liefert eine interne Schätzung der Generalisierung, ohne dass ein separates Validierungsset erforderlich ist.
Einschränkungen: Die Zuverlässigkeit der OOB-Schätzung hängt von Faktoren wie Stichprobengröße, Klassenverteilung und dem verwendeten Basis‑Estimator ab.