OutofBagFehler

OutofBagFehler, oft als Out-of-Bag-Fehler oder OOB-Fehler bezeichnet, ist eine Schätzung der Generalisierungsleistung eines baggingbasierten Modells wie Random Forests. Beim Bagging werden für jeden Basis- bzw. Entscheidungsbaum Bootstrap-Stichproben aus dem Trainingsdatensatz gezogen. Die Stichprobe enthält im Mittel etwa 63 Prozent der Originaldaten; die verbleibenden Daten, die sogenannten Out-of-Bag-Beispiele, dienen als integriertes Validierungssample.

Zur Berechnung des OOB-Fehlers werden für jedes Datenbeispiel alle Bäume herangezogen, deren Bootstrap-Stichprobe es nicht enthält.

Vorteile: Der OOB-Fehler liefert eine interne Schätzung der Generalisierung, ohne dass ein separates Validierungsset erforderlich ist.

Einschränkungen: Die Zuverlässigkeit der OOB-Schätzung hängt von Faktoren wie Stichprobengröße, Klassenverteilung und dem verwendeten Basis‑Estimator ab.

Validierungssatz

unausgeglichenen

kostengünstige