Entscheidungsbäumen

Entscheidungsbäume sind eine Methode des überwachten Lernens, die Vorhersagen oder Entscheidungen anhand eines baumartigen Modells trifft. Der Baum besteht aus einem Wurzelknoten, mehreren internen Knoten, die Tests an Merkmalen durchführen, und Blättern, die die Zielwerte oder Klassen liefern. Bei Classification-Bäumen entsprechen die Blätter Klassen, bei Regression-Bäumen numerische Werte.

Der Lernprozess ist ein rekursives Teilungsverfahren: zu jedem inneren Knoten wird das beste Merkmal und ggf.

Der Baum wächst, bis Stopp-Kriterien erreicht sind, etwa Reinheit einzelner Teilmengen, Minimalanzahl von Beobachtungen in einem

Entscheidungsbäume zeichnen sich durch Interpretierbarkeit aus, sind aber empfindlich gegenüber kleinen Datensatzänderungen und neigen zu Überanpassung

Typische Anwendungen umfassen Kreditbewertung, medizinische Entscheidungsunterstützung, Kundenklassifizierung und Fraud-Erkennung. Wichtige Algorithmen sind ID3, C4.5 und CART;

Regressionfall.

Pruning-Verfahren

Einschränkungen

Entscheidungsregeln,

leistungsfähig

Ensemble-Methoden.

Boosting-Modelle