klassifiseringstrær
Klassifiseringstrær er en trebasert modell brukt i maskinlæring for å tildele et datapunkt til en av forhåndsdefinerte klasser basert på egenskaper ved datapunktet. Treet består av noder (kontroll/spørsmål), grener og blader som betegner klassene. Rotnoden starter prosessen og hver intern node tester en egenskap, mens grenene representerer utfall av testen og bladene gir klassifikasjonen.
Modellen bygges ved en rekursiv, top-down splitting av dataene. Målet ved hver split er å skape undergrupper
Vanlige algoritmer er ID3, C4.5 og CART. CART bygger ofte binære trær og håndterer både numeriske og
Forbedringer skjer ofte gjennom pruning og bruk av ensemblemetoder som Random Forests og gradient boosting. Klassifiseringstrær