luokituspuiden
Luokituspuut ovat päätöspuita, joita käytetään klasifikaatiotehtävissä. Niiden tarkoituksena on ennustaa havaintojen luokka ominaisuuksien arvojen perusteella. Puun juuresta alkaa jakaminen, jossa jokaisessa solmussa valitaan ominaisuus ja mahdollinen arvo, jolla data jaetaan haluttuun suuntaan. Tämä rekursiivinen jakaminen etenee, kunnes havaintojen joukko täyttää lopullisen luokan lehdessä eli päätöspuussa. Lopulliset luokat määritellään lehdissä.
Rakentaminen perustuu mittareihin, jotka arvioivat jakamisen laatua. Yleisimmät ovat informaatiopalamisen (information gain), Gini-epäpuhtaus sekä gain ratio.
Käyttöönotossa on otettava huomioon yleistettäväksi pyrkivä pruning-osa. Ennenaikainen varhainen lopettaminen (pre-pruning) tai jälkitoimenpiteellä tehtävä pruning (post-pruning)
Käytännössä luokituspuut ovat helppoja tulkita ja soveltuvat sekä numeerisiin että kategorisiin tietoihin. Niiden vahvuuksiin kuuluu intuitiivinen