päätöspuu
Päätöspuu on ennustava malli, jota käytetään sekä luokitteluun että regressioon. Sen ideana on jakaa havaintojoukko yhä pienempiin ryhmiin seuraamalla ominaisuuksien ehtoja ja lopulta antamalla kuhunkin lopulliseen ryhmään kuuluvan ennusteen tai luokan. Päätöspuut ovat sekä luokittelupuita että regressiopuita, riippuen siitä, tuleeko lopputulokseksi luokka-arvoja vai jatkuvia muuttujia.
Rakenne ja tulkittavuus liittyvät toisiinsa: puu alkaa juurisolmusta, jonka testin perusteella nykyinen joukko haarautuu useampaan alisolmuun.
Oppiminen ja algoritmit: päätöspuun oppiminen on valvottua oppimista. Puun kasvu perustuu pyrkimykseen pienentää epäpuhtautta tai epäyhtenäisyyttä
Käyttö ja sovellukset: päätöspuita käytetään monilla aloilla, kuten lääketieteessä, rahoituksessa, asiakas- ja riskianalyysissä sekä verkkokauppojen segmentoinnissa.
Käytännön huomioita: päätöspuut voivat kärsiä yleistymisongelmista ja epätasapainoisesta datasta. Siksi käytetään regularisointia ja usein leikkausta (pruning)