L1regressie

L1regressie, ook wel Lasso-regressie genoemd, is een methode voor lineaire regressie waarbij een L1-penalty op de regressiecoëfficiënten wordt toegepast. Het doel is een model te construeren dat zowel een goede fit heeft als zo weinig mogelijk niet-nuttige kenmerken bevat. Het optimaleβ wordt gevonden door te miniseren: minβ ||y − Xβ||2^2 + λ ||β||1, waarbij ||β||1 = Σj |β_j| en λ ≥ 0 een afstemmingsparameter is.

De L1-penalty bevordert sparsiteit: veel β_j worden exact nul, waardoor enkel geselecteerde kenmerken overblijven. Dit leidt

Oplossing en implementatie: het optimalisatieprobleem is convex maar niet differentieerbaar bij nul, waardoor speciale algoritmen nodig

Voor- en nadelen: voordelen zijn automatische variabele selectie en betere interpretatie bij hoge-dimensionaliteit. Nadelen zijn onder

Geschiedenis en verwantschappen: Lasso werd in 1996 geïntroduceerd door Tibshirani. In Bayesian termen komt de L1-penalty

interpreteerbare

invoervariabelen

standaardiseren,

schaalafhankelijk

λ

λ

λ

gegeneraliseerde

coëfficiënten.