Variablenauswahl
Variablenauswahl bezeichnet den Prozess der Identifikation relevanter Prädiktoren aus einer Menge potenzieller Merkmale in statistischen Modellen. Das Ziel besteht darin, Modellkomplexität zu reduzieren, Interpretierbarkeit zu erhöhen und die Vorhersageleistung zu verbessern, ohne wesentliche Informationsinhalte zu verlieren.
Methodisch wird Variablenauswahl häufig in drei Kategorien eingeteilt: Filtermethoden, Wrapper-Methoden und eingebettete Methoden. Filtermethoden bewerten Merkmale
Wrapper-Methoden durchsuchen systematisch Merkmalsuntersets und verwenden ein zu schätzendes Modell, etwa durch Vorwärts- oder Rückwärtsauswahl; sie
Bei der Bewertung der Auswahl spielen Informationskriterien wie AIC oder BIC sowie Kreuzvalidierung eine Rolle, um
Praktisch müssen Aspekte wie Multikollinearität, Skalierung der Merkmale und Stabilität der Auswahl berücksichtigt werden. Die Zielsetzung