Überanpassung
Überanpassung, oft als Overfitting bezeichnet, ist ein Phänomen beim maschinellen Lernen, bei dem ein Modell die Trainingsdaten zu exakt nachbildet, einschließlich Rauschen und Ausreißern, und dadurch bei neuen, ungekannten Daten schlecht generalisiert.
Ursachen sind ein Ungleichgewicht zwischen Modellkomplexität und der verfügbaren Datenmenge. Zu komplexe Modelle, eine hohe Dimensionalität,
Auswirkungen bestehen darin, dass die Modellleistung auf den Trainingsdaten sehr gut erscheint, während die Generalisierung auf
Beispiele für überangepasste Modelle sind tiefe Entscheidungsbäume, Polynomregression hohen Grades bei kleinen Datensätzen oder neuronale Netze,
Verhütungsmaßnahmen umfassen Methoden zur Begrenzung der Modellkomplexität und zur Verbesserung der Generalisierung. Dazu gehören das Aufteilen
Diagnoseinstrumente sind Lernkurven, Validierungs- versus Trainingsleistung, Bias-Varianz-Analyse und Cross-Validationsergebnisse. Durch sorgfältige Modellwahl und -bewertung lässt sich