ÜberwachtLernen
Überwachtes Lernen, auch bekannt als supervised learning, ist eine Gruppe von Methoden des maschinellen Lernens, bei der ein Modell eine Abbildung von Eingabedaten zu Zielwerten aus einem gekennzeichneten Datensatz erlernt. Ziel ist es, eine Funktion f zu finden, die y = f(x) möglichst gut vorhersagt, gemessen an einem Verlustmaß wie L(y, f(x)).
Es gliedert sich in Regression und Klassifikation. Bei Regression wird ein kontinuierlicher Wert vorhergesagt (z. B.
Typischer Ablauf: Datensatz mit Merkmalen X und Ziel Y; Aufteilung in Trainings-, Validierungs- und Testdaten; Modellwahl;
Beliebte Algorithmen umfassen lineare und logistische Regression, Entscheidungsbäume, Random Forests, Gradient Boosting, Support Vector Machines und
Anwendungen finden sich in Spam-Erkennung, Bild- und Spracherkennung, medizinischer Diagnostik, Finanzprognosen und Betrugserkennung.
Herausforderungen sind der Bedarf an gelabelten Daten, Datenqualität und Verzerrungen, Überanpassung und Generalisierung, Nicht-Stationarität von Daten
Bewertung erfolgt anhand geeigneter Metriken: Bei Klassifikation etwa Genauigkeit, Präzision, Recall, F1-Score und ROC-AUC; bei Regression