Home

unüberwachtes

Unüberwachtes Lernen, fachsprachlich auch als unüberwachtes Lernen (englisch unsupervised learning) bezeichnet, ist eine Form des maschinellen Lernens, bei der Modelle Muster, Strukturen oder Regularitäten in Datensätzen entdecken, ohne auf vorab gelabelte Beispiele zurückzugreifen. Im Gegensatz zum überwachten Lernen liegen keine Zielgrößen oder Klassenlabels vor; das Modell muss die sinnvolle Struktur der Daten selbst ableiten.

Zu den typischen Aufgaben gehört das Clustering, also die Gruppierung ähnlicher Instanzen. Die Hauptmethoden umfassen K-Means,

Anwendungsfelder reichen von der Kunden- oder Nutzersegmentierung, über Anomalieerkennung und Vorverarbeitung von Features bis hin zur

Die Evaluierung unüberwachter Modelle erfolgt häufig über interne Metriken wie dem Silhouette-Index oder dem Davies-Bouldin-Index; externe

Verwandte Konzepte sind semi-überwachtes Lernen, bei dem geringe Mengen gelabelter Daten genutzt werden, und selbstüberwachtes Lernen,

DBSCAN
oder
hierarchische
Verfahren;
die
Dimensionsreduktion
durch
PCA,
t-SNE,
UMAP;
Dichte-
und
Wahrscheinlichkeitsmodelle
wie
Gaussian
Mixture
Models;
sowie
Merkmals-
oder
Repräsentationslernen
mittels
Autoencoder
oder
selbstorganisierender
Netze.
Entdeckung
von
Strukturen
in
Bild-,
Ton-
oder
Textdaten.
In
der
Praxis
dient
unüberwachtes
Lernen
oft
der
Exploration,
Hypothesengenerierung
oder
als
Vorstufe
für
anschließendes,
supervisiertes
Lernen
(z.
B.
durch
Pretraining).
Validierung
ist
schwierig,
da
es
keine
eindeutigen
Ground-Truth-Labels
gibt.
Herausforderungen
sind
die
Bestimmung
der
richtigen
Anzahl
von
Clustern,
die
Interpretierbarkeit
der
Ergebnisse
und
die
Gefahr,
Muster
in
Artefakten
statt
in
sinnvollen
Strukturen
zu
erkennen.
das
durch
automatisch
generierte
Aufgaben
Labels
ableitet.
Unüberwachtes
Lernen
bildet
oft
eine
Grundlage
für
Deep-Learning-Anwendungen,
insbesondere
im
Kontext
der
Repräsentationsbildung.