Home

Melodeierkennung

Melodieerkennung, auch Melodierkennung genannt, bezeichnet in der Musik- und Signalanalyse die automatische Bestimmung der Melodielinie eines Audiosignals. Ziel ist es, aus einer Aufnahme eine repräsentative Kontur der Tonhöhe über die Zeit zu extrahieren, wobei monophone und polyphone Signale unterschieden werden. Bei monophonen Aufnahmen folgt die Melodiekurve meist der singbaren Linie; bei polyphonen Stücken muss die dominante Melodie oft aus Begleitung und mehrstimmigen Strukturen herausgeholt werden.

Typische Verfahren umfassen die Schätzung der Grundfrequenz (Pitch Tracking) mittels Methoden wie YIN, Autokorrelation oder spektral-harmonischen

Anwendungsgebiete reichen von automatischer Transkription über Musik-Indexierung bis hin zu Karaoke-Anwendungen und der Synchronisation von Audio

Ansätzen,
gefolgt
von
der
Extraktion
einer
Melodiekontur
und
ihrer
Glättung.
Zusätzlich
unterstützen
Onset-Detektion
und
Taktzuordnung
die
Segmentierung
in
Noten.
Robuste
Merkmale
wie
Chromagramme
(Chroma
Features)
und
chroma-basierte
Repräsentationen
dienen
der
Unabhängigkeit
von
Timbre
und
Instrumentierung.
Zur
Trennung
von
Melodie
und
Begleitung
kommen
Quelltrennung
oder
modellbasierte
Ansätze
zum
Einsatz.
Moderne
Systeme
verwenden
häufig
statistische
Modelle
(HMM,
CRF)
oder
neuronale
Netze
(CNN,
RNN,
LSTM,
Transformer),
um
Melodien
direkt
aus
Spektraldaten
oder
Zeitreihen
vorherzusagen.
mit
Notenmaterial.
Zu
den
Herausforderungen
zählen
polyphone
Begleitung,
variable
Intonation,
Vibrato,
Portamento,
Tempo-
und
Tonartwechsel
sowie
Aufnahmequalität.
Melodieerkennung
wird
im
Bereich
des
Musik-Informations-Retrieval
evaluiert,
etwa
im
Rahmen
öffentlich
verfügbarer
Benchmark-Datensätze
und
Wettbewerbe
wie
der
MIREX-Melodie-Erkennung.