Home

Basformen

Basformen, auch Lemmas oder Zitierformen genannt, bezeichnet die kanonische Form eines Wortes, die als Referenzform in Wörterbüchern und in der linguistischen Analyse dient. Basformen sind die Formen, auf die inflektierte oder abgeleitete Varianten in der Linguistik zurückgeführt werden. In der Grammatik dienen sie als Basisform, die die Wortklasse und das Grundlemma repräsentiert, und in der Computerlinguistik ermöglichen sie standardisierte Repräsentationen.

Im Deutschen unterscheiden sich Basformen nach der Wortklasse. Bei Verben ist üblicherweise der Infinitiv die Basform,

In der Verarbeitung natürlicher Sprache spielt die Bestimmung der Basformen eine zentrale Rolle. Die Lemmatisierung ordnet

Beispiele: gehen → gehen; Häuser → Haus; größer → groß. See also: Lemma, Lemmatisierung, Morphologie.

z.
B.
gehen,
arbeiten,
lernen.
Die
Formen
geht,
ging,
gegangen
etc.
werden
von
diesem
Basislemma
abgeleitet.
Bei
Substantiven
ist
die
Basform
typischerweise
die
Singularnominativform,
z.
B.
Haus,
Tag,
Mädchen,
während
Pluralformen
oder
Kasusformen
davon
abgeleitet
sind.
Bei
Adjektiven
entspricht
die
Basform
dem
Positiv,
z.
B.
groß,
klein;
gesteigerte
Formen
wie
größer,
am
größten
werden
davon
gebildet.
jedes
Wort
einer
Basform
zu,
um
unterschiedliche
Flexionsformen
zu
einer
einzigen
Repräsentation
zusammenzufassen.
Dabei
müssen
unregelmäßige
Formen,
Komposita
und
mehrsprachige
Kontexte
berücksichtigt
werden.