Home

Spaltenstores

Spaltenstores, auch spaltenorientierte Speicherstrukturen genannt, bezeichnen Speicherlayouts in Datenbanksystemen, bei denen die Werte einer Spalte separat von anderen Spalten abgelegt werden. Im Gegensatz zu Zeilenstores, bei denen alle Spalten einer Zeile hintereinander gespeichert sind, liegen die Daten in Spalten zusammenhängend vor. Diese Anordnung beeinflusst die Art der Abfragen, die Effizienz der Kompression und die Speicherzugriffe.

In einem Spaltenstore werden Spalten oft unabhängig voneinander komprimiert und mit speziellen Codierungsverfahren wie Dictionary-Encoding, Run-Length-Encoding

Zu den Vorteilen zählen geringerer Speicherbedarf durch effektive Kompression, beschleunigte Analysen auf großen Datenmengen und bessere

Spaltenstores finden Anwendung in Data-Warehouse-Systemen und analytischen Plattformen. Bekannte Beispiele reichen von reineren spaltenorientierten Datenbanken wie

oder
Bit-Packing
versehen.
Da
Abfragen
häufig
nur
wenige
Spalten
betreffen,
lässt
sich
durch
das
Auslesen
weniger
Spalten
ein
Großteil
der
Daten
vermeiden,
was
die
I/O-Belastung
reduziert
und
die
CPU-Nutzung
optimiert.
Moderne
Spaltenstores
nutzen
außerdem
vektorbasierte
Verarbeitung
und
Projektionseinschränkung
(Projection
Pushdown),
um
die
Leistungsfähigkeit
analytischer
Abfragen
zu
steigern.
Cache-Effizienz.
Sie
eignen
sich
besonders
für
OLAP-Workloads,
Data-Warehousing-Szenarien
und
analytische
Berichte.
Nachteile
sind
potenziell
langsamerer
Schreibzugriff
und
komplexere
Wartung
bei
transaktionalen
Lasten,
da
Updates
und
Inserts
oft
batchweise
oder
mit
spezialisierter
Logik
erfolgen
müssen.
MonetDB,
Vertica
und
ClickHouse
bis
zu
Dateiformaten
wie
Parquet
und
ORC,
die
spaltenweise
auf
Speicherebene
organisiert
werden
und
in
Data-Lake-Architekturen
verwendet
werden.