Datenvirtualisierung
Datenvirtualisierung ist ein Ansatz der Datenintegration, der es ermöglicht, Daten aus verschiedenen, physischen Speichern über eine einzige, virtuelle Schicht abzurufen, ohne dass Daten physisch verschoben oder repliziert werden müssen. Die virtuelle Datenschicht präsentiert Nutzern und Anwendungen ein einheitliches, logisches Datenmodell.
Funktionsweise: Eine Datenvirtualisierungsplattform verbindet sich mit unterschiedlichen Quellen wie relationalen Datenbanken, Data Warehouses, Data Lakes, Cloud-Services,
Architekturbestandteile: Virtualisierungsschicht, Adapterlayer, Abfrageoptimierer, Metadaten-Repository/Data Catalog, Sicherheits- und Governance-Module sowie Optionen für Caching.
Anwendungsszenarien: Real-Time-BI und Berichte über mehrere Systeme hinweg, agile Analytik, Data-Governance in heterogenen Umgebungen, Unterstützung von
Vorteile und Herausforderungen: Vorteile sind geringere Datenreplikation, schnellere Bereitstellung, zentrale Governance und größere Flexibilität. Herausforderungen betreffen
Beziehung zu anderen Ansätzen: Datenvirtualisierung ergänzt klassische ETL/ELT-Ansätze, kann als Zwischenschritt bei Migrationen dienen und koexistiert
Anbieter und Beispiele: Denodo, IBM, SAP, Microsoft (z. B. PolyBase/External Tables), Oracle Data Service Integrator (früher)