Was ist ELT?

ELT-Definition

ELT (Extract, Load, Transform) ist ein Datenintegrations-Ansatz, bei dem Daten zunächst aus Quellsystemen extrahiert und in ihrer Rohform in ein Zielsystem geladen werden, um dann innerhalb dieses Zielsystems transformiert zu werden. Es folgt denselben drei Schritten wie ETL, aber in einer anderen Reihenfolge. Die Transformation erfolgt nach dem Laden, nicht davor.

Wie unterscheidet sich ELT praktisch von ETL?

Der wesentliche Unterschied liegt darin, wo die Transformationsarbeit stattfindet. Bei ETL bereinigt und restructuriert eine separate Verarbeitungsschicht die Daten, bevor sie jemals das Zielsystem erreichen. Bei ELT übernimmt das Zielsystem selbst, typischerweise ein modernes Cloud-Data-Warehouse, die Transformation mit seinen eigenen Rechenressourcen.

Dies macht ELT ideal für Plattformen wie BigQuery, Snowflake oder Redshift, die große Datenmengen schnell verarbeiten können. Analysten und Ingenieure können Transformationslogik direkt in SQL schreiben, diese iterieren und gegen die bereits geladenen Rohdaten erneut ausführen, ohne die Quelle neu zu extrahieren.

Welche praktischen Kompromisse gibt es?

ELT ermöglicht Teams, Daten schnell zu laden und später zu entscheiden, wie diese transformiert werden – das ist nützlich, wenn die Anforderungen noch in Entwicklung sind. Es bewahrt auch die Rohdaten aus der Quelle, wodurch eine Neuverarbeitung bei Änderungen der Transformationslogik einfacher wird. Der Kompromiss besteht darin, dass das Zielsystem in der Lage sein muss, die Verarbeitungslast zu bewältigen, und sensitive Rohdaten werden im Warehouse gespeichert, bevor eine Filterung oder Maskierung angewendet wird.

ETL bietet dagegen mehr Kontrolle darüber, welche Daten das Zielsystem erreichen, und wird oft bevorzugt, wenn Transformationsregeln gut definiert sind, das Zielsystem begrenzte Verarbeitungskapazität hat, oder wenn Daten vor der Speicherung aus Compliance-Gründen bereinigt und validiert werden müssen.

Wo passt ELT in eine Datenarchitektur?

ELT ist üblich in Analytics- und Reporting-Pipelines, besonders in Organisationen, die ein Data Warehouse als zentralen analytischen Speicher nutzen. Es wird weniger häufig in operativen Kontexten wie MDM- oder PIM-Plattformen verwendet, wo Datenqualitätsregeln typischerweise am Eingangspunkt durchgesetzt werden müssen, anstatt rückwirkend angewendet zu werden. Einen Vergleich zwischen Cloud- und On-Premise-MDM-Bereitstellungen finden Sie unter Master Data Management Cloud und On-Premise Master Data Management Solutions.