Définition de l'ELT
ELT (Extract, Load, Transform) est une approche d'intégration de données dans laquelle les données sont d'abord extraites des systèmes sources et chargées dans un système de destination sous leur forme brute, puis transformées à l'intérieur de ce système de destination. Elle suit les mêmes trois étapes que l'ETL, mais dans un ordre différent. La transformation intervient après le chargement, et non avant.
En quoi l'ELT diffère-t-il de l'ETL en pratique ?
La distinction clé réside dans le lieu où s'effectue la transformation des données. En ETL, une couche de traitement distincte nettoie et restructure les données avant qu'elles ne parviennent au système de destination. En ELT, le système de destination lui-même, généralement un entrepôt de données cloud moderne, gère la transformation en utilisant ses propres ressources de calcul.
Cela rend l'ELT particulièrement adapté à des plates-formes comme BigQuery, Snowflake ou Redshift, conçues pour traiter rapidement des volumes de données très importants. Les analystes et les ingénieurs peuvent écrire la logique de transformation directement en SQL, l'itérer et la réexécuter sur les données brutes déjà chargées sans avoir besoin de réextraire les données de la source.
Quels sont les compromis pratiques ?
L'ELT permet aux équipes de charger rapidement les données et de décider ultérieurement comment les transformer, ce qui s'avère utile quand les exigences évoluent encore. Elle préserve aussi les données sources brutes, facilitant le retraitement en cas de modification de la logique de transformation. Le compromis est que le système de destination doit être capable de gérer la charge de traitement, et les données brutes sensibles sont stockées dans l'entrepôt avant tout filtrage ou masquage.
L'ETL, en revanche, offre un meilleur contrôle sur les données qui entrent dans le système de destination et est souvent préféré quand les règles de transformation sont bien définies, quand le système de destination a une capacité de traitement limitée, ou quand les données doivent être nettoyées et validées avant le stockage pour des raisons de conformité.
Quelle est la place de l'ELT dans une architecture de données ?
L'ELT est courant dans les pipelines d'analyse et de reporting, particulièrement au sein des organisations utilisant un Entrepôt de Données comme magasin analytique centralisé. Elle est moins couramment utilisée dans des contextes opérationnels comme les plates-formes MDM ou PIM, où les règles de qualité des données doivent généralement être appliquées au point d'entrée plutôt qu'a posteriori. Pour une comparaison de la manière dont les déploiements MDM cloud et sur site gèrent différemment l'intégration des données, consultez Gestion des données maîtresses cloud et Solutions Master Data Management sur site.