¿Qué es ELT?

Definición de ELT

ELT (Extracción, Carga, Transformación) es un enfoque de integración de datos en el que los datos se extraen primero de los sistemas de origen y se cargan en un sistema de destino en su forma bruta, para luego transformarse dentro de ese destino. Sigue los mismos tres pasos que ETL, pero en un orden diferente. La transformación ocurre después de la carga, no antes.

¿Cómo difiere ELT de ETL en la práctica?

La diferencia clave está en dónde ocurre el trabajo de transformación. En ETL, una capa de procesamiento separada limpia y reestructura los datos antes de que lleguen al destino. En ELT, el propio sistema de destino, generalmente un almacén de datos en la nube moderno, gestiona la transformación utilizando sus propios recursos de procesamiento.

Esto hace que ELT sea adecuado para plataformas como BigQuery, Snowflake o Redshift, que están diseñadas para procesar volúmenes muy grandes de datos rápidamente. Los analistas e ingenieros pueden escribir la lógica de transformación directamente en SQL, iterarla y ejecutarla nuevamente contra los datos brutos ya cargados sin necesidad de volver a extraer de la fuente.

¿Cuáles son las compensaciones prácticas?

ELT permite que los equipos carguen datos rápidamente y decidan cómo transformarlos posteriormente, lo que es útil cuando los requisitos aún están evolucionando. También preserva los datos brutos de origen, facilitando el reprocesamiento si la lógica de transformación cambia. La compensación es que el sistema de destino debe ser capaz de gestionar la carga de procesamiento, y los datos brutos sensibles se almacenan en el almacén antes de que se aplique cualquier filtrado o enmascaramiento.

ETL, por el contrario, ofrece mayor control sobre qué datos entran en el destino y suele preferirse cuando las reglas de transformación están bien definidas, cuando el sistema de destino tiene capacidad de procesamiento limitada, o cuando los datos deben limpiarse y validarse antes del almacenamiento por razones de cumplimiento normativo.

¿Dónde encaja ELT en una arquitectura de datos?

ELT es común en canalizaciones de análisis e informes, particularmente en organizaciones que utilizan un Almacén de Datos como almacén analítico centralizado. Se utiliza menos frecuentemente en contextos operacionales como plataformas de MDM o PIM, donde las reglas de calidad de datos típicamente deben aplicarse en el punto de entrada en lugar de retroactivamente. Para una comparación de cómo las implementaciones de MDM en la nube y locales manejan la integración de datos de manera diferente, consulte Gestión de Datos Maestros en la Nube y Soluciones de Gestión de Datos Maestros Local.