Definición de Gestión de Metadatos
La Gestión de Metadatos es la práctica de definir, recopilar, organizar y mantener metadatos — la información descriptiva que explica qué es un dato, de dónde proviene, cómo está estructurado y cómo debe utilizarse. Si los datos son el contenido, los metadatos son la etiqueta, el sistema de archivo y el manual de instrucciones en uno solo.
¿Qué incluye realmente los metadatos?
Los metadatos abarcan una amplia gama de atributos descriptivos según el contexto. Los ejemplos comunes incluyen:
- Metadatos descriptivos — el nombre, título o etiqueta de un campo de datos (p. ej., "peso del producto")
- Metadatos estructurales — cómo se formatean los datos o se vinculan a otros datos (p. ej., el peso es un decimal, medido en kilogramos, perteneciente al grupo de atributos físicos)
- Metadatos administrativos — quién creó un registro, cuándo se actualizó por última vez y quién lo posee
- Metadatos de linaje — de dónde originaron los datos y cómo han cambiado con el tiempo (véase Linaje de Datos)
¿Por qué importa la gestión de metadatos?
Sin ella, los datos se vuelven difíciles de encontrar, interpretar y en los que confiar. Dos equipos podrían almacenar "ingresos" en campos diferentes con monedas diferentes y métodos de cálculo distintos, y nadie lo sabría hasta que un informe produjera números conflictivos. Los metadatos gestionados hacen que los datos sean autoexplicativos — cualquier persona o sistema que acceda a un campo sabe exactamente qué contiene y cómo utilizarlo.
También es fundamental para la Gestión de Datos Maestros y la Data Governance: no se pueden gobernar datos que no se pueden describir, y no se pueden gestionar registros maestros sin saber qué significa cada campo.
¿Quién es responsable de ello?
La gestión de metadatos generalmente está supervisada por un Custodio de Datos o un equipo de gobernanza de datos, pero requiere la aportación de las personas que realmente crean y utilizan los datos — gerentes de producto, arquitectos de TI y analistas de negocios. En organizaciones más grandes, se apoya en un Catálogo de Datos, una herramienta que almacena y hace que los metadatos sean buscables en todos los sistemas.