Définition de la gestion des métadonnées
La gestion des métadonnées est la pratique consistant à définir, collecter, organiser et maintenir les métadonnées — les informations descriptives qui expliquent ce qu'est une donnée, d'où elle provient, comment elle est structurée et comment elle doit être utilisée. Si les données sont le contenu, les métadonnées en sont l'étiquette, le système de classement et le manuel d'utilisation réunis en un seul outil.
Que contiennent exactement les métadonnées ?
Les métadonnées couvrent un large éventail d'attributs descriptifs selon le contexte. Les exemples courants incluent :
- Métadonnées descriptives — le nom, le titre ou l'étiquette d'un champ de données (par exemple, « poids du produit »)
- Métadonnées structurelles — la façon dont les données sont formatées ou liées à d'autres données (par exemple, le poids est un nombre décimal, mesuré en kilogrammes, appartenant au groupe des attributs physiques)
- Métadonnées administratives — qui a créé un enregistrement, quand il a été mis à jour pour la dernière fois et qui en est propriétaire
- Métadonnées de lignage — d'où proviennent les données et comment elles ont évolué au fil du temps (voir Lignage des données)
Pourquoi la gestion des métadonnées est-elle importante ?
Sans elle, les données deviennent difficiles à trouver, à interpréter et à valider. Deux équipes pourraient stocker « revenus » dans des champs différents avec des devises et des méthodes de calcul différentes, et personne ne le saurait jusqu'à ce qu'un rapport produise des chiffres contradictoires. Les métadonnées gérées rendent les données auto-explicatives — toute personne ou système accédant à un champ sait exactement ce qu'il contient et comment l'utiliser.
Elle est également fondamentale pour la Gestion des données de référence et la Data Governance : vous ne pouvez pas gouverner les données que vous ne pouvez pas décrire, et vous ne pouvez pas gérer les enregistrements de référence sans savoir ce que signifie chaque champ.
Qui en est responsable ?
La gestion des métadonnées est généralement supervisée par un Gestionnaire de données ou une équipe de gouvernance des données, mais elle nécessite l'apport des personnes qui créent et utilisent réellement les données — directeurs produit, architectes informatiques et analystes métier. Dans les organisations plus grandes, elle est soutenue par un Catalogue de données, un outil qui stocke les métadonnées et les rend consultables dans tous les systèmes.