Was ist Metadaten-Management?

Definition von Metadaten-Management

Metadaten-Management ist die Praxis des Definierens, Erfassens, Organisierens und Verwaltens von Metadaten — den beschreibenden Informationen, die erklären, was ein Datenelement ist, woher es stammt, wie es strukturiert ist und wie es verwendet werden sollte. Wenn Daten der Inhalt sind, sind Metadaten das Etikett, das Ablagesystem und die Bedienungsanleitung in einem.

Was umfasst Metadaten konkret?

Metadaten decken je nach Kontext eine breite Palette beschreibender Attribute ab. Häufige Beispiele sind:

  • Beschreibende Metadaten — der Name, Titel oder die Bezeichnung eines Datenfeldes (z. B. „Produktgewicht")
  • Strukturelle Metadaten — wie Daten formatiert oder mit anderen Daten verlinkt sind (z. B. Gewicht ist dezimal, gemessen in Kilogramm, gehört zur Gruppe der physischen Attribute)
  • Administrative Metadaten — wer einen Datensatz erstellt hat, wann er zuletzt aktualisiert wurde und wer ihn besitzt
  • Herkunftsmetadaten — woher die Daten stammen und wie sie sich im Laufe der Zeit verändert haben (siehe Data Lineage)

Warum ist Metadaten-Management wichtig?

Ohne es werden Daten schwer auffindbar, interpretierbar und vertrauenswürdig. Zwei Teams könnten „Umsatz" in verschiedenen Feldern mit unterschiedlichen Währungen und Berechnungsmethoden speichern, und niemand würde es wissen, bis ein Bericht widersprüchliche Zahlen liefert. Verwaltete Metadaten machen Daten selbsterklärend — jede Person oder jedes System, das auf ein Feld zugreift, weiß genau, was es enthält und wie es zu verwenden ist.

Es ist auch grundlegend für Master Data Management und Data Governance: Sie können Daten nicht steuern, die Sie nicht beschreiben können, und Sie können Master-Datensätze nicht verwalten, ohne zu wissen, was jedes Feld bedeutet.

Wer ist dafür verantwortlich?

Metadaten-Management wird typischerweise von einem Data Steward oder einem Data-Governance-Team überwacht, erfordert aber Input von den Personen, die die Daten tatsächlich erstellen und nutzen — Produktmanager, IT-Architekten und Business-Analysten. In größeren Organisationen wird es durch einen Data Catalog unterstützt, ein Tool, das Metadaten speichert und durchsuchbar über Systeme hinweg macht.