Datenqualitäts-Governance: So wird es wirklich umgesetzt

Wichtigste Erkenntnisse

Datenqualitäts-Governance ist kein einmaliges Projekt, sondern eine kontinuierliche operative Disziplin.
Verantwortung, Standards und Durchsetzung müssen auf Datenebene verankert sein, nicht nur in Policy-Dokumenten.
Die meisten Fehler entstehen durch schwaches Datenmodellierung an der Quelle, nicht durch mangelnde Monitoring-Tools.
Wenn Qualitätsregeln in Datenpipelines integriert sind, werden Probleme verhindert, statt sie nur zu melden.

Die meisten Organisationen wissen, dass ihre Daten Qualitätsprobleme haben. Doppelte Lieferantensätze, Produktattribute mit unterschiedlichen Bedeutungen in verschiedenen Systemen und fehlende Werte, die erst auftauchen, wenn jemand einen Report erstellen möchte. Weniger klar ist: Wer trägt Verantwortung für diese Probleme, und was sollte man konkret dagegen tun?

Genau diese Lücke soll Datenqualitäts-Governance schließen.

Was Datenqualitäts-Governance wirklich bedeutet

Data Governance und Datenqualität hängen zusammen, sind aber nicht dasselbe. Governance definiert die Regeln: Wer besitzt die Daten, wie werden sie klassifiziert, welche Standards gelten, wer hat Zugriff. Datenqualität ist das operative Ergebnis: ob die Daten diese Standards zu einem beliebigen Zeitpunkt wirklich erfüllen.

Datenqualitäts-Governance ist der Punkt, an dem sich beides verbindet. Sie umfasst die Prozesse, Rollen und Kontrollen, die ein Data-Governance-Framework in messbare Datenergebnisse übersetzen. Datenqualitätsmanagement ist die alltägliche Umsetzung dieser Arbeit. Das Ergebnis, wenn beide richtig funktionieren, ist Datenintegrität: Sätze, die präzise, konsistent und vertrauenswürdig in jedem System sind, das sie nutzt.

Ein Bericht des IBM Institute for Business Value von 2025 zeigt, dass 43% der Chief Operations Officers Datenqualitätsprobleme als ihre oberste Datenpriorität einstufen. Mehr als ein Viertel der Organisationen schätzt, dass sie jährlich über 5 Millionen USD durch schlechte Datenqualität verlieren.

Diese Verluste entstehen selten durch eine einzelne falsche Entscheidung. Sie sammeln sich aus kleinen, systematischen Fehlern an: keine einheitliche Definition, was „vollständig" für einen Produktdatensatz bedeutet, kein Prozess zum Abfangen von Duplikaten vor dem Weitergabe an nachgelagerte Systeme, niemand haftbar, wenn Daten aus der Spezifikation driften.

Der echte Fehlermechanismus

Unternehmen behandeln Datenqualität oft als Aufräumaufgabe. Etwas geht schief, ein Team führt ein Korrekturskript aus, und das Problem ist erledigt. Drei Monate später ist dasselbe Problem wieder da.

Der Grund liegt in der Struktur. Wenn das Datenmodell schlechte Daten bei der Aufnahme durchlässt und es keine Regeln gibt, die an diesem Punkt durchgesetzt werden, ist Datenbereinigung immer reaktiv. Sie entfernen Probleme, nachdem sie bereits in Reports, Pricing-Engines, ERP-Transaktionen und kundenorientierten Ausgaben propagiert wurden.

Der wichtigste Indikator für schlechte Datenqualität ist ein Datenmodell, das nie mit Qualität im Blick entworfen wurde.

In Projekten, die wir für Hersteller von Industrieausrüstung implementiert haben, war die Grundursache fast immer gleich: Attributfelder definiert als Freitext, keine kontrollierten Vokabulare und keine Pflichtfelder auf Produktebene. Jedes Team gab Daten unterschiedlich ein. Bis der Katalog zur E-Commerce-Plattform kam, brauchte Matching und Deduplication Wochen manuelle Arbeit vor jedem Produktstartzyklus.

Governance-Frameworks, die sich nur auf Eigentums- und Zugriffspolicies konzentrieren, ohne das zugrundeliegende Datenmodell zu berühren, werden dies nicht beheben. Datenqualitäts-Governance beginnt upstream, an dem Punkt, wo Daten definiert und eingegeben werden, nicht wo sie berichtet werden.

So sieht ein funktionierendes Framework aus

Datenqualitäts-Governance, die sich wirklich in der Produktion bewährt, erfordert fünf Komponenten. Ihre Bedeutung ist nicht gleich, und die Implementierungsreihenfolge ist wichtig.

Definierte Qualitätsdimensionen mit messbaren Zielen

Genauigkeit, Vollständigkeit, Konsistenz, Aktualität, Eindeutigkeit, Validität und Konformität sind die Kerndimensionen der Datenqualität. Usability beschreibt, ob Daten so strukturiert sind, dass nachgelagerte Teams damit wirklich arbeiten können – es lohnt sich, diese Dimension hinzuzufügen, wenn Daten Systemgrenzen überschreiten. Die Definitionen müssen spezifisch sein. „Vollständigkeit" für einen Produktdatensatz bei einem Baumaterialverteilzentrum könnte bedeuten, dass alle 14 Pflichtattribute ausgefüllt sind, einschließlich Maßeinheit, Gefahreneinstufung und Verpackungsdimensionen. Jede Dimension braucht auch ein Ziel, eine Messmethode und einen Review-Rhythmus. Ohne diese drei Dinge ist eine Qualitätsdimension nur ein Label.

Dateneigenschaft auf Attributebene

Einen Dateneigentümer einem Tisch oder einer Domäne zuzuweisen, ist zu grob. Qualitätsverantwortung funktioniert, wenn sie auf Attributebene sitzt. Jemand trägt Verantwortung für die Genauigkeit der Materialnummer. Jemand anderes besitzt die Produktbeschreibungsfelder. Wenn ein Feld abnimmt, wissen Sie sofort, wessen Aufgabe es ist, es zu beheben. Die meisten Organisationen vermeiden dieses Detaillierungsniveau, bis ein Audit erzwingt. Klare Data-Governance-Rollen, die definieren, wer was auf welcher Granularitätsebene besitzt, sind es, was das verhindert.

Validierungsregeln in der Aufnahme eingebettet

Hier funktionieren oder scheitern die meisten Datenqualitäts-Governance-Programme. Qualitätsregeln sollten an dem Punkt ausgelöst werden, an dem Daten ein System betreten. Ein Pflichtfeld, das leer bleibt, sollte den Datensatz sofort ablehnen, nicht durchlassen und in einem Weekly-Datenqualitätsbericht drei Tage später auftauchen. Ein Wert außerhalb eines zulässigen Satzes sollte bei der Datenaufnahme abgelehnt werden, mit einer spezifischen Fehlermeldung.

Unsere Kunden im Bereich Sicherheitsausrüstungsverteilung kommen oft zu uns, nachdem sie Jahre lang Post-Ingestion-Qualitätsprüfungen durchgeführt haben. Die Prüfungen existierten. Die Datenqualitätsprobleme verschwanden nicht. Der Unterschied, sobald automatisierte Validierung upstream in die Datenaufnahmepipeline selbst verschoben wurde, war unmittelbar: Fehlerquoten sanken, Überarbeitungszyklen verkürzten sich und nachgelagerte Systeme hörten auf, beschädigte Datensätze zu erhalten. Datenstandardisierung, Durchsetzung konsistenter Formate, Einheiten und kontrollierter Werte bei der Eingabe, machte Datenqualitätsmetriken so, dass sie tatsächlich die Realität widerspiegelten, statt die Ausgabe eines Bereinigungsskripts zu messen.

Datenprofiling vor dem Schreiben von Validierungsregeln ist hier wichtig. Wenn Sie die Verteilung von Werten in einem Feld nicht kennen, den Bereich verwendeter Formate oder wo Nulls häufen, werden die Regeln, die Sie schreiben, entweder zu locker oder zu streng sein. Profiling verwandelt Annahmen in Spezifikationen.

Audit-Trails und Datenabfolge

Sie können nicht steuern, was Sie nicht nachverfolgen können. Wenn sich eine Produktspezifikation ändert, sollte das System erfassen, wer sie geändert hat, wann und von welchem Wert. Wenn ein Datensatz eine Qualitätsprüfung nicht besteht, sollte es ein Log darüber geben, welche Regel er nicht bestanden hat und was danach passierte.

In Multi-System-Umgebungen ist Abfolge genauso wichtig wie der Audit-Trail selbst. Ein Produktdatensatz, der in einem ERP entsteht, über ein PIM geht und an drei Vertriebskanäle publiziert, kann an jedem Punkt in dieser Kette degradieren. Metadaten-Management, das erfasst, woher jedes Feld kam und welche Transformationen es durchlaufen hat, ist das, was es möglich macht, die Eingangsquelle eines Fehlers genau zu bestimmen. Ein Datenkatalog, der diese Metadaten indexiert, gibt Teams einen zentralen Ort, um Probleme nachzuverfolgem, ohne jedes System einzeln zu befragen.

Workflow-Genehmigungen für kritische Datenänderungen

Änderungen an Preisstufen, Produktklassifizierungen oder Behördenattributen müssen typischerweise vor der Veröffentlichung überprüft werden. In Branchen mit strikten Compliance-Anforderungen wie Chemikalien, Medizinprodukte und Gefahrstoffe ist ein Genehmigungsworkflow nicht optional. Es ist der Mechanismus, der hält, dass gesteuerte Daten nicht überschrieben werden ohne Aufzeichnung. Der Genehmigungsschritt muss nicht alle Änderungen abdecken, nur diejenigen, bei denen ein Fehler teuer ist, um ihn rückgängig zu machen.

Diese fünf Komponenten verstärken sich gegenseitig. Eigenschaft ohne Validierungsregeln bedeutet, dass verantwortliche Menschen immer noch schlechte Daten erhalten. Validierung ohne Abfolge bedeutet, dass Sie Fehler abfangen, aber nicht erklären können, woher sie kamen. Ein Datenqualitäts-Governance-Programm mit allen fünf auf grundlegendem Niveau wird ein Programm übertrumpfen, das eine einzelne Komponente gut aufbaut, während die anderen unberührt bleiben.

Die Organisationsseite ist schwächer als die technische Seite

Die technischen Komponenten der Datenqualitäts-Governance sind gut verstanden. Der schwierigere Teil ist organisatorisch.

Die meisten Unternehmen haben mehrere Teams, die dieselben Daten anfassen. Das ERP-Team besitzt den Artikelstamm. Das Marketing-Team verwaltet Produktinhalte. Das Logistik-Team aktualisiert Dimensionsdaten. Keiner von ihnen berichtet an den anderen, und ihre Anreize für Datenqualität sind unterschiedlich. Ein Data-Governance-Team oder zumindest eine funktionsübergreifende Governance-Gruppe ist das, was Organisationen eine Möglichkeit gibt, diese Konflikte zu lösen, ohne jeden Datendispute an die Senior Leadership zu eskalieren.

Ohne eine Datenstewardship-Funktion, die Teamgrenzen überschreitet, neigen Governance-Richtlinien dazu, von demjenigen befolgt zu werden, der sie geschrieben hat, und von allen anderen ignoriert zu werden.

Eine Datenkustode-Rolle muss keine Vollzeitposition sein. In kleineren Operationen kann es eine bestimmte Verantwortung für jemanden sein, der bereits nah an den Daten ist. Das Wichtige ist, dass jemand für Qualitätsergebnisse verantwortlich ist, die Autorität hat, Standards durchzusetzen und Sichtbarkeit über die Systeme hinweg hat, in denen die Daten vorhanden sind.

Regelmäßige Datenqualitäts-Reviews mit eingesprochenen Metriken und Stakeholder-Beteiligung sind das, was ein Datenqualitäts-Governance-Programm daran hindert, ein Dokument zu werden, das niemand nach dem ersten Rollout liest.

Tools unterstützen Governance. Sie ersetzen sie nicht.

Es gibt eine Kategorie von Software, die als „Datenqualität"- oder „Data-Governance"-Plattformen vermarktet wird. Einige leisten echte Arbeit. Aber ohne Eigentumsstrukturen, definierte Standards und Validierungslogik an Ort und Stelle, fügen Tools Dashboards zu einem Problem hinzu, das noch keinen Eigentümer hat.

Ein Datenqualitäts-Monitoring-Tool zeigt Ihnen, wo Qualität abnimmt. Das ist nützliche Information. Aber wenn es keine definierten Standards gibt, um dagegen zu messen, zeigt das Dashboard Zahlen ohne Kontext. Wenn es keine Eigentumsstruktur gibt, zeigt es Probleme, für die niemand Verantwortung trägt. Das Tool wird zum Beweis einer Datenqualitäts-Governance-Lücke, nicht zu ihrer Lösung.

AtroCore vertritt die Position, dass Datenqualitäts-Governance auf Datenmodellebene durchgesetzt werden muss. Seine Master-Data-Management-Plattform nutzt ein EAV-basiertes Datenmodell, das es Organisationen ermöglicht, zu definieren, welche Attribute obligatorisch sind, welche Werte gültig sind und welche Änderungen Genehmigung erfordern, bevor sie wirksam werden. Das Ergebnis ist eine einzige vertrauenswürdige Quelle für Produkt-, Lieferanten- und andere Stammdaten: vertrauenswürdige Daten, die konsistent über jedes verbundene System bleiben. Audit-Trails und bidirektionale Synchronisation mit ERPs und E-Commerce-Plattformen bedeuten, dass Datenqualitätskontrollen den Datensatz über den gesamten Lebenszyklus verfolgen und jedes System abdecken, das die Daten anfasst.

Wo man anfängt

Beginnen Sie mit den Datenentitäten, die den meisten Downstream-Schaden verursachen. Für Hersteller und Vertriebszentren sind das typischerweise der Produktstamm oder der Lieferantendatensatz. Ordnen Sie, welche Attribute vorhanden sind, wer sie auffüllt und was die aktuellen Erfüllungs- und Genauigkeitsquoten sind. Diese Prüfung wird die drei bis fünf Fehler aufdecken, die es wert sind, sie zuerst in Ihrer Datenqualitäts-Governance-Initiative anzugehen.

Stellen Sie Eigenschaft für diese spezifischen Attribute her, bevor Sie Tools kaufen. Schreiben Sie Qualitätsregeln, die spezifisch genug sind, um testbar zu sein. „Produktbeschreibungen sollten präzise sein" ist keine Regel. „Produktbeschreibungen müssen zwischen 100 und 500 Zeichen lang sein, keine HTML-Tags enthalten und für alle aktiven SKUs ausgefüllt sein" ist eine Regel. Zuverlässige Daten folgen aus dieser Art von Spezifität. Nichts anderes produziert sie.

Datenqualitäts-Governance scheitert, wenn Organisationen sie als Projekt mit Enddatum behandeln. Die Unternehmen, die es richtig hinbekommen, behandeln es als operative Eigenschaft ihrer Dateninfrastruktur, eingebaut in wie Daten erstellt, verschoben und verändert werden, dann als kontinuierliche Disziplin aufrechterhalten.