Datenqualität Definition
Datenqualität bezeichnet die Eignung von Daten für ihren Verwendungszweck, gemessen an 6 Kerndimensionen wie Vollständigkeit, Aktualität, Konsistenz und Genauigkeit, und ist nach ISO 42001 eine zentrale Anforderung an KI-Managementsysteme. Für KI-Projekte ist das geschäftskritisch, weil ein großer Teil der Arbeit in Datenaufbereitung, Bereinigung und Prüfung fließt.
Was bedeutet Datenqualität im KI-Kontext?
Datenqualität ist im KI-Kontext die Voraussetzung dafür, dass Modelle zuverlässig, fair und nachvollziehbar arbeiten. Lückenhafte, veraltete oder nicht repräsentative Trainingsdaten führen schnell zu Fehlklassifikationen und Compliance-Risiken.
Für Unternehmen ist deshalb nicht nur die Datenmenge relevant, sondern deren Eignung für den konkreten Zweck. Genau hier besteht die enge Verbindung zu Daten-Governance, Bias und Diskriminierung in KI und AI Governance.
Relevanz für ISO 42001 und den EU AI Act
Art. 10 EU-VO 2024/1689 macht Datenqualität für Hochrisiko-KI ausdrücklich zur Compliance-Frage. Die Verordnung verlangt geeignete Daten-Governance- und Datenmanagementpraktiken und nennt als Maßstäbe insbesondere Relevanz, hinreichende Repräsentativität, Fehlerarmut und Vollständigkeit. Damit ist Datenqualität Teil des rechtlichen Pflichtenkerns.
ISO/IEC 42001 ergänzt diese Rechtsanforderung organisatorisch. Für die Praxis sind vor allem Klausel 8 zum Betrieb von KI-Prozessen und Klausel 9 zur Leistungsbewertung relevant. Unternehmen müssen also messbare Kriterien definieren, Verantwortlichkeiten zuweisen, Abweichungen dokumentieren und auf Qualitätsverluste reagieren.
Wichtig ist die Abgrenzung: ISO 42001 ersetzt Art. 10 nicht. Der Standard hilft aber, die Anforderungen in wiederholbare Prozesse zu übersetzen, etwa durch Freigabeschritte, Prüfprotokolle, Qualitätskennzahlen und regelmäßige Reviews.
Dimensionen der Datenqualität
| Dimension | Beschreibung | Messmethode | ISO-42001-Bezug |
|---|---|---|---|
| Genauigkeit | Daten stimmen mit der Realität oder Ground Truth überein. | Fehlerrate, Stichprobenprüfung, Label-Review | Klausel 8, Qualitätskriterien im Betrieb |
| Vollständigkeit | Relevante Felder und Fälle fehlen nicht systematisch. | Missing-Value-Quote, Coverage-Check | Klausel 8, Risikobehandlung |
| Aktualität | Daten bilden den aktuellen Zustand ausreichend ab. | Datenalter, Refresh-Zyklus, Drift-Indikatoren | Klausel 9, laufende Überwachung |
| Konsistenz | Werte sind über Systeme und Zeitpunkte hinweg stimmig. | Regelprüfungen, Dubletten- und Konfliktanalyse | Klausel 8 und 9 |
| Validität | Daten entsprechen Format-, Bereichs- und Fachregeln. | Validierungsregeln, Schema-Checks | Operative Kontrollen |
| Repräsentativität | Daten decken reale Nutzungsbedingungen und Gruppen angemessen ab. | Segmentanalyse, Gruppenabdeckung, Bias-Tests | Art. 10 AI Act, faire KI-Steuerung |
Praxisbeispiel aus dem KMU-Alltag
Ein Handelsunternehmen mit 120 Mitarbeitenden nutzt ein KI-System, das Retourenwahrscheinlichkeiten prognostiziert. Das Modell wurde mit historischen Daten trainiert, aber ein wichtiger Produktbereich fehlt, weil er damals noch nicht im Sortiment war.
Das System wirkt technisch funktionsfähig, trifft aber für neue Produktgruppen spürbar schlechtere Vorhersagen. Erst eine strukturierte Qualitätsprüfung zeigt, dass nicht das Modell allein, sondern die Datenbasis das Kernproblem ist.
Ein praxistauglicher Fix besteht nicht in einem kompletten Neustart. Das Unternehmen definiert Mindestkriterien für Vollständigkeit und Aktualität, prüft die Abdeckung relevanter Warengruppen, dokumentiert bekannte Grenzen und führt vor jedem Retraining einen kurzen Qualitäts-Check ein. So wird Datenqualität steuerbar statt zufällig.
Was Unternehmen jetzt tun sollten
Datenqualität sollte in KMU als fester Prüfpunkt vor Einführung, Änderung und Überwachung von KI-Systemen behandelt werden. Sinnvoll sind ein kleines Set verbindlicher Kennzahlen, klar benannte Verantwortliche, dokumentierte Freigaben und ein Eskalationsweg bei Qualitätsabweichungen.
Wenn Sie Datenqualität, Art. 10 AI Act und organisatorische Umsetzung gemeinsam verstehen wollen, ist die EU AI Act Schulung der direkte Einstieg. Für den Managementsystem-Blick auf Prozesse, Rollen und Nachweise ist außerdem der ISO-42001-Leitfaden hilfreich.