Immer wieder wird im Geschäftskontext über Datenqualität gesprochen. Aktuell wird Datenqualität in Diskussionen häufig mit anderen Themen verwoben: Autorität im Sinn von «authoritativeness», Offizialität, Entstehungskontext, Governance-Modelle, Rechtssicherheit, «foi publique» etc. Das sind wichtige weitere Themen rund um Daten. Und diese können im Einzelnen die Erkenntnistiefe erhöhen, aber es lohnt sich meines Erachtens, zuerst die Begrifflichkeiten und die Bedeutung von Datenqualität zu klären.
Wieso sind Daten wichtig? – Vereinfacht gesagt, weil Leute dazu tendieren, sich für Entscheide auf Daten zu verlassen:

Wir leben offensichtlich in einer stark daten-affinen und daten-gestützten Zeit. Um uns herum und über uns werden ständig Daten generiert und aus Daten werden – hoffentlich wertvolle – Erkenntnisse abgeleitet und wird wirtschaftlicher und gesellschaftlicher Mehrwert geschöpft.
Wieso Datenqualität?
Wieso ist aber Datenqualität wichtig? – Verkürzt gesagt: Weil man sich mit digitalen Werkzeugen, dem «bicycle for the mind», bei unpassender Datenqualität schnell in die falsche Richtung bewegen und sich verfahren kann. Daten sind schliesslich der Rohstoff für alle computer-gestützten Analysen und damit für die Extraktion von Informationen und das Ableiten von Erkenntnissen. Der Rohstoff muss ausreichende Qualität haben, um daraus ein wertvolles Produkt erstellen zu können. Oder umgekehrt und in lapidarer Kurzform: «Garbage in, garbage out.» Denn Fehler und Unzulänglichkeiten pflanzen sich fort: Von der Modellierung über die Messung oder Datenerhebung bis in die Analyse von Daten.

Heute werden in Datenanalysen zudem häufig Daten unterschiedlicher Provenienz miteinander kombiniert. Häufig entstehen gerade aus solchen Datenkombinationen besonders interessante Erkenntnisse. Gleichzeitig können sich dabei Fehler in den Eingangsdaten im schlimmsten Fall aufschaukeln. Oder es können übergreifende Inkonsistenzen entstehen bzw. erst sichtbar werden, die im einzelnen Eingangsdatensatz für sich betrachtet je nach Verwendungszweck vielleicht nicht mal kritisch wären.
Was ist Datenqualität?
Um sich der Frage nach Bedeutung von «Datenqualität» anzunähern, lohnt es sich, «Qualität» sauber zu definieren. Der Begriff der Qualität ist uns scheinbar vertraut, treffen wir ihn doch überall an: Beim Kauf von Gemüse («Bio-Qualität!») und von Toiletten-Papier («feinste Qualität!») sowie beim Buchen von Hotelzimmern («5-Sterne-Qualität!»). Aber trotzdem ist «Qualität» recht schwer zu fassen und zum Beispiel spontan zu definieren. An diesem Punkt lohnt sich ein Blick in die Standard-Familie «ISO 9000 – Qualitätsmanagement». In deren Auffassung beschreibt die Qualität [eines Guts, einer Dienstleistung, eines Produkts, …] den Grad, wie gut inhärente Charakteristika [des Guts, der Dienstleistung, des Produkts, …] Anforderungen erfüllen.
Wenn wir diese Definition etwas aufschlüsseln, sind mit «inhärenten Charakteristika» Eigenschaften des Objekts, dessen Qualität beschrieben wird, gemeint. Die Anforderungen aber können nicht inhärent sein: Sie werden von aussen, durch eine am Objekt interessierte Person formuliert. Wie gut die Charakteristika [des Objekts] die Anforderungen [des Subjekts] erfüllen, wird schliesslich als Qualität bezeichnet.
Einfacher lässt sich das anhand einer Werbung eines grossen Online-Händlers illustrieren – am besten von unten nach oben lesen:

Wir haben also gelernt: Qualität ist keine ein(-)fache Eigenschaft, sondern sie umfasst zwei Dimensionen und beschreibt, wie gut die beiden Dimensionen aufeinander passen.
Für Daten also:
- (nicht nur) die Beschaffenheit der Daten
- (sondern auch) wie gut diese Anforderungen erfüllen