7 Kriterien zur Beurteilung der Datenqualität

Um die eigene Datenqualität hinreichend beurteilen zu können, rät der ERP-Hersteller Proalpha, folgende sieben Kriterien heranzuziehen.

23. April 2019

Viele Unternehmen, so hat der ERP-Hersteller Proalpha beobachtet, haben in der Vergangenheit ihre Datenqualität vernachlässigt, aus unterschiedlichen Gründen. Dass ihre ERP-Systeme dadurch nur suboptimal performten, sei ihnen nicht bewusst gewesen oder sie hätten es billigend in Kauf genommen. Mit der Digitalisierung der Prozesse und dem rasanten Aufstieg von Künstlicher Intelligenz (KI) werde dies zu einem noch größeren Risiko. Denn es sei wissenschaftlich belegt: Eine schlechte Datenqualität beeinflusst Effizienz und Ergebnis, auch bei KI-Systemen wie selbstlernenden Maschinen. Für viele Firmen werde es Zeit, aktiv zu werden. Der ERP-Hersteller rät, Daten einem siebenstufigen Leistungstest zu unterziehen – und zwar eigene Bestände genauso wie Informationen aus anderen Quellen, etwa von Wirtschaftsauskunfteien und anderen Drittanbietern.

Die entscheidenden Performanceparameter zur Einschätzung der Datenqualität sind:

1. Vollständig

Fehlen Informationen, ist das mehr als nur ärgerlich. Je digitalisierter Abläufe werden, umso wichtiger ist es, dass sämtliche benötigen Daten vorliegen. Sind beispielsweise Angaben zu den Bauteilen für ein Produkt unvollständig, stockt möglicherweise der Produktionsprozess oder das Endprodukt entspricht nicht den Vorgaben. Um die Performance der Geschäftsprozesse sicherzustellen, empfehlen sich die Definition von Pflichtfeldern sowie automatisierte Prüfungen an ausgewählten Prozesspunkten. Unternehmen sollten dennoch nicht in „Datensammelwut“ verfallen. Denn bei personenbezogenen Daten gilt seit Inkrafttreten der Datenschutzgrundverordnung (DSGVO) das Gebot der Sparsamkeit: Es dürfen nur so viele Informationen gespeichert werden, wie tatsächlich nötig sind. Nicht mehr erforderliche Daten sind nachhaltig zu löschen.

2. Aktuell

Nicht-synchronisierte Adress- und Kontaktdaten sind ein Paradebeispiel für veraltete Informationen. Gerade weil Vertriebsmitarbeiter nur sporadisch in der Zentrale vorbeischauen, war in der Vergangenheit die Kundendatenbank nie auf dem aktuellen Stand. Mobile CRM-Lösungen sorgen hier für Abhilfe. Sie halten zudem auch so produktionskritische Informationen wie Lagerdaten auf Stand. Dennoch muss nicht jeder Status in Echtzeit vorliegen. Unternehmen sollten vielmehr ihre Prozesse einem Check unterziehen, wo eine schnellere Datenbereitstellung für mehr Produktivität sorgt und genau dort ansetzen.

3. Konsistent

Datensätze in verschiedenen Systemen dürfen sich nicht widersprechen. In der Praxis führen eine doppelte Datenhaltung in mehreren Datensilos und manuelle Übertragung im besten Fall „nur“ zu Mehraufwand für die Dateneingabe. Im schlimmsten Fall entstehen Fehler, etwa beim Übertrag der Auftragsdaten in eine Software für Qualitätssicherung. Daraus resultierende Inkonsistenzen sind heute, dank moderner Integrationstechniken, relativ einfach in den Griff zu bekommen.

4. Konform

Daten müssen den Anforderungen der Systeme und der Prozesse entsprechen, zum Beispiel im passenden, möglichst standardisierten Format vorliegen. Datums- und Währungsformate sind hier Klassiker. Bei Zeitstempeln ist ferner darauf zu achten, dass zusätzlich zu Stunden und Minuten auch die jeweilige Zeitzone miterfasst wird. Schließlich liegen zwischen 8 Uhr in Shanghai und 8 Uhr in São Paulo zwölf Stunden Zeitunterschied.

5. Genau

Daten müssen genau sein. Genauer gesagt: Sie müssen ausreichend genau sein. Denn nicht jeder Geschäftsprozess benötigt Hochpräzisionsdaten bis auf die x-te Kommastelle. Auch hier sollten sich Unternehmen zuerst fragen: Wie exakt müssen Messwerte und andere Daten sein? Die benötigte Genauigkeit sollte dann auch systemseitig durch entsprechende Regeln und Datenprüfungen nachgehalten werden.

6. Einzigartig

Dubletten blähen nicht nur den Datenbestand unnötig auf. Sie sorgen auch für unnötige Rückfragen. Bleiben sie unentdeckt, kommt es schnell zu Fehlinterpretationen. Zum Beispiel, wenn ein Lieferant mehrere Lieferantennummern hat und dadurch Kennzahlen wie das Vertragsvolumen für Rabattverhandlungen nicht aggregiert werden. Redundante Daten aus einem Bestand herauszufiltern, geht bereits mit Bordmitteln eines Tabellenkalkulationsprogramms. Jedoch schleichen sich so Dubletten immer wieder ein und die Arbeit beginnt von vorn. Ein automatisierter Data Quality Manager bietet einen nachhaltigeren Weg zu sauberen Daten.

7. Richtig

Dieses Kriterium verweist neben der Aktualität auf einen weiteren, wesentlichen Aspekt: nämlich die Richtigkeit, die Verlässlichkeit der Daten. Die aktuelle Diskussion um Fake News unterstreicht dies einmal mehr: Eine „topaktuelle“ Information über ökonomische Schwierigkeiten eines Zulieferers muss nicht zwingend korrekt sein. Die Quellen, aus denen Unternehmen geschäftsrelevante Informationen beziehen, müssen also nachvollziehbar und glaubwürdig sein.

Das Verhältnis der Unternehmen zu ihren Daten ist oft zwiespältig: An einigen Stellen, etwa im Vertriebs- oder Finanzbereich, wird ihrer Qualität teilweise offen misstraut, an anderen Stellen, zum Beispiel in der Produktion, wird die Qualität oft überschätzt. Ein nachhaltiges Qualitätsmanagement für Daten hilft in dreierlei Hinsicht: Es bewahrt vor kostspieligen Fehlern, erhöht das Vertrauen in die eigenen Daten und ermöglicht bessere Entscheidungen. Vor allem aber helfen richtig gemanagte Daten, Prozesse zu digitalisieren. Um dieses Plus an datengetriebener Effizienz zu erzielen, können sich Unternehmen bei Spitzenmannschaften im Sport einiges abschauen: Es braucht eine profunde und ehrliche Analyse, eine klare Strategie und den individuellen Einsatz für kontinuierliche Verbesserung, auf allen Ebenen des Teams.