Daten sagen die Wahrheit … oder?

Neuigkeiten   |   Alan Jacobson   |   25. Aug. 2020 LESEZEIT: 4 MIN
LESEZEIT: 4 MIN

Eine einfache Frage wie „Wie viele Länder gibt es auf der Welt?“ sollte eine einfache Antwort haben. Wie die folgende Abbildung zeigt, ist das jedoch nicht ganz der Fall. Nach Angaben der Vereinten Nationen gibt es nur 195 souveräne Staaten, aber es gibt 204 bis 207 selbsternannte Länder, ganz zu schweigen von 211 FIFA-Ländern, die für die Weltmeisterschaft infrage kommen, und 206 olympischen Nationen. Was ist also die „richtige“ Antwort? Es hängt ganz davon ab, wen Sie fragen und welche Definition diese Personen haben.

Auf der Suche nach der Wahrheit

Immer mehr Unternehmen nutzen Daten und erkennen, dass die „richtige“ Antwort oder eine einheitliche Version der „Wahrheit“ nicht immer eindeutig ist. Dies hat IT-Abteilungen dazu veranlasst, mehr Data Governance und Kontrolle zu fordern, damit Mitarbeiter, die dieselbe Frage stellen, auf zuverlässige, präzise Daten und Analysen zugreifen und dieselbe Antwort erhalten.

Das Konzept klingt im Prinzip gut: Sie haben Ihre Daten an einem Ort und können sicher sein, dass dieselbe Frage dieselbe Antwort liefert. Leider ist diese Theorie in den meisten Unternehmen nicht haltbar, und schlimmer noch: Die Prozesse, die zur Schaffung dieser Umgebung eingerichtet wurden, können am Ende schädlicher sein als unterschiedliche Antworten auf dieselbe Frage.

Inline-Anzeige für Alteryx Blog

Der Leitfaden zu modernem Analytics für Anwender von Tabellenkalkulationen

Leitfaden herunterladen

Die unbequeme Wahrheit über die Wahrheit

Lassen Sie uns zunächst darüber sprechen, warum es in Systemen häufig unterschiedliche Zahlen gibt, die unterschiedliche Antworten auf ähnliche Fragen enthalten.

Nehmen wir an, Sie sind ein Fertigungsunternehmen, das Haushaltsgeräte herstellt. Sie möchten wissen, wie hoch die Gesamtkosten aller Teile waren, die im vergangenen Jahr für die Produktion dieser Geräte verwendet wurden, und beauftragen zwei Data Analysts mit der Ermittlung der Kosten. Ein Analyst ermittelt einen Gesamtwert von 100 Millionen US-Dollar und geht davon aus, dass „letztes Jahr“ alle von Januar bis Januar bestellten Teile umfasst.

Der zweite Analyst verwendet zwei leicht unterschiedliche Definitionen. Erstens umfasst die Gesamtzahl der von ihm verwendeten Teile nicht nur die Teile, die im Neuzustand der Geräte verwendet wurden, sondern auch die Teile, die für die Wartung bereits im Einsatz befindlicher Geräte verwendet wurden. Darüber hinaus versteht er unter den relevanten Teilen nicht die bestellten, sondern die tatsächlich bezahlten Teile innerhalb dieses Zeitraums.

Wer hat also recht?

Welche dieser Definitionen ist die richtige, um die Frage zu beantworten? Tatsächlich könnten beide, nur eine oder keine von beiden zutreffen. Es hängt alles davon ab, welches Geschäftsproblem Sie lösen möchten.

Jedes System in einem Unternehmen speichert leicht unterschiedliche Versionen der Zahlen, die jeweils auf den spezifischen Zweck dieses Systems ausgerichtet ist. Der Einkauf konzentriert sich auf die Bestellungen und die Kreditorenbuchhaltung kümmert sich um die Zahlungen. Andere Abteilungen benötigen andere differenzierte Definitionen, um den Anforderungen der Probleme gerecht zu werden, an deren Lösung sie häufig arbeiten. Letztendlich gibt es viele Antworten auf die Frage: „Wie hoch waren die Gesamtkosten aller Teile, die wir letztes Jahr für die Herstellung von Geräten verwendet haben?“.

Die Wahrheit liegt im Auge des Betrachters

Wer kann schon bestimmen, welche Version der Wahrheit die richtige ist? Dieses Beispiel zeigt deutlich, dass die Wahrheit wahrscheinlich im Auge des Betrachters liegt. Wenn die Frage von der Buchhaltung gestellt wird, kann sie – und wahrscheinlich nur sie – bestimmen, welche Version ihren Anforderungen entspricht. Eine separate Gruppe, die versucht, die erhaltenen Antworten zu kontrollieren, ist wahrscheinlich nicht hilfreich.

Es zeigt sich, dass die Wahrheit auch davon abhängt, welche Frage wirklich gestellt wird. Wenn Sie nach den Gesamtkosten aller Teile fragen, die letztes Jahr für die Herstellung von Geräten verwendet wurden, kann ein Analyst durchaus fragen: „Welche Kosten meinen Sie? Sollen Steuern einbezogen werden? Wie sieht es mit den Versandkosten aus?“

So bringen Sie alle auf denselben Stand

Auch wenn manche argumentieren, dass eine einheitliche Version der Wahrheit illusorisch ist, müssen Unternehmen dennoch sicherstellen, dass verschiedene Aspekte von Daten und Analysen zwischen den Teams aufeinander abgestimmt sind. Sehen Sie sich unsere drei Tipps an, die Ihrem Unternehmen dabei helfen, eine einheitliche Version der Wahrheit zu finden.

  1. Daten verantwortungsvoll demokratisieren: Teilen Sie Daten im gesamten Unternehmen, indem Sie für den einfachen Zugriff einen Data Lake erstellen. Aber gehen Sie dabei verantwortungsbewusst mit Data Governance vor. Unternehmen müssen sicherstellen, dass Daten nicht nur für alle Beschäftigten leicht zugänglich, sondern auch genau, zuverlässig, sicher und geprüft sind. Der Weg zu einer einheitlichen Wahrheit beginnt damit, dass alle Teams Zugriff auf dieselben Daten haben. So finden sie genau das, was sie unter ihren jeweiligen Anforderungen suchen.
  2. Datentraining und Weiterbildung anbieten: Fördern Sie Citizen Data Scientists, indem Sie Ihren Beschäftigten die Fähigkeiten vermitteln, Daten in Entscheidungen zu wandeln. Bieten Sie ihnen das entsprechende Training, damit sie bequem und sicher mit Daten arbeiten, präzise Fragen stellen, die Nuancen bei der Antwortfindung erkennen und eigene Erkenntnisse gewinnen können.
  3. Austausch und Wiederverwendung ermöglichen: Stellen Sie sicher, dass Abfragen, Analysemodelle, Hintergrunddokumentation, Dashboards, Berichte und Erkenntnisse geteilt werden. Dies trägt dazu bei, unter Beschäftigten eine einheitliche Sicht auf die Wahrheit zu schaffen. Und es schafft auch Effizienzsteigerungen. Anstatt beispielsweise eine neue Abfrage zur Berechnung des „Gesamtumsatzes“ zu erstellen, könnte ein einfacher Suchvorgang relevante bestehende Abfragen inklusive Dokumentation anderer Teams zutage fördern. Benutzer:innen sollten Transparenz darüber haben, welche Daten abgerufen werden und woher sie stammen, damit sie das kollektive Wissen des Unternehmens nutzen können.

Wenn Ihr Unternehmen sich auf den Weg der digitalen Transformation gemacht hat, würden wir gerne von Ihren Erfolgen und Misserfolgen bei der Suche nach der „Wahrheit“ hören. Lassen Sie uns wissen, wie Sie Unterstützung bieten, oder noch besser, wie Sie selbst durch die Arbeit Ihres Data-Science-Teams befähigt wurden.

Tags