Was ist Datenzusammenführung?

Datenzusammenführung ist ein Prozess, bei dem Daten aus mehreren Quellen
kombiniert werden, um ein verwertbares analytisches Dataset für die
Entscheidungsfindung im Unternehmen oder für einen bestimmten Geschäftsprozess
zu erstellen. Dieser Prozess ermöglicht es Organisationen, aus einer Vielzahl
von Quellen einen Mehrwert zu ziehen und tiefergehende Analysen zu erstellen.

Die Datenzusammenführung unterscheidet sich insofern von der Datenintegration
und der Aufbewahrung von Daten in Data Warehouses, als ihr hauptsächlicher
Nutzen nicht darin besteht, eine eindeutige Version der Wahrheit zu schaffen,
die in Data Warehouses oder anderen Aufzeichnungssystemen eines Unternehmens
gespeichert wird. Stattdessen wird dieser Prozess von einem Geschäfts- oder
Datenanalysten durchgeführt, mit dem Ziel, ein Analyse-Dataset zu erzeugen,
das bei der Beantwortung bestimmter geschäftlicher Fragen hilft.

Warum ist Datenzusammenführung wichtig?

Durch Datenzusammenführung können Datenanalysten Daten jeder Art und aus jeder
beliebigen Quelle in ihre Analysen integrieren, um schnellere, tiefergehende
Erkenntnisse über das Unternehmen zu erhalten.

Durch die Kombination von zwei oder mehr Datasets werden häufig wertvolle
Informationen aufgedeckt, die nicht entdeckt würden, wenn die Daten nicht
zusammengeführt worden wären – Informationen, die eine neue Perspektive bieten
und zu besseren Geschäftsentscheidungen führen können.

Analysten haben sich traditionell auf VLOOKUPs, Skripte und mehrere Tabellen
gestützt, um Datasets zu erstellen. Das kann jedoch umständlich und
zeitaufwendig sein. Die Nutzung manueller Prozesse und das Zurückgreifen auf
Data Scientists bei der Erstellung analytischer Datasets ist zunehmend
ineffektiv, denn es ist nicht mit der Menge an Ad-hoc-Anfragen skalierbar, die
Analysten erhalten.

Module für die Datenzusammenführung beschleunigen den Prozess der Erstellung
von Datasets und können Analysten und Führungskräften dabei helfen, genauere
Antworten zu erhalten.

Um an der Spitze der Innovation zu stehen, muss sich die Datenanalyse auf
generelle geschäftliche Fragen konzentrieren, anstatt auf Details von Tabellen
und manuelle SQL-Abfragen. Datenzusammenführung kann es Analysten ermöglichen,
den vollen Nutzen aus ihren sich ausweitenden Rolle zu ziehen, genauso wie aus
der Erweiterung der Daten, die zum Treffen wichtiger Geschäftsentscheidungen
erforderlich sind.

Der Prozess der Datenzusammenführung

Data Blending Process

Es gibt zwar viele verschiedene Methoden, um Daten zusammenzuführen, von
inneren und äußeren Verknüpfungen („Joins“) bis hin zu Fuzzy Matching und
Unions. Aber Datenzusammenführung läuft auf vier einfache Schritte hinaus.

 

Vorbereitung der Daten

Der erste Schritt bei der Datenerfassung besteht darin, zu fragen, welche
Informationen hilfreich sein könnten, um die gestellten Fragen zu beantworten.
Identifizieren Sie relevante Datasets aus verschiedenen Quellen. Dabei kann
eine große Bandbreite von Strukturen oder Dateitypen verwendet werden. Alle
enthaltenen Datenquellen müssen eine Dimension gemeinsam haben, um kombiniert
werden zu können.

Diese unterschiedlichen Typen in eine gemeinsame Struktur umzuwandeln, die
eine sinnvolle Zusammenführung ermöglicht, ohne die ursprüngliche Datenquelle
zu verändern, ist etwas, was durch moderne Analysetechnologien automatisiert
und wiederholbar möglich ist.

 

Zusammenführen von Daten

Kombinieren Sie die Daten aus verschiedenen Quellen und passen Sie jede
Verknüpfung auf Grundlage der gemeinsamen Dimension an, um eine nahtlose
Datenzusammenführung zu gewährleisten.

Denken Sie an die gewünschte zusammengeführte Ansicht und schließen Sie nur
Daten ein, die für die Beantwortung der gestellten Fragen unerlässlich sind,
sowie Felder, die diesen Antworten einen zusätzlichen Kontext geben können,
wenn eine Analyse stark beansprucht wird. Das daraus resultierende Dataset
sollte leicht verständlich und den Stakeholdern leicht zu erklären sein.

Kehren Sie zu diesem Schritt zurück, um Daten in einen Workflow zu integrieren
oder aus diesem zu entfernen und die Analyse weiter auszubauen.

 

Bestätigen der Ergebnisse

Es ist kein Geheimnis, dass das Kombinieren von Daten aus verschiedenen
Quellen zu zahlreichen Problemen mit der Kompatibilität oder Genauigkeit
führen kann. Untersuchen Sie die Daten, um die Ergebnisse zu bestätigen, nicht
abgeglichene Datensätze zu erkunden und Genauigkeit und Konsistenz im gesamten
Dataset sicherzustellen.

Bereinigen und strukturieren Sie die Daten zunächst für den gewünschten Zweck.
Überprüfen Sie dann das neue Dataset, um sicherzustellen, dass Datentyp und
-größe im für die Analyse gewünschten Format vorliegen.

Prüfen Sie abschließend das Ergebnis der Zusammenführung mit kritischem Blick.
Dies ist eine gute Gelegenheit, die Ergebnisse auf nicht abgeglichene
Datensätze zu untersuchen und vielleicht zu zusätzlichen, der Zusammenführung
vorgelagerten Datenvorbereitungsaufgaben zurückzukehren.

 

Ausgabe der Daten

Sobald die harte Arbeit der Datenzusammenführung erfolgt ist, ist es an der
Zeit, die Daten im richtigen Business-Intelligence-System zu implementieren,
damit das zusammengeführte Dataset bei der Erreichung des Ziels helfen kann.

Dies bedeutet, dass die ausgegebenen Daten anschließend wieder in einer
Datenbank gespeichert, in einen operativen Prozess aufgenommen, mit
statistischen, Geodaten- oder Prognosemethoden weiter analysiert oder auch in
Datenvisualisierungssoftware wie QlikView oder Tableau übernommen werden
können.

Datenzusammenführung und Analyseweg

Die Datenzusammenführung ist ein entscheidender Schritt auf dem Weg zur
Analyse, obwohl die Menge der Datenquellen, die ein Unternehmen möglicherweise
hat, die Datenzusammenführung als ein komplexes Unterfangen erscheinen lassen
kann.

Mit der
Analytic Process Automation™-Plattform
von Alteryx ist Datenzusammenführung weniger überwältigend und leichter
zugänglich. Analysten können detaillierte Erkenntnisse bereitstellen, indem
sie interne Daten, Daten von Drittanbietern und Daten aus der Cloud
zusammenführen und diese dann mithilfe von Geodaten- und Prognosebausteinen
per Drag & Drop analysieren. Andere Bausteine wie Fuzzy Matching ermöglichen
es, zwei Datasets anhand ähnlicher, aber nicht identischer Attribute
(typischerweise Namen und Anschriften) abzugleichen.

Darüber hinaus lassen sich Alteryx-Workflows zur Optimierung, weiteren
Datenzusammenführung, Bearbeitung, Aktualisierung und Analyse einfach
speichern und wiederholen.

Mit der APA-Plattform können Geschäftsanalysten, IT-Benutzer und Data
Scientists gleichermaßen unbegrenzte Kombinationen von Daten zusammenführen
und analysieren, um handfeste Geschäftsergebnisse zu erzielen. Das bedeutet,
dass Benutzer den Zugriff auf Daten demokratisieren, manuelle Prozesse
optimieren und automatisieren und ihre Erkenntnisse mit erweiterten
Low-Code-/No-Code-Analysen verbessern können.

erste Schritte bei der Datenzusammenführung machen

Alteryx wurde entwickelt, um jeden Schritt des Prozesses der
Datenzusammenführung einfach und intuitiv zu gestalten. Sehen Sie sich das
Starter-Kit für die Datenzusammenführung
an, um einen tieferen Einblick in die Datenzusammenführung zu erhalten, und
erfahren Sie, wie Sie:

  • Transaktionen und Kunden zusammenführen, um Erkenntnisse aus visueller
    Berichterstellung zu liefern und Trends und Chancen zu erkennen
  • die schnelle Zusammenführung per Fuzzy Matching ähnlicher, aber nicht genau
    übereinstimmender Daten ermöglichen und diese in automatisierte Workflows
    einspeisen, um Echtzeit-Erkenntnisse zu erhalten
  • Geodaten zusammenführen, um die Verteilung von Werbegebieten zu berechnen,
    den Umsatz zu steigern und den Return-on-Investment (ROI) zu verbessern

Um mehr über Alteryx zu erfahren und erster Hand zu erleben, wie Analysten und
Führungskräfte die Funktionen zur Datenzusammenführung, -verarbeitung,
-analyse und Berichterstellung zu Ihrem Vorteil nutzen können,
installieren Sie jetzt Ihre kostenlose Testversion.

Nächster Begriff
Cloud Data Warehouse (CDW)