CIO 006 – Big Data oder Big Desaster? 3 Basics für effektives Datenmanagement

Big Data

Big Data oder Big Desaster?

In Folge 6 des CIO Podcasts geht es um 3 Basics für effektives Datenmanagement zur Vorbereitung für Big Data. Was umfasst eigentlich das Thema Datenmanagement ? Vor allen Dingen die folgenden drei Bereiche, die uns durch diese Folge begleiten werden:

  1. Stammdaten und Metadatenmanagement
  2. Data Governance und
  3. Data Analytics.

Folgende Aspekte werden in der Podcast-Folge besprochen:

  • Big Data: Worauf kommt es an? [00:00:30]
  • Bereiche des Datenmanagements [00:02:00]
  • Aspekte eines guten Stammdaten- und Metadatenmanagement [00:04:00]
  • Aufbau und Nutzen von Data Governance [00:08:30]
  • Zwei Herangehensweisen für das Thema Data Analytics [00:10:30]

Ich hoffe der kleine Ausflug in die Datenwelt hat Ihnen gefallen. Ich freue mich über Feedback.

Drei Basics für effektives Datenmenagement für Ihr Ziel: Big Data!

Zunächst mal Daten sind ja der Rohstoff der Digitalisierung oder unseres Informationszeitalters. Der ehemalige CEO von Xing, Stefan Gross-Selbeck:

„Daten sind das Öl des 21. Jahrhunderts.“

Und wenn man sich dieses Zitat mal vor Augen führt, dann sollte man sich erstmal damit beschäftigen wie manage ich im Unternehmen denn eigentlich meine Daten richtig und was muss ich dafür tun?

Big Data: Worauf kommt es an?

Im Zuge der Digitalisierung erheben und sammeln Unternehmen immer mehr und mehr Daten. Aber wie generieren sie aus diesen vielen Daten einen Mehrwert? Wie schaffen sie es diese Informationen oder diese Daten erstmal in Informationen zu wandeln und daraus auch nochmal Erkenntnisse zu ziehen, einen Mehrwert zu schaffen? Wie schaffen sie dann vor allen Dingen aus dieser Flut von Informationen noch das Wesentliche herauszufiltern? Setzen Sie sich zunächst mal strategische Eckpfeiler für Ihr Datenmanagement, wo Sie erstmal festlegen, wo Sie hinwollen. #00:02:03-7#

Ziele, das ist immer wichtig. Vor allen Dingen bei der steigenden Datenmenge, Big Data, da brauchen Sie eine übergeordnete Zielsetzung. Sonst gehen Sie verloren in den Daten, ja (lacht) manche nennen das auch schon in dem Data Lake. Sie haben einen ganzen See voller Daten, aber da müssen Sie auch wisse wie Sie damit umgehen. Also Sie sollten erstmal die richtigen Dinge tun. Das haben wir jetzt gerade schon mal festgestellt.

Bereiche des Datenmanagements

Okay, was sind jetzt die richtigen Dinge im Data Management? Also zunächst mal sollte man dann erstmal schauen, was sind denn die verschiedenen Sichtweisen, die ich auf Unternehmensdaten habe? Ich habe ja verschiedene Bereiche im Unternehmen. Also zum Beispiel Bereiche, die Daten generieren, wie die IT durch diverse IT-Systeme, das Rechnungswesen mit seinen Buchhaltungsdaten, der Vertrieb mit Abschlüssen und so weiter, das Marketing, mit Auswertungen von Kunden und so weiter.

Das heißt ich habe Leute, die produzieren Daten und auf der anderen Seite habe ich Empfänger für diese Datenauswertung, die ich auch machen möchte, zur Entscheidungsunterstützung meiner Geschäftsleitung, Vorstände. Die Controlling-Abteilung fragt immer wieder Daten an. Das heißt, ich habe auf der einen Seite die Datenproduzenten und ich habe auf der anderen Seite die Datenkonsumenten und beide Seiten sollte ich zunächst mal berücksichtigen und mir Gedanken darüber machen, für wen ich diese Daten auch wirklich aufbereite und welche Entscheidungen auf dieser Basis getroffen werden. Und das ist ja erstmal das Entscheidende. Gehen wir nachher bei dem Thema Data Analytics nochmal drauf ein.

Für alle Datenempfänger ist es wichtig, dass die Daten konsistent sind und dass sie die relevanten Fragestellungen dann auch beantworten. Das heißt, dass Sie auch Daten liefern, die dann letztendlich für das Problem hilfreich sind und nicht was völlig anderes.

So, wie erreichen Sie das jetzt? Bevor wir jetzt Überlegungen dazu anstellen wie Sie mit Big Data umgehen, sollten wir erstmal über 3 Basics sprechen.

1. Stammdatenmanagement und Metadatenmanagement

Die Basics ist zum ersten der Punkt Standardmanagement, also ein gutes Standardmanagement sollte man haben. Nehmen wir auch noch Metadatenmanagement hinzu.

2. Data Governance

Der zweite Baustein für das ganze Thema Data Management ist aus meiner Sicht Data Governance. Also mal festzulegen wie man mit den Daten umgeht, wem auch diese Daten gehören. Das ist ja auch nicht immer so einfach zu beschreiben, da gehen wir gleich drauf ein.

3. Data Analytics

Und dann der dritte Punkt, wie Sie diese Daten auswerten mit Hilfe von Analytics-Systemen oder klassischen BI-Systemen.

Aspekte eines guten Stammdaten- und Metadatenmanagement

Für ein gutes Standardmanagement sollten Sie schrittweise und iterativ vorgehen. Meistens haben Sie ja Daten im Unternehmen, die sind über viele Jahre gewachsen. Und Sie können jetzt nicht über Nacht einfach mal eben sagen, okay ich bereinige das mal oder ich mache damit dies und das. Das heißt, Sie haben einfach eine große Menge Daten und da sollte man auch sorgsam mit umgehen. Für ein gutes Stammdatenmanagement ist dann wichtig, dass Sie erstmal identifizieren, was sind eigentlich Ihre geschäftsrelevanten Datenobjekte? Also mit welchen Objekten ist Ihr Geschäftsmodell verknüpft und was brauchen Sie essentiell? #00:05:02-1#

Das sind in den meisten Unternehmen Kundendaten, Produktdaten oder Materialdaten und Lieferantendaten. Es können auch noch weitere dazukommen, also Kontendaten und so weiter. Das kommt wirklich darauf an wie Ihr Geschäftsmodell da aufgebaut ist. Und jetzt fragen Sie sich vielleicht, na ja gut jetzt sagt die Frau Koch hier irgendwie, um unsere Stammdaten kümmern. Gut, warum soll ich mich jetzt um so vermeintlich anspruchslose Daten kümmern? Ich gebe Ihnen mal ein paar Beispiele.

Wie viel kaufen Sie bei Ihren Lieferanten ein?

Nehmen wir an, Sie möchten auswerten wieviel Sie bei einem Lieferanten einkaufen. Jetzt haben Sie aber ein System, wo der Lieferant, ich sage jetzt einfach mal zehn Mal angelegt ist, zehn Mal der gleiche Lieferant, eben aber immer mit einer anderen Lieferantennummer und Sie haben keinen Mechanismus diese Daten zusammenzuführen zu einem Konzernlieferantenschlüssel oder sowas, wo Sie dann diese Datenfelder mappen können.

Wenn Sie jetzt auswerten wollen, wieviel Einkaufsvolumen Sie bei diesem Lieferanten lassen, dann ist es ja, wenn Sie da keinen Mechanismus haben, ist es Glückssache, ob Sie jetzt – in Anführungsstrichen – den richtigen Lieferanten auswählen. Und Sie werden aber wahrscheinlich dann nicht die Summe aus allen bekommen. #00:06:08-2#

Was wissen Sie über Ihre Kunden? Die Kundendatendaten sind wertvoll.

Das mal ein Beispiel. Anderes Beispiel Kundendaten. Sie möchten Absatzzahlen pro Kunde ermitteln. Gleiche Thema auch wieder, wenn Sie den Kunden nicht gemappt haben. Noch was Anderes ist den Kundenlebenszeitwert zu ermitteln, also mal zu überlegen, welchen Deckungsbeitrag der Kunde über die Laufzeit einer durchschnittlichen Geschäftsbeziehung erzielt, abgezinst auf den Betrachtungszeitpunkt. Muss ich ein bisschen rechnen. Aber jetzt, wenn wir diese Dublettenthematik mal berücksichtigen. Das ist der eine Punkt und den haben wir gerade schon besprochen.

Nehmen wir einen anderen Punkt. Wer ist denn Ihr Kunde? Ist das der, der die Ware erhält? Ist das der, der Ihre Rechnung bezahlt und wann ist ein Kunde eigentlich eine Dublette? Wenn der Name und der Ort übereinstimmen oder gibt es da noch andere Faktoren? Ich kann Ihnen aus diversen Gesprächen in Unternehmen sagen, alleine über diese paar Punkte entfachen in Unternehmen schon wahnsinnige Diskussionen. #00:07:07-8#

Das heißt, mein Tipp. Legen Sie ganz zu Beginn, wenn Sie mit dem Thema Data Management, Big Data überhaupt in Kontakt kommen oder, wenn Sie das anstreben, legen Sie eine Definition für zum Beispiel mal Ihren Kunden fest. Wie soll der zusammengeführt werden? Wann ist der doppelt? Was sind wirklich Definitionen von Ihren Stammdaten?

Wie viele Produkte verkaufen Sie? Und ab wann ist ein Material ein Produkt?

Bei Produkt- und Materialdaten, da kommt das Thema Metadaten ins Spiel, ist aber genauso bei Kunden auch relevant, hier haben wir einfach mal das Beispiel Produkthierarchie rausgegriffen. Hierarchien sind Metadaten, die beschreiben also Daten über Daten und Sie sollten dann in der Lage sein Ihre Datensätze auch miteinander in Beziehung zu setzen. Muss ja auch wieder entsprechende Information vorhanden sein.

Was ja immer noch hinzukommt, ist der Punkt Altdaten. Das ist aus meiner Sicht auch immer wieder ein Thema. Gerade, wenn Sie Firmenübernahmen haben, Carve Outs und so weiter, haben Sie häufig Systeme, die werden einfach kopiert und die ganzen Daten werden da drin gelassen. Natürlich, wenn Sie jetzt über Datenauswertungen nachdenken, ist das auch ein Punkt. Das kann man sich vorstellen. Weiterhin, wenn Sie über Stammdatenmanagement reden, nur hier ganz kurz angerissen, sollten Sie sich darüber Gedanken machen, in welcher Form Sie Ihre Daten synchronisieren. #00:08:03-2#

Also wollen Sie ein zentrales Stammdatenmanagement installieren, wo Sie die Daten synchronisieren oder was dann Ihre Datensätze verteilt oder wollen Sie Daten alternativ in dem jeweiligen dezentralen System erfassen und auch vielleicht weiter verwalten und das ganz aufwendig synchronisieren? Da muss man sich einfach Gedanken drübermachen. Gibt es für beides Vor- und Nachteile. Sollte man sich aber einfach auch mit beschäftigen.

Aufbau und Nutzen von Data Governance

Gut. Kommen wir zum Punkt Data Governance. Im ersten Schritt haben wir ja jetzt identifiziert, was für Datenobjekte wir überhaupt betrachten wollen und was in unserer Branche und im Geschäftsmodell relevant ist und dann sollte man sich im zweiten Schritt Gedanken darübermachen, wie ich denn die Governance, also die Steuerung dieser Daten übernehme? Da gibt’s verschiedene Arten eine Data Governance aufzusetzen. Im ganz Allgemeinen hat die Data Governance Funktion die Aufgabe Regeln und Prozesse für das Management von Daten im Unternehmen festzulegen. Da gibt’s zwei Hauptrollen, die da mit reinspielen. #00:08:59-9#

Verständigen Sie sich auf Data Owner.

Da ist einmal der Data Owner. Der Data Owner und der Data Steward. Der Data Owner trifft Entscheidungen, ist verantwortlich für die Daten, für das eine Datenobjekt, das heißt, es gibt dann zum Beispiel einen Data Owner für den Kunden, es gibt einen Data Owner für die Produktdaten. So und die verantworten alles, was so um dieses Datenobjekt herum passiert, entwickeln Standards, verantworten die Konzepte und sind auch für die Umsetzung der jeweiligen oder Durchsetzung dieser Standards verantwortlich.

Mehrere Data Stewards pro Datenobjekt helfen bei der Umsetzung.

Der Data Steward, der ist quasi die Ebene da drunter, immer direkt einem Data Owner zugeordnet und der kümmert sich da drum, diese Anforderungen für die jeweiligen Teilbereiche nochmal weiter aufzugliedern. Das heißt, zum Beispiel, wenn Sie einen Kundendatensatz haben, dann kümmert sich zum Beispiel ein Data Steward um die Buchhaltungsinformation im Kundenstammsatz und gibt halt an, was mit diesen Daten passiert.

Beim Lieferanten wäre das vielleicht zum Beispiel auch, hätten Sie einen Data Steward für den Einkauf und der würde dann eben die Einkaufsdaten verwalten oder eben da schauen, was es für Standards und Anforderungen gibt, die aus den Fachbereichen an diesen Data Steward dann ran getragen werden. #00:10:01-7#

Das sind zunächst mal die wesentlichen beiden Rollen. Wenn Sie die haben, dann können Sie da schon sehr gutes Data Governance Modell aufsetzen. Aus meiner Sicht essentiell, weil es, habe ich ja eben erklärt, immer wieder diese Diskussion gibt, was ist denn jetzt eigentlich der Kunde und mit welcher Definition und so weiter? Und wenn Sie das alles nicht festgesetzt haben, also, wenn es eben für diese Punkte keine Governance gibt, dann ist es ganz schwer in solchen Diskussionen da irgendwie mal zum Ende zu kommen.

Deswegen mein Tipp Data Governance: Vor allen Dingen bei immer größer werdenden Datenmengen extrem wichtig. Gut. Jetzt haben wir Stammdatenmanagement und Data Governance.

Zwei Herangehensweisen für das Thema Data Analytics

Der dritte Punkt ist Data Analytics. Jetzt geht’s um die Aufbereitung und die wirkliche Auswertung von Daten. Da gibt’s im Grunde mal zwei verschiedene Ansätze wie man da rangehen kann. Es kommt immer so ein bisschen auf die Fragestellung an, welchen Ansatz man dann in Betracht ziehen sollte. Ich erkläre einfach mal, was die beiden Ansätze meiner Meinung nach so sind. #00:11:04-9#

Die deduktive Informationsermittlung geht vom Ziel aus.

Die deduktive Methode. Das heißt, ich gehe von einem Ziel aus und überlege dann, welche Informationen ich benötige, um die Entscheidung zu treffen. Dann entsteht normalerweise ein Informationskatalog mit Kennzahlen und relevanten Informationen, die ich benötige, um diese Entscheidung zu treffen. Dann kann ich hergehen, diese Daten zusammensuchen, zusammensuchen – in Anführungsstrichen – aus meinen Quellsystemen und ein entsprechendes Analytics Modell aufbauen, diese Daten auswerten und den Empfängergruppen zur Verfügung stellen. Das ist der eine Punkt.

Die induktive Informationsermittlung kommt aus den Datendetails.

Der andere Punkt ist, die induktiven Daten. Die kann ich erheben und dann auch analysieren. Da habe ich aber einen ganz anderen Ansatz. Da geht’s da drum erstmal die große Menge an Daten, die ich im Unternehmen schon habe, zu analysieren und zu schauen, zu was für neuen Erkenntnissen komme ich denn mit diesem Thema, wenn ich das analysiere. Das ist eigentlich mehr oder weniger der klassische Data Mining Ansatz. Das ist da zum Beispiel, wenn Sie im Supermarkt die ganzen Kassenbons analysieren und das Kaufverhalten der Kunden vorhersagen – in Anführungsstrichen – oder da Relationen bilden. #00:11:58-9#

Das sind zum Beispiel Mechanismen, die bei Amazon und Co. schon im Einsatz sind. Kunden, die dies und jenes kaufen, kauften auch was Anderes. Ja und diese Synchronisation, die wird eben halt aus den bestehenden Daten abgeleitet. Da werden dann Algorithmen drüber laufen gelassen, damit Sie zu neuen Erkenntnissen kommen. Sowas bietet sich zum Beispiel an, wenn Sie Sensorikdaten haben. Also Sie kriegen eine riesige Datenmenge an Sensordaten und müssen daraus jetzt irgendwie was erkennen. Zum Beispiel wie störungsanfällig ist denn diese Maschine? Da macht natürlich Sinn, dass Sie dann mit Algorithmik drangehen, weil Sie kennen ja das Ziel noch nicht. Also Sie wissen ja noch gar nicht, was auftreten kann.

Data Analytics Systeme

So erst, wenn Sie eine klare Fragestellung und eine Zielsetzung haben und eben diesen Ansatz für sich auch bestimmt haben, dass Sie sagen, ich möchte jetzt an den Ansatz so rangehen und an den anderen Ansatz so rangehen, dann sollte man aus meiner Sicht die Frage nach der Technik stellen. Erst dann. Häufig, das sehe ich immer wieder in IT-Abteilungen, da sagt man schon mal, ja super ich habe da jetzt so ein Tool gekauft, jetzt wird alles gut. Und das ist gerade in dem Bereich Data Analytics aus meiner Sicht eben nicht so. #00:12:59-2#

Weil da ist erstmal wichtig, haben Sie die richtigen Informationen, haben Sie die richtigen Fragen gestellt? Und dann kann man sich über das Tool Gedanken machen und das richtig aufsetzen. Aber das ist echt Schritt 2. Vorher sollte man die Hausaufgaben und die Basics erledigt haben. Und gerade im Analytics-Bereich geht’s auch immer wieder da drum zu gucken, wer ist meine Zielgruppe, was möchte eigentlich der Fachbereich, was braucht der für Daten und ein schönes Beispiel immer wieder angetroffen.

Weniger ist mehr bei der Analytics Visualisierung!

Im Finanzmanagement Reporting sehen Sie immer, immer wieder, dass da wahnsinnig viele Reports entstehen, dass da Unmengen an Tabellen und Zahlen entstehen. Sie nachher ich sage mal 190 Seiten Reports pro Monat haben und da fragt man sich doch wirklich, wer liest das alles? Also guckt sich das wirklich jemand an?

Und aus meiner Sicht macht es viel mehr Sinn diese ganzen Daten eben auf das Wesentliche zu komprimieren und zu sagen, ich habe ein Dashboard mit den wesentlichen Kennzahlen, mit den wesentlichen Punkten und da kann man eben draufklicken. Wenn ich dann noch eine Ebene tiefer gehen möchte und mir Details angucken, das funktioniert dann auch. Aber man sollte eben nicht den Empfänger mit wahnsinnig vielen Daten überfrachten, um zu zeigen. Ja wir machen Big Data. #00:14:04-6#

Die Kunst (lacht) ist ja aus diesen Big Data oder aus diesen riesigen Datenmengen oder eben aus welchen Datenmengen auch immer das Wesentliche raus zu filtern und nicht den Empfänger damit zu überfrachten.

Die Fachbereiche mitnehmen bei der iterativen Entwicklung.

Gut. Einen weiteren Punkt sollte man sich auch vor Augen führen aus meiner Sicht, wenn man immer aus dem Blickwinkel der IT guckt. Wir gucken ja häufig aus der IT-Perspektive und sagen, ja der Fachbereich, der muss sich da erstmal reindenken, aber der sieht ja auch immer nur das Dashboard, also die Spitze des Eisbergs und weiß gar nicht, was unter der Wasseroberfläche eigentlich ist. Also das komplexe BI-System, diese ganzen Mechanismen, die dahinter ablaufen, die kennt er ja gar nicht.

Das wissen wir aus der IT heraus und wenn man in den Gesprächen mit dem Fachbereich ist, ist aus meiner Sicht sinnvoll mal zu sagen, okay lieber Fachbereichsverantwortlicher, wir haben folgende Entwicklungsstufen. So und so gehen wir da vor und wir konzentrieren uns erstmal auf deine Zielsetzung, sammeln die Daten zusammen. Da siehst du auch erstmal nichts von. Aber, wenn wir soweit sind, dann stellen wir dir ein Front-End zur Verfügung und entwickeln das iterativ weiter. #00:15:02-0#

Aber, das ist auch so ein Punkt. Nicht beim ersten Entwurf erwarten, dass irgendwie die Nachkommastellen schon ausgerichtet sind und irgendwie die Farben passen. Das sind dann so Sachen, die kann man ja später machen, aber das ist ja das Wesentliche, dass man erstmal die richtigen Datensätze zusammengebracht hat. Und das ist das, worauf man aus meiner Sicht auch so ein bisschen das Augenmerk lenken sollte und nicht sagen würde, ja sieht schön aus, wird schon stimmen, wir sind da ganz sicher, dass Sie das gut gemacht haben.

Also jetzt haben wir eigentlich so die wesentlichen 3 Punkte besprochen. Aus meiner Sicht, die man berücksichtigen sollte als Fundament im Datenmanagement, vor allem immer hervorzuheben die Governance, um das Thema Big Data Analysen angehen zu können, damit Sie es auch wirklich nachhaltig vorantreiben können und nicht über die Basics stolpern. #00:15:45-4#

Bildnachweis: © CC0 Public Domain/ pixabay.com

Ihr Feedback

Wenn Ihnen der Podcast gefällt, bewerten Sie ihn bitte auf iTunes!
Eine Anleitung finden Sie hier. Sie helfen damit den Podcast bekannter zu machen. Herzlichen Dank!

Wie gefällt Ihnen diese Folge des CIO Podcasts? Senden Sie Ihr Feedback, Anregungen und Wünsche einfach über das Kontaktformular:



* = Pflichtfeld

Weitere Podcast Folgen finden Sie hier.

Veröffentlicht in CIO Podcast Getagged mit: , ,