Wie Data Exploration Ihnen Verbesserungs­potential aufzeigen kann!

Dr. Jonas Steeger

Wenn Maßnahmen entwickelt werden sollen, hilft oft ein Blick in die Basisdaten - und um da durchzublicken, kann eine explorative Analyse helfen. Wir nehmen uns Walmarts Sales-Daten vor und zeigen Ihnen wie Sie vorgehen können!


Wir nehmen uns Walmart's Sales-Daten vor

Wir haben uns bereits in einigen Posts mit Maßnahmen beschäftigt.

Grundtenor: Pack das Problem an der Wurzel und los.

Doch scheinbar sind wir stillschweigend davon ausgegangen, dass die Problemsituation und -Ursache bekannt ist. Dass dem nicht so ist, wissen wir ehrlich gesagt auch. Doch was kann gemacht werden, wenn man nur weiß, dass etwas nicht stimmt, aber nicht so wirklich genau und überhaupt warum? Oft liefert ein Blick auf die Ergebnisse der Basisdaten und wir wollen Ihnen zeigen, wie Sie anhand einer Datenuntersuchung vorgehen können!

Als Beispiel widmen wir uns der Mutter aller Probleme: Können wir den Umsatz steigern? Dazu haben wir uns historische Umsatzdaten von Walmart ausgesucht – einfach, weil diese Informationen öffentlich verfügbar sind (auf Kaggle… mehr dazu in einem anderen Post später).

Mit was für Daten haben wir es zu tun?

Das Unternehmen Walmart liefert uns wöchentliche Umsatzahlen für 45 Stores über drei Jahre. Moment…das sind 45 Stores mal 3 Jahre mal ca. 52 Wochen… naja, wird schon passen und los Excel. Oha…doch ein bisschen mehr. Denn Walmart liefert uns die Umsätze gesplittet nach Departments in der Stores. Oh man, und so richtig wochenbasiert sind die Ergebnisse auch nicht…eher tagesbasiert…aber irgendwie nicht alle Tage.

Ganz schönes Kuddelmuddel. Willkommen im echten Leben. Resultat: Für den ersten Store gibt es bereits über 10.000 Datenpunkte - und in Summe über 400.000… Spätestens jetzt ruft vielleicht der ein oder andere nach dem Controlling und/oder fragt sich, warum Excel so verdammt langsam ist.

Was tun, wenn Excel nicht mehr weiterhilft?

Viele Excel-Poweruser würden für schnelle Ergebnisse vielleicht das Datenset aufteilen und mehrere Dateien benutzen. Aber das ist aufwendig und fehleranfällig. Nun kann man nicht verlangen, dass jeder die Zeit hat sich mal so mir nichts dir nichts in Dingen wie Python oder R einzulesen. Allerdings es gibt genügend Softwares und Technologien, die auch mit größeren Datenmengen klarkommen und bei denen man durch Klick-and-Point auch einiges an Rückschlüssen ziehen kann (z.B. Tableau und Stata).

Datenkuddelmuddel? Hauptstraßen bauen und visualisieren!

In solchen Fällen gilt zunächst das Prinzip „Hauptstraße“. Also, auf Details verzichten und ein/zwei Ebenen vorher anfangen. So aggregieren wir bei unseren Walmart-Daten erstmal auf Monate und auf Stores. Die Ergebnisse heruntergebrochen auf Departments, Wochen und Tage können wir uns auch noch später ansehen. Um ein Gefühl für die Daten zu bekommen, ist eine Visualisierung meist der erste Schritt. Wie wäre es hiermit: ein Scatterplot der monatlichen Umsätze je Store über die Zeit.



Relativieren Sie, was das Zeug hält!

Schöne Graphik. Irgendwie alles relativ voll, aber lässt es doch auch Rückschlüsse zu. Scheinbar gibt es einige Stores, die sehr hohe Umsätze in einigen Monaten erzielen: 600.000 US-Dollar und mehr! Dann gibt es wiederum einige, die eher im unteren Bereich rumkrebsen. Eins ist klar, die Varianz ist sehr groß. Daher sollten wir nicht alle Stores gleich behandeln, sondern z.B. nach Größe clustern, oder zumindest nach der Verkaufsfläche relativieren.

Alles klar, dann gucken wir uns doch die monatlichen Umsätze im Unternehmen nach Größe der Stores an (hier in Quadratlatschen, ft²):



Nicht verwunderlich: Es scheint einen recht klaren Zusammenhang zu geben. Je größer der Laden, desto mehr Umsatz. Aber gilt das für das ganze Jahr? Oder gibt es vielleicht Stores, bei denen die Umsätze über das Jahr schwanken? Das sollten wir vielleicht prüfen. Noch etwas fällt auf: es scheint so etwas wie Gruppen oder „Store-Typen“ zu geben. Mit einem bisschen Eyeballing (des Statistikers Alptraum) können wir z.B. grobe Gruppen bei 75.000 ft², 125.000 ft² und 175.000 ft² ziehen. Dieses Vorgehen ist komplett willkürlich. Gerade die Grenze rund um 125.000 ft² ist sicherlich diskussionswürdig. Aber genau darum geht es: ohne große Analyse in die Daten „hineinfühlen“ – genaue Analysen über eine Software & Tools kann man auch noch danach machen.

Gruppen bilden und vergleichen!

Wir haben jetzt also die Gruppen S, M, L und XL mal ganz grob gebastelt. Ok, gucken wir uns die Stores-Typen mal über die Zeit an und relativieren sie zur Verkaufsfläche der Stores. Ganz im Sinne der Relativierung, können wir zusätzlich uns auch die Stores im Mittel ansehen – dann kann man besser vergleichen. Los geht’s:



Naja, die Graphik ist sicherlich nicht schön – aber darum geht es an dieser Stelle nicht. Es geht darum ein Gefühl für die Daten zu entwickeln und ein learning daraus zu ziehen - und das haben wir geschafft. Denn nun wissen wir: das Geschäft ist saisonal. Peaks im März-April, im Juni-Juli, im September-Oktober und im November-Dezember. Dafür kann es viele Gründe geben. Zum Beispiel das Wetter, oder auch Feiertage wie Labor Day im September, Thanksgiving im November und natürlich Weihnachten im Dezember. Allerdings zeigen die Analysen, dass die kleinen Stores zwar auch saisonal unterwegs sind, aber etwas konstanter. Zudem scheinen die kleineren Stores mehr Umsatz je Fläche zu generieren.

Dennoch ist das Pattern relativ ähnlich bei allen Stores. Wir können für eine erste Analyse also alle Stores einfachheitshalber mehr oder minder über einen Kamm scheren.

Verlauf über die Zeit untersuchen!

Nun können wir endlich die Daten als das behandeln, was sie eigentlich sind: Panel-Daten. Also Daten, die Information (z.B. den Umsatz) für eine Observationseinheit (den Walmart-Store) über die Zeit bieten. Das birgt enorme Vorteile. Denn Wir können mit recht großer Sicherheit davon ausgehen, dass die Umsätze von Monat zu Monat nicht vollkommen unabhängig voneinander sind. Sie sind sicherlich pfadabhängig.

Eine einfache Art und Weise, um ein Gefühl für die Perfomance und der Pfadabhängigkeit der Stores über die Zeit zu bekommen, ist die Wachstumsrate. Da wir wissen, dass die Stores unterjährlich relativ ähnliche Pattern aufweisen, können wir den jährlichen CAGR als Indikator nutzen. Um wiederum ein Gefühl zu bekommen, plotten wir die Wachstumsrate gegenüber der Größe. Um die Ergebnisse besser einordnen zu können, ergänzen wir noch die Durchschnitte:



Wissen umsetzen und Maßnahmenpotential identifizieren!

Und schon haben wir das zum ersten Mal die Fühler Richtung „Maßnahmen“ ausgestreckt. Nun könnten wir identifizieren, warum einige Stores so unfassbar gut performen und einige eben auch nicht (alles unter CAGR=0). Insbesondere die kleineren scheinen trotz hoher Flächeneffizienz im drei Jahreszeitraum negative Wachstumsraten zu verbuchen.

Doch gibt es auch bei den ganz Großen Unterschiede. Da es so wenige sind, könnte man sicherlich die Store-Manager zu Daten befragen oder qualitative Vergleiche ziehen (Region, Wettbewerb, Produktportfolio, Durchschnittliches Einkommen der Abnehmer usw.). Auch eine Like-For-Like-Analyse könnte noch weitere learnings geben. Natürlich könnten wir das ganze Prozedere auch wiederholen – z.B. für die einzelnen Departments oder auf Wochenbasis. Vielleicht würde uns wieder etwas auffallen.

Kann dieses Vorgehen auch Ihnen helfen?

In recht kurzer Zeit konnten wir einen ersten Eindruck zu den Ergebnissen der Walmarts Stores gewinnen - trotz der recht unübersichtlichen Informationen. Die kausalen Zusammenhänge sind mit absoluter Sicherheit nicht ganz so einfach wie beschrieben. So sind die Stores ähnlicher Größe und Flächeneffizienz sicherlich nicht per se vergleichbar. Regionalität, Konkurrenz, Bevölkerungs- und Einkommensdichte und viele andere Faktoren erklären bestimmt viel der hohen Varianz. Aber zumindest gibt es nun einen Startpunkt für eine mehr oder weniger fundierte Diskussion mit den Kollegen.

Wir sind zuversichtlich, dass Sie nun ein Gefühl für Walmarts Storekonzept haben. Stellen Sie sich vor, was Sie mit diesem Vorgehen und Ihren eigenen Sales-Daten anstellen könnten! Wir wünschen Ihnen viel Spaß dabei! Und sollte eine Maßnahmen entstehen und Sie möchten Sie umsetzen: Falcon kann Ihnen dabei helfen! Wir helfen gerne! Fragen Sie uns einfach via info@nordantech.com

Kennen Sie schon unsere Software Falcon?

Unsere Software Falcon unterstützt Sie bei der Umsetzung Ihrer komplexen Projektportfolios. Schaffen Sie klare Verantwortlichkeiten und bekommen Sie eine einfache, digitale Übersicht über das gesamte Portfolio, die Ziele und die Entwicklung. Damit sparen Sie viel Zeit bei der Planung und Organisation. Ihre Kollegen finden die wichtigen Informationen an einem Ort und können sich endlich auf ihre Aufgaben konzentrieren.

Möchten Sie mehr erfahren?

Unter folgendem Link entdecken Sie alle relevanten Informationen zu Falcon. Außerdem haben Sie die Möglichkeit mit uns einen Demo-Call einzurichten. In dem Call schauen wir mit Ihnen zusammen Falcon im Detail an und sprechen über die möglichen Anwendungsbereiche in Ihrem Unternehmen.

Mehr über Falcon

Sie möchten mehr erfahren?

Gerne sprechen wir mit Ihnen über Ihr Projekt und die Vorteile, die Ihnen die Implementierung einer PPM Software bringen wird.

Callback illustration Ihr Ansprechpartner: Christian Kuhs
Ihr Ansprechpartner: Christian Kuhs
🍪

Wir würden gerne Cookies verwenden, um die Nutzerfreundlichkeit unserer Website zu verbessern.