Warenkorbanalyse: Dem Kaufverhalten auf der Spur

Die Warenkorbanalyse (Market Basket Analysis) ist ein datenbasierter Ansatz mit dem Ziel, strukturelle Zusammenhänge im Kaufverhalten zu finden. Die Datengrundlage dafür bilden Warenkörbe, also die in einem bestimmten Zeitraum erworbenen Produkte. Die Rohdaten können also beispielsweise so aussehen:


Die ersten drei Zeilen umfassen eine Transaktion, in dem Fall eine Rechnung, in der drei Artikel gekauft wurden, nämlich die Tonerkartuschen in blau, schwarz und gelb. Für die Warenkorbanalyse reichen eigentlich schon die ersten beiden Spalten, also eine eindeutige Nummer oder Bezeichnung für die Transaktion und die darin beinhalteten Items. Die restlichen Daten, wie z.B. Stück, Preis und Umsatz sind nicht unbedingt nötig, eröffnen aber das Feld für weiterführende Analysen.

Das Ziel der Warenkorbanalyse besteht darin, Artikel zu identifizieren, die den Kauf weiterer Artikel implizieren. Es werden sogenannte Assoziationsregeln gefunden, also Wenn-Dann-Beziehungen, wie z.B.

„Wenn ein Kunde Pizzateig kauft, dann kauft er mit 30%iger Wahrscheinlichkeit auch Mozzarella“

Oft entsteht der Eindruck, dass die Warenkorbanalyse eine reine Domain des Einzelhandels ist. Dabei kann ein Transportunternehmen ebenso gut das Kaufverhalten seiner Kunden untersuchen wie ein Restaurant. Die Rohdaten müssen einfach nur die in einem Verbund getätigten Käufe zusammenfassen, wie etwa in folgenden Beispielen:

Das Transportunternehmen kann beispielsweise die Daten aus einem ganzen Geschäftsjahr verwenden, und daraus Regeln ableiten, welche Destinationen oft zusammen mit welchen Ausgangspunkten gebucht worden sind oder mit welchen Fahrzeugen. Der Restaurantbesitzer muss die einzelnen Personen eindeutig identifizieren, damit er seine Warenkörbe definiert, dafür weiß er dann welche Speisen und Getränke zusammen bestellt werden, oder welche Vor- und Hauptgerichte, usw.

Die Warenkorbanalyse ist ein exploratives Verfahren: es werden alle Regeln gefunden, die es gibt. Die Einsatzmöglichkeiten der gefundenen Ergebnisse sind daher vielfältig. Der eigentlich aufwendige Arbeitsprozess beginnt erst nach der explorativen Analyse: wie kann ein Unternehmen die Erkenntnisse gewinnbringend nutzen? Die gefundenen Regeln werden mit geeigneten Kennzahlen bewertet, d.h. man kann sich die interessantesten Regeln rausfischen. Die explorative Analyse bietet also einen riesigen Output, aus dem man immer wieder schöpfen kann, je nach Möglichkeiten und Ressourcen.

Im Online-Handel hat sich die Market Basket Analysis im Up- & Cross-Selling Prozess schon weitgehend etabliert: „Das könnte Sie auch interessieren“ erscheint dann irgendwo, und es ist oft verblüffend, wie gut die Angebote passen. Das Einsatzgebiet der Warenkorbanalyse in der Praxis ist jedoch viel breiter: Regalplatzierung und Waren-Arrangement, Sortiment-Auswahl, Preisgestaltung und Rabatt-Aktionen, Cross-Marketing und Katalog-Design. Die Datengrundlage bilden dafür immer die Warenkörbe. Allerdings hat es erst der technologische Fortschritt der letzten Jahre ermöglicht, eine umfassende Warenkorbanalyse mittlerweile mit kostenlosen Softwaretools praktikabel und einfach durchzuführen.

Hier ein kurzer Überblick über die verschiedenen Methoden, die dabei zum Einsatz kommen. Der einfachste Ansatz ist wohl eine Korrelationsanalyse. Picken wir uns der Einfachheit halber nur zwei Produkte raus, z.B. Milch und Butter. Dazu kann ein Korrelationskoeffizient berechnet werden, das ist einfach eine Zahl zwischen 0 und 1, die ausdrückt, wie stark die beiden zusammenhängen. Nun, das ganze muss natürlich für jedes mögliche Produktpaar berechnet werden – in Excel mit den statistischen Analysefunktionen mit wenigen Klicks erledigt. Nach geeigneter Datentransformation entsteht dabei eine Korrelationsmatrix. Dort sind die Korrelationen jedes Produkts mit jedem anderen angeführt:

Lesebeispiel: Die Korrelation von Artikel 6 und Artikel 2 liegt bei 0,92

Lesebeispiel: Die Korrelation von Artikel 6 und Artikel 2 liegt bei 0,92

Die dunklen Felder sind die interessanten: je höher die Korrelation von zwei Artikeln, desto öfter sind sie zusammen gekauft worden. Was hier aber noch fehlt sind die Häufigkeiten: wie oft sind sie denn überhaupt gekauft worden?

Das führt uns zu den Begriffen Support, Konfidenz und Lift. Sie beschreiben die „Interessantheit“ der Assoziationsregeln, hier nochmal am Beispiel von Milch und Butter erklärt.

Regel: Wenn Milch gekauft wird, wird auch Butter gekauft.

Support = wie oft sind Milch und Butter überhaupt zusammen gekauft worden? Wenn die beiden nämlich insgesamt nur in 1% der Warenkörbe auftauchen, ist das wohl eher uninteressant.
Konfidenz = wenn Milch gekauft wird, wie wahrscheinlich wird dann auch Butter gekauft? Es gibt ja auch Warenkörbe, in denen nur Milch vorkommt: wenn die überwiegen, dann hat die Regel keinen Prognosewert.
Lift = Welchen Effekt hat Butter auf den Kauf von Milch? Ein Lift von 2 bedeutet, dass durch den Kauf der Butter der Kauf der Milch doppelt so wahrscheinlich wird.

Also, was ist zu tun? Für jede mögliche Regel wird Support, Konfidenz und Lift berechnet, und die Regeln mit den besten Werten sind die gewinnbringenden. Ein kurzer Exkurs zur Problemgröße: bei 10 Artikeln gibt es 100 solche Wenn-Dann-Beziehungen zwischen 2 Artikeln, bei 100 Artikeln sind es schon 10.000 und bei 1.000 Artikeln eben 1.000² = 1 Million. Moment, das waren jetzt nur die Kombinationen von je 2 Produkten, die Regeln zu Produktgruppen noch nicht mal dazugezählt. Es muss also ein Verfahren her, mit dem das Ganze automatisiert berechnet werden kann.

Das ist der Apriori Algorithmus, er erledigt den Job in Sekundenschnelle, auch wenn es sich um große Datenmengen handelt. Es werden Mindestwerte für Lift, Support und Konfidenz angegeben, und er sucht hoch effizient nach allen Regeln, die die Mindestwerte erfüllen. Hier eine nette Spielart, die Ergebnisse grafisch aufzubereiten (die Linienstärke drückt die Stärke der Assoziation aus):


Quelle: https://ageconsearch.umn.edu/record/32007/files/05010145.pdf

Ein weiterer Ansatz in der Warenkorbanalyse ist die hierarchische Clusteranalyse. Sie hat das Ziel, Produktgruppen aus möglichst vielen einzelnen Artikeln zu bilden, die möglichst gut zusammen passen. Die Ergebnisse daraus werden im sogenannten Dendogramm dargestellt:

Quelle: https://data-science-blog.com/blog/2016/10/08/warenkorbanalyse-in-r/

Daraus lässt sich ableiten, welche Artikel zu einer Gruppe zusammengefügt werden können, ohne dass die Unterschiedlichkeit zu stark steigt. Das ist durch die Höhe im Dendogramm abgebildet, ein Beispiel: Die Aggregation von root vegetables, other vegetables und whole milk hat nur kurze Linien nach oben. Aggregiert man die Gruppe dann aber weiter mit der rechts davon (pip fruit, citrus fruit, usw.), dann gibt es plötzlich einen ziemlichen Sprung nach oben. Fazit: die beiden Gruppen sollten nicht zusammengefasst werden, weil sonst die Produkte zu heterogen sind. Was hat man am Ende erreicht? Statt einer unüberschaubaren Vielzahl an Einzelartikeln hat man nun wenige, in sich homogene Produktgruppen vor sich. Das macht das Leben nicht nur in der Praxis einfacher, die Produktgruppen können auch wiederum im Apriori Algorithmus verwendet werden: Die Ergebnisse werden ohne großen Informationsverlust wesentlich übersichtlicher und es können klare Strategien abgeleitet werden.

Der wesentlichste Teil bei der Warenkorbanalyse besteht darin, die Spreu vom Weizen zu trennen. Die Regeln zu finden erledigt die Maschine, die wichtigen für das eigene Geschäftsumfeld herauszufiltern bleibt noch weitgehend menschliche Tätigkeit. Am Ende können die Ergebnisse aber ziemliche Überraschungen bringen: die Maschine findet nämlich auch die Regeln, an die der Mensch nicht denken würde. Eine klare Präsentation der gefundenen Erkenntnisse ist daher Kernthema, wie etwa über ein Balkendiagramm aus einer Pivottabelle:

Ausblick

Die Warenkorbanalyse wird oft auch mit dem Ziel definiert, Kundenprofile zu erstellen. Eine Kundensegmentierung kann aber nicht nur rein auf Basis von Warenkörben durchgeführt werden. Mit den Warenkörben lassen sich jedoch Einkaufstypen zu identifizieren, oder anders ausgedrückt, Einkaufsziele: z.B. den Gelegenheitskauf für den Singlehaushalt oder den Großeinkauf für eine Familie.

Es kann auch untersucht werden, wie stabil die Assoziationsregeln über die Zeit hinweg sind oder ob es saisonale Schwankungen gibt, ob das Einkaufsverhalten am Vormittag anders ist als am Nachmittag und noch vieles mehr. Aber das würde hier zu weit führen. Eine explorative Warenkorbanalyse wie hier vorgestellt ist mit Excel und R einfach und schnell durchgeführt. Die Daten haben Sie schon!


Weiterbildungstipp

Data Science Use Case – Warenkorbanalyse und Kundensegmentierung – Warenkorbanalysen
Wann? Am 19. und 20. September 2020 Wo? Controller Institut, Vorgartenstraße 204/6, 1020 Wien

0 Kommentare

Dein Kommentar

An Diskussion beteiligen?
Hinterlasse uns Deinen Kommentar!

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht.