Logo von nextlevels
Hey!
Zurück zum Wiki

Clusteranalyse

Eine Clusteranalyse teilt eine unsortierte Menge von Objekten in Gruppen, sodass sich die Mitglieder einer Gruppe ähnlicher sind als die Mitglieder verschiedener Gruppen. Im E-Commerce sind diese Objekte meistens Deine Kunden. Statt sie alle gleich zu behandeln oder nach Bauchgefühl in „gute" und „schlechte" einzuteilen, lässt Du die Daten selbst sprechen: Wer kauft ähnlich oft, ähnlich teuer, ähnliche Produkte? Das Ergebnis sind Segmente, die nicht von Dir vorgegeben, sondern aus dem tatsächlichen Verhalten errechnet wurden.

Der entscheidende Unterschied zu klassischer Segmentierung: Bei einer klassischen Segmentierung legst Du die Schubladen vorher fest („Männer 30–40", „Stammkunden", „Erstkäufer"). Bei der Clusteranalyse weißt Du vorher nicht, welche Gruppen herauskommen. Der Algorithmus findet die Struktur, die in den Daten steckt. Deshalb gehört die Clusteranalyse zum sogenannten unüberwachten Lernen: Es gibt keine vorgegebene „richtige" Antwort, an der das Verfahren sich orientiert.

Wofür Du eine Clusteranalyse im E-Commerce brauchst

Der häufigste Anwendungsfall ist die Kundensegmentierung. Ein Shop mit 50.000 Kunden kann diese nicht einzeln betreuen, aber er kann sie in fünf oder sechs sinnvolle Gruppen teilen und jede Gruppe passend ansprechen. Sparfüchse, die nur bei Aktionen kaufen, brauchen andere Mails als treue Vielkäufer, die ohnehin regelmäßig bestellen. Wer beide gleich behandelt, verschenkt Umsatz bei den einen und nervt die anderen.

Weitere typische Einsatzfelder:

  • Produktgruppierung: Welche Artikel werden von ähnlichen Kunden gekauft? Das speist Empfehlungen und Sortimentsentscheidungen.
  • Personalisierung: Unterschiedliche Startseiten, Newsletter und Angebote je Cluster.
  • Churn-Prävention: Ein Cluster „war aktiv, kauft seit 90 Tagen nicht mehr" lässt sich gezielt reaktivieren.
  • Marketingbudget: Werbedruck dorthin lenken, wo der erwartete Wert am höchsten ist.

Der Reiz liegt darin, dass die Clusteranalyse Muster sichtbar macht, die im Tabellenchaos verborgen bleiben. Oft tauchen Gruppen auf, mit denen niemand gerechnet hat — etwa eine kleine, aber extrem wertvolle Käuferschicht, die bislang über einen Kamm mit dem Durchschnitt geschoren wurde.

Wie eine Clusteranalyse funktioniert

Im Kern misst jede Clusteranalyse Ähnlichkeit, meist als Abstand in einem mathematischen Raum. Jeder Kunde wird durch Zahlen beschrieben — etwa Bestellhäufigkeit, durchschnittlicher Warenkorb, Tage seit dem letzten Kauf. Diese Werte spannen einen Raum auf, in dem nahe beieinanderliegende Punkte ähnliche Kunden sind. Der Algorithmus sucht dann Verdichtungen.

Die gängigsten Verfahren

Es gibt nicht „die eine" Clusteranalyse, sondern eine Familie von Verfahren. Die drei wichtigsten im Praxisalltag:

VerfahrenPrinzipGut wenn ...Schwäche
k-MeansTeilt Daten in eine vorab gewählte Zahl k von Clustern, minimiert Abstände zum Gruppenmittelpunktgroße Datenmengen, ungefähre Clusterzahl bekanntk muss vorgegeben werden, mag nur runde Cluster
Hierarchisches ClusteringBaut eine Baumstruktur (Dendrogramm) durch schrittweises ZusammenfassenClusterzahl unklar, Struktur soll sichtbar werdenrechenintensiv bei sehr großen Datenmengen
DBSCANFindet Cluster über Dichte, erkennt Ausreißer als „kein Cluster"unregelmäßige Formen, Rauschen in den Datenempfindlich gegenüber Parameterwahl

Für den Einstieg ist k-Means der Klassiker: schnell, gut verstanden, in jeder Analyse-Bibliothek vorhanden. Die offene Frage dabei ist immer die Wahl von k, also wie viele Cluster es geben soll. Methoden wie die Ellbogen-Methode oder der Silhouetten-Koeffizient helfen, eine sinnvolle Zahl zu finden, ersetzen aber nicht den fachlichen Blick: Drei riesige Cluster sind oft brauchbarer als fünfzehn winzige, mit denen niemand arbeiten kann.

RFM als pragmatischer Einstieg

Im E-Commerce muss es nicht gleich Machine Learning sein. Ein bewährter, datensparsamer Einstieg ist die RFM-Analyse: Recency (wann zuletzt gekauft?), Frequency (wie oft?), Monetary (wie viel Umsatz?). Diese drei Werte reichen oft, um Kunden in aussagekräftige Gruppen zu teilen. Eine echte Clusteranalyse auf RFM-Variablen verfeinert das dann automatisch, statt mit starren Punkteschwellen zu arbeiten. Wer mit Datenanalyse anfängt, sollte hier starten und nicht mit einem 40-dimensionalen Modell, das niemand mehr interpretieren kann.

Ein konkretes Beispiel

Ein Shopware-Shop für Tierbedarf hat rund 30.000 aktive Kunden und behandelt sie bislang über einen einzigen wöchentlichen Newsletter. Die Öffnungsrate sinkt, die Abmeldungen steigen. Statt lauter zu werben, wird eine Clusteranalyse auf drei Variablen gerechnet: Tage seit letzter Bestellung, Bestellungen pro Jahr und durchschnittlicher Bestellwert. Heraus kommen vier klar unterscheidbare Gruppen:

  • Stamm-Halter (18 %): kaufen monatlich Futter, mittlerer Warenkorb, hochloyal. Reagieren auf Nachschub-Erinnerungen und ein Abo-Modell.
  • Gelegenheitskäufer (46 %): zwei bis drei Bestellungen im Jahr, oft Zubehör. Reagieren auf saisonale Aktionen.
  • Schnäppchenjäger (24 %): kaufen fast nur bei Rabatten, niedrige Marge. Vorsicht mit Dauerrabatten, sonst erzieht man sie.
  • Schläfer (12 %): seit über einem Jahr inaktiv. Kandidaten für eine letzte Reaktivierungskampagne, danach aus dem aktiven Verteiler nehmen.

Statt eines Newsletters für alle gibt es jetzt vier Ansprachen. Die Stamm-Halter bekommen ein Futter-Abo angeboten, die Schläfer einen einmaligen Reaktivierungsgutschein, die Schnäppchenjäger bewusst seltener Rabatte. Das Ergebnis ist nicht mehr Versand, sondern relevanterer Versand. Genau darin liegt der Hebel: Die Clusteranalyse hat nicht den Umsatz erfunden, sie hat die vorhandenen Kunden so geordnet, dass das Marketing aufhört, mit der Gießkanne zu arbeiten.

Technisch lässt sich so etwas mit den Bestelldaten aus Shopware umsetzen. Die Daten werden exportiert oder über die API gezogen, in einer Analyseumgebung wie Python (etwa mit der Bibliothek scikit-learn) geclustert, und das Cluster-Label wandert als Kundeneigenschaft zurück in den Shop oder ins angebundene Newsletter-Tool. Ab da steuert das Label die Ansprache.

Typische Fehler und ehrliche Grenzen

Die Clusteranalyse hat einen Ruf als Allzweckwaffe, den sie nicht verdient. Vier Stolperfallen tauchen besonders oft auf:

  1. Müll rein, Müll raus. Unsaubere Daten, Testbestellungen, Dubletten und fehlende Werte ruinieren das Ergebnis. Die Datenaufbereitung ist der größere Teil der Arbeit, nicht der Algorithmus.
  2. Skalierung vergessen. Wenn eine Variable in Euro (0 bis 5.000) und eine in Bestellungen (0 bis 50) gemessen wird, dominiert die mit den größeren Zahlen den Abstand. Vor dem Clustern müssen Variablen standardisiert werden.
  3. Cluster überinterpretieren. Der Algorithmus findet immer Gruppen, auch in reinem Rauschen. Dass eine Trennung mathematisch existiert, heißt nicht, dass sie geschäftlich sinnvoll ist. Jedes Cluster muss eine Geschichte erzählen, die man einem Kollegen erklären kann.
  4. Einmal und nie wieder. Kundenverhalten ändert sich. Eine Clusteranalyse von vor zwei Jahren beschreibt nicht mehr Deine heutigen Kunden. Sie gehört regelmäßig aktualisiert.

Und eine grundsätzliche Grenze: Die Clusteranalyse beschreibt, sie erklärt nicht. Sie sagt Dir, dass es eine Gruppe von Schnäppchenjägern gibt, aber nicht, warum jemand zum Schnäppchenjäger wird. Sie ist ein Werkzeug zum Ordnen, kein Orakel. Wer das verwechselt, baut Strategien auf Korrelationen, die beim ersten Gegenwind zusammenfallen.

Wann sich der Aufwand lohnt

Eine Clusteranalyse ist kein Selbstzweck. Sie lohnt sich, wenn Du genug Kunden hast, dass eine pauschale Ansprache nachweislich Streuverlust erzeugt, und wenn Du die gefundenen Segmente auch tatsächlich unterschiedlich behandeln kannst. Ein Shop mit 200 Kunden und einem Produkt braucht keine Clusteranalyse, sondern Vertrieb. Ein Shop mit Zehntausenden Kunden, einem breiten Sortiment und automatisiertem Marketing dagegen lässt hier echtes Geld liegen, wenn er weiter alle gleich behandelt.

Eine fundierte, frei zugängliche Einführung in die mathematischen Verfahren bietet die Dokumentation von scikit-learn, dem De-facto-Standard für maschinelles Lernen in Python, inklusive Vergleich der Algorithmen und ihrer Eignung.

Variablen auswählen: weniger ist oft mehr

Die Versuchung ist groß, einfach alle verfügbaren Daten in das Modell zu kippen: Alter, Geschlecht, Wohnort, jede einzelne Produktkategorie, Klickverhalten, Geräteart. Das geht meistens schief. Je mehr Dimensionen, desto schwammiger werden die Abstände zwischen den Punkten, ein Effekt, den Datenanalysten den „Fluch der Dimensionalität" nennen. In hohen Dimensionen liegen am Ende alle Punkte ungefähr gleich weit voneinander entfernt, und der Algorithmus findet keine sinnvolle Struktur mehr.

Besser ist, mit wenigen, geschäftlich klar interpretierbaren Variablen zu starten. Drei bis fünf gut gewählte Merkmale schlagen dreißig zufällig zusammengewürfelte fast immer. Welche Variablen sinnvoll sind, hängt vom Ziel ab: Geht es um Kaufwert, sind Frequenz und Warenkorb zentral; geht es um Sortimentsinteresse, sind es Produktkategorien. Die fachliche Frage steht vor der technischen Auswahl, nicht umgekehrt.

Vom Cluster zur Aktion

Eine Clusteranalyse ist erst dann etwas wert, wenn aus den Gruppen Handlungen werden. Der häufigste Grund, warum solche Projekte versanden, ist nicht schlechte Mathematik, sondern fehlende Anschlussfähigkeit: Es gibt vier schöne Cluster, aber niemand hat geklärt, wer jetzt was damit macht. Deshalb gehört zu jeder Clusteranalyse von Anfang an die Frage, welche konkrete Maßnahme pro Gruppe folgen soll und ob die Systeme das überhaupt umsetzen können.

Bewährt hat sich diese Reihenfolge:

  1. Ziel definieren. Was soll die Segmentierung verbessern: Newsletter-Relevanz, Reaktivierung, Budgetverteilung?
  2. Variablen daran ausrichten und Daten bereinigen sowie standardisieren.
  3. Clustern und interpretieren. Jedes Cluster bekommt einen sprechenden Namen und eine Ein-Satz-Beschreibung.
  4. Aktion zuordnen. Pro Cluster eine konkrete, umsetzbare Maßnahme.
  5. Messen und wiederholen. Wirkt die differenzierte Ansprache besser als die alte Gießkanne? Nach einigen Monaten neu clustern.

Der letzte Schritt wird am häufigsten vergessen. Eine Segmentierung, deren Wirkung nie gemessen wird, ist eine Vermutung mit Tabellenkalkulation. Erst der Vergleich von vorher und nachher zeigt, ob sich der Aufwand gelohnt hat.

Clusteranalyse, Personalisierung und Datenschutz

Sobald Du Kunden nach ihrem Verhalten gruppierst, bewegst Du Dich im Bereich personenbezogener Daten. Das ist kein Grund zur Panik, aber ein Grund zur Sorgfalt. Bestelldaten, Warenkorbwerte und Kaufhistorie sind personenbezogen, sobald sie einem identifizierbaren Kunden zugeordnet sind. Für die Analyse gelten damit die Grundsätze der Datenschutz-Grundverordnung: ein klarer Zweck, Datensparsamkeit und Transparenz gegenüber den Betroffenen. Wer Cluster-Labels für gezieltes Marketing nutzt, sollte das in der Datenschutzerklärung sauber abbilden.

Praktisch heißt das oft: Für die reine Analyse reichen pseudonymisierte Daten. Du brauchst nicht den Namen, um Verhaltensmuster zu finden, eine anonyme Kunden-ID genügt. Erst beim Zurückspielen ins Marketing-Tool wird die Zuordnung wieder hergestellt. Diese Trennung ist nicht nur rechtlich sauber, sie diszipliniert auch das Vorgehen: Sie zwingt dazu, vorab zu klären, welche Daten wirklich gebraucht werden. Datenschutz und gute Analytik widersprechen sich hier weniger, als viele befürchten. Beide profitieren davon, nur das zu sammeln und zu verarbeiten, was einem klaren Zweck dient.

Wer den Schritt von der Theorie in die Praxis gehen will, fängt klein an: drei saubere Variablen, k-Means, vier bis fünf Cluster, und dann die ehrliche Frage, ob die Gruppen wirklich unterschiedlich genug sind, um anders behandelt zu werden. Erst wenn die Antwort Ja lautet und eine klare Maßnahme pro Gruppe folgt, hat sich die Analyse gelohnt. Alles andere ist hübsche Statistik ohne Geschäftswert.

Weiterführende Artikel