Predictive Modelling: Wie entwickelt sich der Kunde?

Für die Variable Wahrscheinlichkeit bedient man sich des Predictive Modelling. Einer der häufigsten verwendeten Ansätze ist die Regressionsanalyse.

Stefan Schulte | 04.02.2019

Dies ist der dritte Teil des Beitrages „Customer Lifecylce und Customer Value optimieren“. Teil 1 erschien unter der Überschrift „Mit optimierten Daten zu optimierter Kommunikation“, Teil 2 lautete „Optimale Ansprache durch Kundenwertberechnung“.

Regressionsanalyse

Die Regressionsanalyse ist ein statistisches Prognoseverfahren, bei dem die Beziehungen zwischen einer Zielvariablen und einer erklärenden Variablen untersucht werden. Die erklärende Variable stellt nicht die Zeit dar, sondern eine ökonomische Größe, die in einem ursächlichen Zusammenhang zu der Zielvariablen steht. Eine derartige Beziehung kann zwischen dem Absatz von Produkten und dem Auftragsvolumen des jeweiligen Wirtschaftssegments bestehen, wobei die Höhe des Absatzes prognostiziert werden soll. Die Verfahren der Regressionsanalyse sind von der Struktur der Beziehungen zwischen der Zielvariablen und der Anzahl der erklärenden Variablen abhängig. Man unterscheidet die lineare Einfachregression, die lineare Mehrfachregression sowie die nichtlineare Regression. Das Ziel der Regressionsanalyse ist, die Abhängigkeit einer metrischen Variablen y von mehreren anderen (metrischen) Variablen zu untersuchen. Es wird also getestet, ob die verschiedenen unabhängigen Variablen einen Einfluss auf die abhängige Variable y haben und wie stark dieser Einfluss ist. Ein einfaches Beispiel soll die Funktionsweise verdeutlichen: Ein Produktmanager möchte wissen, inwieweit das Einkommen und das Alter von Kunden den Absatz seines Produkts beeinflussen. Die Regressionsanalyse berechnet die sogenannte Regressionsgerade, mit deren Hilfe folgende Fragestellungen beantwortet werden können:

1. Untersuchung des Zusammenhangs

Mit Hilfe des sogenannten Bestimmtheitsmaßes (R2) kann die Stärke des Zusammenhangs von Alter und Einkommen auf den Absatz des Produkts angegeben werden. Durch einen Vergleich der standardisierten Regressionskoeffizienten (sogenannte Beta-Gewichte) kann man auf die relative Bedeutung der unabhängigen Variablen schließen. Es lässt sich somit feststellen, dass beispielsweise das Einkommen einen doppelt so starken Einfluss wie das Alter besitzt.

2. Prognose der abhängigen Variablen

Man kann einerseits berechnen, um wie viel Stück der Absatz des Produkts höchstwahrscheinlich steigen wird, wenn sich das Einkommen um 100 Einheiten erhöht. Andererseits lässt sich für jede Person, von der das Alter und das Einkommen bekannt ist, der Konsum zum Beispiel im Sinnes des Umsatzes des Produkts schätzen. In der Literatur wird die Regressionsanalyse daher häufig auf Absatzprognosen im weitesten Sinne angewandt. Leider kann im Marketing nicht immer von einer linearen Funktionalbeziehung ausgegangen werden. Man behilft sich dann damit, dass durch geeignete Transformationen (zum Beispiel logarithmieren) eine linearisierte Beziehung erzielt und auf diese die Regressionsanalyse angewandt wird. Nutzt man die Regressionsanalyse oder auch andere Data-Mining-Methoden, sind die Daten und ihre Qualität von entscheidender Bedeutung. Bei allen Big-Data-Ansätzen, die heute in den Unternehmen angewendet werden, stehen die Methodik und die Integrität der Daten gleichberechtigt nebeneinander. Für die Regression sind Transaktionsdaten, Protokolldaten, Ereignisdaten und Bewegungsdaten von entscheidender Bedeutung. Die Herausforderung liegt dabei in der Tatsache, dass diese Daten verstreut und in unterschiedlichen Formaten gespeichert sein können. Mitunter weisen sie Inkonsistenzen wie falsche oder fehlende Einträge auf. Es kann beispielsweise vorkommen, dass den Daten zufolge ein Produkt gekauft wurde, das auf dem Markt zu diesem Zeitpunkt noch nicht erhältlich war, oder die Daten zeigen, dass ein Kunde regelmäßig in einem Geschäft 2000 Meilen von seinem Wohnsitz entfernt Einkäufe tätigt.

Daten bereinigen – Fehlerquellen minimieren

Beim Data Cleaning geht es nicht nur um das Löschen fehlerhafter Daten oder um das Interpolieren fehlender Werte, sondern auch um das Auffinden versteckter Beziehungen in den Daten, die Identifikation der genauesten Datenquellen und die Festlegung der Spalten, die für die Analyse am besten geeignet sind. Zum Beispiel: Sollte das Versanddatum oder das Bestelldatum verwendet werden? Ist der beste Verkaufseinflussfaktor die Menge, der Gesamtpreis oder ein diskontierter Preis? Unvollständige Daten, falsche Daten und Eingaben, die separat erscheinen, aber tatsächlich stark korrelieren, können die Ergebnisse des Modells in unerwarteter Weise beeinflussen. Daher sollten Sie diese Probleme bestimmen, bevor Sie mit der Erstellung der Miningmodelle beginnen, und festlegen, wie Sie sie beheben wollen. Beim Data Mining verwenden Sie in der Regel ein sehr umfangreiches Dataset und können nicht jede Transaktion auf ihre Datenqualität hin überprüfen. Dies bedeutet, dass sie im Vorfeld über geeignete Mittel und Methoden diskutieren müssen, um Ausreißer zu eliminieren, Daten zu validieren und die Qualität sicherzustellen. Als zweites wesentliches Kriterium dient die Art der Daten. Grundsätzlich gilt das Prinzip, dass sich der Kunde durch das definiert, was er tut, nicht durch das, was er ist. Demzufolge sind interne Daten im Modellsinne aussagekräftiger und auch trennschärfer als extern zugekaufte Daten. Externe Daten werden speziell beim Prospecting genutzt, um Potenziale, Kaufkraft und Strukturinformationen potenzieller Neukunden zu bekommen. Ideal für die Modellbildung bei Bestandskunden sind Informationen zu Umsatz und Gewinn, Kontaktpräferenzen, Lizenzen oder dazu, welche Produkte bis jetzt gekauft wurden etc. Mit diesen Informationen können unterschiedliche Ansätze analytisch aufbereitet werden, von Welcome Programmen direkt nach dem Erstkauf bis hin zu Loyalitätsmaßnahmen, um zum Beispiel Vertragskündigungen (Churn) vorzubeugen.

Effektive Kommunikationsstrategien mittels Kundenwert und -lebenszyklus

Nutzt man die beschriebenen Methoden im Zusammenspiel und hat die entsprechenden Daten und Modelle gefunden, ist es möglich, in der Summe aus Umsatz, Potenzial und Wahrscheinlichkeit zu einem Kundenwert zu kommen, der sich beispielsweise in einer ABC-Kundenverteilung widerspiegelt. Das Beispiel in der Abbildung unten zeigt, wie die berechneten Variablen in einen Kundenlebenszyklus integriert werden können. Die sechs Phasen des Kundenlebenszyklus werden dabei mit Informationen aus der ABC-Klassifizierung kombiniert. Hinzu kommen Kommunikationsstrategien für die einzelnen Phasen des Kundenlebenszyklus von Programmen für Neukunden (Nursery) bis hin zu Programmen zur Kundenreaktivierung (Reactivation). Sechs Phasen des Kundenlebenszyklus‘. Im nächsten Schritt werden die einzelnen Kommunikationsmaßnahmen geplant. Kommunikationsplanung auf Basis eines Customer Lifecycles ist die konsequente Ableitung der einzelnen Programme auf Basis der gebildeten Matrix. Im vorliegenden Beispiel bildet der Customer Lifecycle ein Geschäftsjahr ab, das heißt, sämtliche Kommunikationsmaßnahmen müssen im Zeitraum von zwölf Monaten geplant, durchgeführt und bewertet werden. Dies bedarf eines stringenten Governance-Prozesses zur Planung, Durchführung und zum Monitoring dieser Maßnahmen. Finales Instrument ist dann der klassische Kommunikationsplan mit Zielen, Maßnahmen und Messgrößen. Dies bedeutet, dass zu der technologischen und analytischen noch die organisatorische Herausforderung hinzukommt. Grundsätzlich ist die Implementierung des Customer-Lifetime- und Customer-Value-Ansatzes eine marketingstrategische Entscheidung, die durch Big Data getrieben werden kann, aber nicht notwendigerweise muss. Tatsächlich ist in der Praxis zu beobachten, dass die Technologie als Enabler willkommen ist, im Rahmen der Implementierung aber nur als Randerscheinung auftritt. Viele Projekte zur Implementierung eines Kundenlebenszyklus-Modells sind damit von Beginn an zum Scheitern verurteilt. Wichtig ist hier, wie bereits erwähnt, die Verschmelzung von Analyse- und Kommunikationsprozess. Realisiert werden kann dies durch einen geeigneten Projekt- beziehungsweise Pilotansatz. Das Projektteam besteht dabei aus Mitgliedern speziell aus den Marketingbereichen Kommunikationsplanung, Produktmarketing beziehungsweise Produktmanagement, Business Intelligence und Data Warehousing. Die breite Aufstellung des Teams ist dabei entscheidend, da der Gesamtansatz analytisch getrieben ist, die Umsetzung aber stark in den Bereich Produktkommunikation hineinspielt.

Fazit

Big Data, Realtime Analytics und Predictive Modeling sind keine Science Fiction. Vielmehr sind es Hilfsmittel, um modernes, schnelles und zielgruppenspezifisches Marketing zu betreiben. Daher sollten diese Themen nicht verteufelt werden, sondern sie sollten in den normalen Marketingprozess mit eingebunden werden, um die verbleibenden klassischen Marketinginstrumente effizienter zu machen. Am Ende werden bessere Daten und deren effiziente Bereitstellung den Kundenlebenszyklus erfolgreich werden lassen. Marketingentscheider müssen sich zukünftig viel stärker als bisher mit den Themen Daten und Intelligence beschäftigen, da sich nur durch die konsequente Anwendung dieser Themen zukünftige Wertschöpfungspotenziale heben lassen. Diese Potenziale sind für eine positive ROI-Gestaltung nicht nur auf Kommunikations-, sondern vor allem auf Kundenebene von entscheidender Bedeutung. Dabei spielt das Thema Big Data eine zentrale Rolle, allerdings mehr im Sinne der Bereitstellung der notwendigen Informationen durch geeignete Mittel und Methoden denn als strategisches Flaggschiff. Für unser Eingangsszenario (in Teil 1) bedeutet dies, dass wir nicht mehr weit von solchen Dialogmomenten entfernt sind. Wichtig ist, dass klassischer Dialog mit modernen Mitteln und Methoden kombiniert wird, um in Zukunft auch direkt beim Kunden anzukommen.

> Automation	> Social Media
> Omnichannel	> Suchmaschinen
> Experience	> Content
> KI	> E-Commerce
> Digitalisierung	> B2B