Marketing-Börse PLUS - Fachbeiträge zu Marketing und Digitalisierung
print logo

Datenpflege ist Kundenpflege

Maßnahmen zur Datenpflege kosten Zeit und Geld. (Buchbeitrag)
Carsten Kraus | 15.04.2009
Dieser Fachartikel erschien im Leitfaden Dialog-Marketing

http://www.marketing-boerse.de/Info/details/LeitfadenDM

http://www.amazon.de/exec/obidos/ASIN/3000239251/absolit/028-2842597-1070167/absolit


Maßnahmen zur Datenpflege kosten Zeit und Geld. Damit Sie einschätzen können, wie viel von beidem Sie investieren sollten, müssen Sie einen Eindruck vom Wert Ihrer Daten haben. Außerdem sollten Sie wissen, wie sich der Wert durch gute oder schlechte Datenpflege verändert. In diesem Text erwartet Sie Folgendes:

 Wem nützen gute Daten?
 Was nützen gute Daten?
 Berechnungsmöglichkeit.


Wem nützen gute Daten?

Nehmen Sie sich einen Moment Zeit und denken Sie darüber nach, wer in Ihrem Unternehmen auf die Daten zugreift. Und wer sich alles schon geärgert hat, wenn etwas nicht richtig gespeichert war. Sie dürften ungefähr auf folgende Liste kommen:

Marketing
 Klar: Mailings leben von den Daten.
 Aber auch Marketing-Controlling oder Messeplanung benötigen gute, richtige Daten.

Außendienst: Wenn der Ansprechpartner anders heißt, die Adresse nicht mehr stimmt oder wichtige Kundeninformationen auf zwei Datensätze verteilt sind, reduziert das die Effizienz.

Service: Rückfragen wie „geben Sie mir Ihre Adresse noch mal zur Sicherheit, ich weiß nicht, ob wir die hier richtig haben“ kosten Zeit und erhöhen nicht gerade das Vertrauen des Kunden.

Strategieplanung: Warenkorb-Analysen, Kundenlebenswert-Berechnung (siehe Kasten unten) moderne Analyse-Verfahren basieren auf Daten. Wenn diese verfälscht, doppelt oder nicht vorhanden sind, können die Analysen nicht greifen – und Sie lassen sich wichtigen Input für die Strategie entgehen.

Buchhaltung
 Die Rechnungsanschrift muss die richtigen Ansprechpartner enthalten, sonst kommt es zum „leider haben wir Ihre Rechnung nicht erhalten.“
 Außerdem braucht die Buchhaltung bei Mahnverfahren an Firmen den rechtsgültigen Firmennamen und den korrekten Namen des Geschäftsführers.


Kasten: Kundenlebenswert-Berechnung
Der Kundenlebenswert, auch Customer Lifetime Value oder kurz CLV genannt, ist die Summe der erwarteten künftigen Erträge durch diesen Kunden. Dieser soll für künftige Perioden abgezinst werden. Man rechnet in diese Erträge auch die Empfehlungswirkungen ein. Ein höherer CLV ergibt sich, indem der Kunde dem Unternehmen länger treu bleibt oder indem er häufiger kauft oder je Kauf höhere Umsätze macht. Wenn Sie abschätzen wollen, ob sich Maßnahmen lohnen, sollten Sie diese Effekte zumindest ungefähr quantifizieren.


Bessere Daten nützen Ihnen auf sechserlei Weise:
 Sie reduzieren Kosten durch Vermeidung von unzustellbaren und doppelten Aussendungen.
 Sie erhöhen die Effizienz Ihrer Werbung durch präzise Zielgruppenansprache.
 Sie vermeiden Kundenverlust durch Peinlichkeiten.
 Erst durch korrekte Daten wird Ihre Datenbank zur Quelle von Information für die Strategieplanung.
 Ihre Mitarbeiter ärgern sich seltener, was ihre Motivation erhöht und
 Können effizienter arbeiten durch Vermeidung von Redundanzen.


Berechnungsmöglichkeit

Mit ausgefeilten statistischen Verfahren ist es heute möglich, den zukünftigen Ertragswert jedes einzelnen Kunden abzuschätzen. Ob sich die aufwändigen statistischen Verfahren für Sie lohnen, müssen Sie selbst entscheiden. Eine Durchschnittsabschätzung, die Ihnen wenigstens einen Grundwert liefert, können Sie aber auch ohne Statistik-Studium durchführen.


Bewertung nach Kosten der Interessentengewinnung

Nehmen Sie als Grundlage Werbemaßnahmen, die Sie regelmäßig durchführen, und die Sie planen, beizubehalten. Berechnen Sie die Kosten dieser Werbemaßnahmen über einen bestimmten Zeitraum, zum Beispiel das letzte Vierteljahr. Teilen Sie diese Kosten durch die Anzahl der Interessenten, die in diesem Zeitraum durch diese Werbemaßnahmen gewonnen wurden.

Beispiel: Sie zahlen für eine Coupon-Anzeige in einem Fachmagazin jeden Monat 5.000 Euro. Diese Anzeige schalten Sie regelmäßig. Pro Vierteljahr sind das 15.000 Euro. Pro Vierteljahr gewinnen Sie durch diese Anzeige circa 300 Interessenten. 15.000 Euro geteilt durch 300 sind 50 Euro. Es kostet Sie also 50 Euro, auf diesem Wege einen Interessenten zu gewinnen. Da Sie diese Methode der Interessentengewinnung beibehalten, kann man davon ausgehen, dass Ihnen jeder Interessent mindestens 50 Euro wert ist.

Folgerungen aus dem ermittelten Adress-Wert:

Da Sie die Adresse des Interessenten 50 Euro gekostet hat, bedeuten selbst aufwändige Qualifizierungsvorgänge, die Sie zum Beispiel 1,50 Euro pro Adresse kosten, nur eine Erhöhung der Kosten um drei Prozent.

Ein telefonisches Nachfassen, um einen unleserlichen Ansprechpartner richtig zu buchstabieren und damit korrekt anzuschreiben, rechnet sich bei 50 Euro pro Adresse ebenfalls.

Auch nicht ohne: Jetzt können Sie andere Methoden der Interessentengewinnung daran messen, ob sie pro Interessent mehr oder weniger als 50 Euro kosten.

Auf welchen Wert kommen Sie?


Gesamtwert

Wenn Sie jetzt den ermittelten Wert mit der Anzahl selbst gewonnener Interessenten-Adressen aus Ihrer Datenbank multiplizieren, dann haben Sie eine Abschätzung für den (Mindest-)Gesamtwert Ihrer Kundendatenbank. Wahrscheinlich sind Sie auf einen ziemlich hohen Wert gekommen und fragen sich jetzt, ob er stimmen kann. Und wie sich dieser Wert tatsächlich in Erträgen konkretisiert.


Beispielrechnung

Nehmen wir an, Sie haben für 20.000 eigene Adressen einen Wert von je 50 Euro = 1 Million Euro errechnet. Jetzt können Sie leider nicht zu einem Adressverlag hingehen und einfach sagen: „Hier ist meine Kundendatenbank – bitte geben Sie mir 1 Million Euro“.

Der Wert manifestiert sich dadurch, dass Sie es wesentlich leichter haben, mit diesen Kunden und Interessenten Umsätze zu machen als mit fremden Adressen. Das wissen Sie, und deshalb schicken Sie an diese 20.000 Adressen zum Beispiel zweimal jährlich Ihren Gesamtkatalog. Je nach Detail-Zielgruppe gibt es außerdem verschiedene Mailings, durchschnittlich erhält jeder drei Mailings pro Jahr.

Wenn Sie je Katalog 5 Euro ausgeben und je Mailing 80 Cent, dann haben Sie jedes Jahr circa 250.000 Euro nur für diese Maßnahmen ausgegeben. Rechnen sich die Maßnahmen doppelt, also erzielen Sie mit diesen Maßnahmen einen Deckungsbeitrag von 500.000 Euro, dann haben Sie durch den Besitz dieser Kundenadressen 250.000 Euro „Verzinsung“ auf die eine Million Euro erzielt. 25 Prozent Zinsen sind nicht schlecht, oder?

Zum Vergleich: Bei direkt verkaufenden Mailings an Fremdadressen können Sie in den meisten Branchen froh sein, wenn Sie Ihre Mailing-Kosten wieder hereinholen. Die meisten Maßnahmen rechnen sich nur, um die Kundendatenbank zu vergrößern, und mit den so gewonnenen Kunden in der Zukunft weitere Umsätze zu machen.

Übrigens würde eine Verbesserung Ihrer Adressqualität um 10 Prozent bereits 50.000 Euro zusätzlichen Gewinn bringen. Und dabei haben wir bisher ausschließlich den Effekt für Mailings gewertet.


Datenpflege-Maßnahmen

Bessere Daten müssen nicht teuer sein: Die Daten haben Sie bereits selbst, jetzt müssen sie nur noch gut werden. In diesem Kapitel beschäftigen wir uns mit Adressverarbeitungsmaßnahmen, die Sie entweder mit Hilfe von Software selbst durchführen oder von einem Dienstleister durchführen lassen können. Es geht hier um Bereinigungen wie:

Dublettenbereinigung: doppelt gespeicherte Adressen finden und beseitigen.

Postalische Korrektur: Falsch geschriebene Straßennamen richtig schreiben, Postleitzahl korrigieren.

Datenstruktur: Informationen, die in den falschen Datenfeldern stehen, an die richtige Stelle verschieben – beispielsweise einen Vornamen aus dem Nachnamen-Feld heraustrennen
.
Alle Ihre Datensätze werden dabei jeweils in eine Software eingelesen und geprüft. Als Ergebnis kommt entweder ein bereits bereinigter Adressbestand heraus, oder Sie erhalten eine Liste mit Datensätzen, die eine Änderung benötigen. Häufig auch beides.

Zusätzlich zur nachträglichen Optimierung gibt es Möglichkeiten, um schon bei der Datenerfassung gute Datenqualität sicherzustellen. Wenn diese Möglichkeiten technischer Natur sind, erwähne ich sie bei den jeweiligen Optimierungs-Maßnahmen. Zudem hilft es, wenn Sie das Bewusstsein Ihrer Mitarbeiter für Datenqualität erhöhen.

Wann empfiehlt sich eigene Software, wann ein Dienstleister?

Manche Maßnahmen kann man nicht im eigenen Hause durchführen lassen: Daten-Ergänzungen aus Referenzverzeichnissen muss ein unabhängiger Dienstleister durchführen. In solchen Fällen ist die Entscheidung klar. Ansonsten gilt:

Dienstleister: Wenn Sie seltener Maßnahmen durchführen.

Software kaufen und im eigenen Hause:

 Wenn Sie häufig Maßnahmen durchführen.

 Wenn Sie besonders kritische Daten haben (zum Beispiel Krankenhaus-Patientendaten), die Sie nicht außer Haus geben dürfen oder wollen.

 Wenn Ihre Daten oder die durchzuführenden Maßnahmen besonderes Wissen aus Ihrem Hause erfordern, das sich nicht gut an einen Dienstleister vermitteln lässt.

Soll man Software kaufen oder selbst programmieren?

Diese Frage ist ganz einfach zu beantworten: Wenn Sie mehr als 10.000 Adressen haben, nehmen Sie auf jeden Fall Profi-Hilfe in Anspruch – egal, ob als Software oder als Dienstleistung. Nach meinen Erfahrungen sollten Sie auch alle gratis oder als Shareware angebotenen Programme links liegen lassen. Die Unterschiede im Ergebnis sind nach meinen Erfahrungen so groß, dass sich die Profi-Hilfe schon bei der ersten Maßnahme bezahlt macht.


Ein Rechenbeispiel:

Sie haben 20.000 Adressen, an die Sie ein Mailing schicken wollen. Mailingkosten 80 Cent, gesamt 16.000 Euro. Dublettenquote 5 Prozent = 1000 Stück, von denen mit Profi-Hilfe 950 Stück gefunden werden. Ersparnis: 950 mal 80 Cent = 760 Euro. Nehmen wir an, mit einer Gratis-Software hätten Sie 500 Dubletten gefunden. Unterschied 450 Dubletten = 360 Euro. Eine Dublettenprüfung beim Profi-Dienstleister kostet Sie für 20.000 Adressen circa 150-300 Euro (Dublettenprüfung für Mailingzwecke; wenn Sie Stammdaten bearbeiten lassen, kann es teurer werden).


Postalische Korrektur

Selbst wenn Ihre Adressen sorgfältig erfasst werden, schleichen sich immer wieder Fehler ein, zum Beispiel wenn der Kunde undeutlich schreibt. Sind diese Fehler in der Straßen- oder Ortsbezeichnung, kann dies Nachteile bei der Zustellung haben. Eventuell wird der Brief zwei- oder dreimal von einem Briefträger an den anderen weitergegeben, bis feststeht, welche Straße gemeint ist. Die Zustellung der Sendung wird dadurch verzögert; manchmal kann sie auch gar nicht zugestellt werden. Korrekte Straßennamen, Postleitzahlen und Ortsnamen verringern die Postlaufzeit und erhöhen die Zustellquote. Durch vorherige postalische Korrektur verbessern Sie außerdem die Trennschärfe der Dublettenbereinigung.

Es gibt PC-Software, mit der Sie die Straßen- und Ortsnamen korrigieren lassen können. In der Regel hat solche Software als Datenbasis eine CD-ROM der Deutschen Post AG, die es in zwei Varianten gibt:

Die kostengünstige Variante enthält Straßennamen nur in den Orten, die mehrere Zustell-PLZ haben. Das betrifft etwas mehr als 200 Orte – damit werden 59 Prozent der Wohnbevölkerung abgedeckt. In den kleineren Orten können die Straßennamen hiermit nicht korrigiert werden; wohl aber PLZ und Ortsnamen. Die Korrektur macht aus „75300 Neuenbrüg“ also durchaus „75305 Neuenbürg“, in solch kleinen Orten aber aus der „Proststr.“ nicht die „Poststr.“. Das wirkt wie eine unbefriedigende Lösung, reicht aber für den Zweck der Zustellbarkeit aus: Der Briefträger weiß, dass es keine „Proststr.“ gibt – und nicht selten kennt er in kleinen Orten die Empfänger sogar persönlich, was die Zustellsicherheit weiter erhöht.

Die flächendeckende Variante (Data Factory Streetcode) ist um ein Vielfaches teurer. Auch sie bietet unseres Wissens keine hundertprozentige Abdeckung an, es fehlen jedoch nur sehr wenige Straßen. Hiermit können Sie nicht nur die Zustellbarkeit sichern, sondern eben relativ sicher gehen, dass die Straßennamen tatsächlich richtig sind. Tipp: Nicht jede Software zur postalischen Korrektur kann den flächendeckenden Bestand verarbeiten. Wenn Sie erwägen, den flächendeckenden Bestand einzusetzen, prüfen Sie, ob Ihre Software dazu in der Lage ist.

Es gibt Software, die mit Straßen-Umbenennungen nicht gut umgehen kann und in diesen Fällen Adressen quasi zerstört. Dabei handelt es sich um einen systematischen Fehler, wenn gleichzeitig Straßenname und PLZ oder Ortsname geändert wurden, zum Beispiel nach Eingemeindungen. Eine zuvor zwar veraltete, aber dank Briefträger-Intelligenz noch zustellbare Adresse wird dabei auf eine neue, formal korrekte, aber inhaltlich falsche und damit unzustellbare Adresse korrigiert – Ihr Kundenkontakt ist verloren.

Tipp: Wenn Sie selbst keine Software anschaffen, sondern die postalische Korrektur beim Dienstleister durchführen lassen, so rechnet es sich, dies einmalig auf dem Stammbestand machen zu lassen, statt jedes Mal auf der Mailingdatei. Postalische Korrektur ist relativ unkritisch, es bleibt nur ein kleiner Prozentsatz manuell zu beurteilender Adressen. Der Aufwand für Stammdatenbereinigung ist also geringer als bei vielen anderen Maßnahmen.


Umzüge

Wissen Sie, wie viele Ihrer Kunden umziehen? Bei Privatadressen sind es üblicherweise zehn bis fünfzehn Prozent pro Jahr. Wenn Sie also zwei Jahre lang keine Umzugspflege betreiben, könnte fast ein Drittel Ihrer Kunden verschwunden sein.

Zieht jemand um, geschieht Folgendes:

 Hat er keinen Nachsendeantrag ausgefüllt, ist er nach dem Umzug für die Post „verschwunden“. Auch Sie haben keine Chance, mit Hilfe der Post die neue Adresse zu ermitteln.

 Hat er einen Nachsendeantrag gestellt (das ist die Regel), so leitet die Post sechs Monate lang alle Sendungen an die neue Adresse weiter. Nach sechs Monaten läuft der Nachsendeantrag ab. Danach weiß der Zusteller an der alten Adresse nichts mehr von der neuen Adresse.

 Aber auch wenn er einen Nachsendeantrag gestellt hat, merken Sie davon nichts: Ihre Werbung wird brav weitergeleitet, braucht vielleicht etwas länger, aber der Empfänger erhält sie doch. Nach sechs Monaten ist jedoch der Nachsendeantrag abgelaufen, und der Kunde: verschwunden.

 Früher waren Nachsendeanträge gratis, heut sind sie kostenpflichtig. Entsprechend gesunken ist die Anzahl der Nachsendeanträge. Ein gewisser Anteil Kunden wird Ihnen also auf jeden Fall wegen Umzugs verloren gehen.


Anschriftenberichtigungskarte

Wenn Sie mitbekommen wollen, ob Ihr Kunde umgezogen ist, müssen Sie die Post aktiv darum bitten. Dafür gibt es die „Anschriftenberichtigungskarte“. Auf Ihrer Sendung vermerken Sie: „Bei Umzug Anschriftenberichtigungskarte!“. (Damit Sie auch Sterbefälle mitbekommen, fügen Sie sinnvollerweise als zweite Vorausverfügung zusätzlich hinzu: „Bei Unzustellbarkeit, Anschriftenberichtigungskarte!“). Dieser Service kostet Sie 0,90 Euro je Anschriftenberichtigungskarte (Stand Juli 2008).


Abgleich gegen Umzugsdatei

Die Firma „Deutsche PostAdress GmbH“ (eine Tochtergesellschaft von Bertelsmann und der Post AG) hat alle Nachsendeanträge seit September `94 gespeichert. Sie Umzugsinformation schon vor dem Mailing. Die Vorteile:

 Ihr Mailing kommt sofort an.

 Sie sparen die Kosten für die Anschriftenberichtigung (nicht nur die 0,90 Euro, sondern auch die Erfassungskosten für die Datenänderung).

 Sie können auch Kunden aufspüren, die schon vor mehr als sechs Monaten umgezogen sind.

Neben Abgleichkosten berechnet die PostAdress 1,15 Euro pro gefundenem Umzügler.

Inzwischen gibt es ähnliche Services, die ihre Daten aus anderen Quellen gewinnen und teilweise günstiger sind. Die gefundenen Umzüge unterscheiden sich, denn weder die Datenbank der Nachsendeanträge noch die anderen Datenquellen enthalten hundert Prozent der Umzüge. Eventuell macht es daher auch Sinn, beides nacheinander zu beauftragen. Dieses Feld ist derzeit stark im Umbruch: Wenn Sie einen Dienstleister Ihres Vertrauens haben, fragen Sie ihn nach den aktuellen Möglichkeiten.


Dublettenprüfung

Doppelte Adressen sind so alt wie Kundendateien: Als die ersten Computer anfingen, Adressdaten zu speichern, wurden bald darauf die ersten Kataloge doppelt verschickt. Heute sind computergestützte Adressdateien kein Privileg von Großversandhäusern mehr. In der Frühzeit der Datenspeicherung stand man doppelten Adressen beinahe machtlos gegenüber. Heute gibt es ganz ausgeklügelte Verfahren, um solche Dubletten vom Computer erkennen zu lassen.


Die paar Dubletten?

Selbst in gut gepflegten Adressdatenbanken sind vier bis sechs Prozent Dubletten enthalten, wenn sie nicht systematisch – zum Beispiel mit Hilfe einer speziellen Software – bekämpft werden. Nun klingen so ein paar Prozent nicht gerade gravierend. Aber fünf Prozent Dubletten von 100.000 Werbebriefen sind immerhin 5.000 Stück – das ist eine ganz schöne Menge Briefe. Und es sind eine Menge Kosten, die unnütz verursacht werden. Doch Dubletten schaden nicht nur wegen der doppelten Werbekosten:

 Dubletten machen jegliche Personalisierung zunichte. Ein Kunde, der einen Brief doppelt erhält, weiß sofort: Massenwerbung!

 Dubletten verfälschen Analysen des Database Marketing. Werbewegs-Analysen, CLV (Customer Lifetime Value) und Cross-Selling-Analysen werden signifikant verfälscht. Denn Dubletten verteilen sich nicht gleichmäßig über die Datenbank, sondern tauchen insbesondere dort auf, wo die Analyse ansetzt: Bei den Mehrfachkäufern.


Gegenmaßnahmen

Um die Dublettenquote in Ihrer Datenbank möglichst gering zu halten, gibt es zwei Ansätze: Erstens können Sie die Datenbank von Zeit zu Zeit bereinigen. Und zweitens können Sie versuchen, Dubletten von vornherein zu vermeiden. Für beides gibt es heute Software-Hilfsmittel; im Folgenden erfahren Sie mehr darüber.


Grundsätzliche Anforderungen an Dublettensoftware

Dubletten entstehen immer durch Abweichungen in der Schreibweise von Adressen. Dabei gibt es verschiedene Arten von Abweichungen. Folgende sind für Privatadressen typisch:

 Tippfehler: Alexander wird zu Alexnader.
 Schreibfehler: Chryschanowski wird zu Krischanoffsky.
 verschiedene Namensschreibweisen: Meier/Mayer, Sylvia/Silvia, Mathias/Mattias.
 Freudsche Hörfehler: Sponheimstr. wird zu Sponhainstr.
 Weitergehende Freudsche Fehler: Friedrich-Silcher-Weg wird zu Friedrich-Schiller-Weg, weil das Gehirn schon bei „Friedrich“ auf „Schiller“ schaltet.

Bei Firmenadressen treten andere Abweichungen in den Vordergrund:

 Vertauschungen: Müller Möbel / Möbel-Müller.
 Zusätze: Müller Möbel / Müller Möbel-Fabrikation GmbH.
 Wortteil-Verschiebungen: Müller Direkt- und Dialogmarketing / Müller Direktmarketing.
 Abkürzungen: Westf. Inst. f. Agrarökonomie / Agrarökonomisches Institut Westfalen.

Sie sehen: welche Ähnlichkeiten gefunden werden müssen, unterscheidet sich zwischen Firmen- und Privatadressen. Ihre Software muss also auf Ihren Typ Adressen passen.


Overkill und Underkill

Im Einzelvergleich ist (bisher) kein Verfahren so gut wie der Mensch. Teilweise findet Software Dubletten, die nicht wirklich welche sind. Diese zuviel gefundenen Dubletten nennt man Overkill. Umgekehrt findet kein Verfahren alle Dubletten. Zuwenig gefundene Dubletten bezeichnet man analog als Underkill. Je besser Ihr Verfahren, desto geringer die Summe aus Over- und Underkill. Geringer Over- und Underkill wird auch als hohe Trennschärfe bezeichnet.


Das einfachste Verfahren: Matchcode

Statt die gesamte Adresse Buchstabe für Buchstabe zu vergleichen, werden nur markante Punkte miteinander verglichen, zum Beispiel PLZ, Hausnummer, der erste und dritte Buchstabe des Nachnamens und der erste Buchstabe des Vornamens. Solange alle diese Dinge übereinstimmen, wird die Adresse als Dublette gefunden, auch wenn in den anderen Buchstaben Abweichungen sind. Solche Verfahren benötigen kaum Rechenzeit und wurden in der Großrechnerzeit eingesetzt. Vom Over- und Underkill her sind sie überhaupt nicht mehr zeitgemäß. In vielen CRMund ERP-Systemen wird Dublettenprüfung aber immer noch mit solchen Verfahren betrieben.


Phonetik

Hier werden unterschiedliche Schreibweisen vereinheitlicht, indem ähnlich klingende Buchstaben in denselben Code verwandelt werden. P und B werden zum Beispiel zur „1“, K und C und G zur „2“. Ob es nun Becker oder Begger heißt – egal, alles gleich. Achtung: Auch die beste Phonetik findet nur phonetische Fehler. Tippfehler oder Abkürzungen lassen sich damit nicht aufspüren. Deshalb sind phonetische Verfahren allein zumindest für Firmenadressen völlig unzureichend.


Unscharfe Ähnlichkeitsverfahren

Ein unscharfes Verfahren trifft keine Ja/Nein-Entscheidungen, sondern bestimmt den Grad der Ähnlichkeit. Durch Abwägen verschiedener Elemente der Adresse können so wesentlich höhere Trennschärfen erzielt werden. Sind beispielsweise Firmenname und Ansprechpartner sehr ähnlich, so kann trotz gänzlich anderer Straße (Umzug!) die Firma als Dublette zugeordnet werden. Bei annähernd identischer Straße und Hausnummer können andererseits stärkere Abweichungen im Firmennamen zugelassen werden. Diese Abwägung wäre mit Matchcode-Verfahren nicht möglich. Heutige professionelle Adressverfahren sind optimiert für Adresseinsatz. So findet zum Beispiel das FACT®-Verfahren alle oben aufgeführten Beispiele und kommt damit dem menschlichen Ähnlichkeitsempfinden sehr nahe.


Wann sollte man eine Dublettenprüfung durchführen?

Hierfür gibt es vier mögliche Zeitpunkte:

1. Gleich bei der Eingabe.
2. Beim Einspielen separat erfasster (oder gekaufter) Adressen, also beim Hinzufügen eines neuen Adressbestandes zu Ihrer Kundendatei.
3. Innerhalb der Kundendatei.
4. Direkt vor dem Mailing.

Die optimale Antwort heißt: Alle vier – denn zu jedem Zeitpunkt gibt es vernünftige Gründe, obwohl Sie zu den anderen Zeitpunkten auch prüfen. Ob sich der Mehrfach-Aufwand für Sie lohnt, hängt natürlich von Ihrer Adressmenge ab und vom Negativ-Effekt, der durch jede Dublette verursacht wird.


Prüfung gleich bei der Eingabe

Falls in Ihre Kundenverwaltungssoftware eine Prüfung integriert ist, die direkt nach Eingabe einer Adresse prüft, ob diese Adresse in ähnlicher Form bereits in Ihrem Datenbestand enthalten ist, vermeiden Sie viel Arbeit.

Einerseits ist in vielen Unternehmen das Anlegen eines neuen Kunden mit Aufwand verbunden: Kreditwürdigkeitsprüfung, Heraussuchen der zuständigen Regionalvertretung. Diesen Aufwand machen Sie unnötigerweise doppelt, wenn Sie nicht merken, dass der Kunde schon existiert.

Vor allem aber: Ist erst einmal ein neuer Kundenstammsatz angelegt, sammelt er automatisch Vorgänge: zum Beispiel Rechnungen, Kontakte, Ansprechpartner, Zahlungsinfos. Alle diese Daten von einem Datensatz zum anderen zu bewegen, kann je nach Umfang über 10 Euro an Arbeitszeit für jede einzelne Dublette verursachen.

Die Prüfung bei der Eingabe ist die wirksamste, denn

1. Hier sitzt ein Mensch davor. Sie können also die Prüfung etwas sensibler einstellen, sodass sie im Zweifel lieber eine Dublette zuviel als eine zuwenig anzeigt. Und der Erfassungsmitarbeiter kann „keine Dublette“ anklicken. Dadurch finden Sie sicherer alle Dubletten.

2. Der Mitarbeiter hat jetzt die beste Gelegenheit, einer aufgezeigten Dublette auf den Grund zu gehen:

 Hat er den Kunden am Telefon, kann er zurückfragen, beispielsweise „ich habe hier einen Hans Müller, aber an einer anderen Adresse – haben Sie früher in der Mühlgasse gewohnt?“.

 Hat er eine Antwortkarte vor sich, kann er noch mal nachschauen, ob sich kleine Unterschiede zwischen vorhandener und neu eingegebener Adresse nicht vielleicht doch als Identität herausstellen. Manchmal sieht zum Beispiel ein handschriftliches „u“ ähnlich wie ein „n“ aus.

 Dabei können übrigens auch Fehler in der bereits vorhandenen Adresse durch das Telefonat oder die neue Antwortpostkarte korrigiert werden.

Prüfung beim Hinzufügen eines neuen Adressbestandes zu Ihrer Kundendatei: An dieser Stelle ist zumindest eines noch klar: welche Ihre bestehenden Adressen sind und welche Ihre neuen. Wenn Sie fremde Adressen hinzufügen, die Sie günstig von einem Adressverlag gekauft oder von einer CD geladen haben, dann ist die Folge-Verarbeitung ganz einfach: Wenn ein Dublettenverdacht zwischen einer bestehenden und einer neuen Adresse besteht, lassen Sie die neue einfach weg. Falls Sie dabei unnötigerweise ein paar Adressen zuviel gelöscht haben, ist das auch nicht schlimm.


Prüfung innerhalb der Kundendatei

Warum muss man die Daten nochmals in sich prüfen, wenn schon bei der Eingabe und beim Einspielen eine Dublettenkontrolle stattgefunden hat? Das erscheint in der Tat zunächst merkwürdig, hat sich aber als sinnvoll herausgestellt. Die Gründe:

 Mitarbeiter drücken manchmal nachlässig „keine Dublette“, wenn bei der Prüfung während der Eingabe des Öfteren Adressen als Dubletten ausgewiesen werden, die tatsächlich gar keine Dubletten sind.

 Beim Einspielen zusätzlicher Adressbestände wurden Fehler in der Dublettenprüfung gemacht – oder dieser Schritt wurde bei manchen Zusatzadressen völlig vergessen.

Wenn Sie bei einer solchen Prüfung feststellen, dass tatsächlich keine oder nur eine vernachlässigbare Menge Dubletten vorhanden sind:
Herzlichen Glückwunsch! Bisher habe ich erst einmal erlebt, dass die Dublettenquote über zwei Jahre lang unter 0,2 Prozent gehalten wurde. Sind entsprechende Eingabeprüfungen vorhanden, dann ergeben sich meiner Erfahrung nach meist noch Dublettenquoten zwischen 0,5 und 1 Prozent. Das sind immerhin viel weniger als die normalen vier bis 6 Prozent Empfehlung: Machen Sie circa zwei Monate nach Einführung einer Eingabeprüfung einen Test. Sollten sich schon wieder viele Dubletten eingeschlichen haben, dann prüfen Sie, ob die Software richtig eingestellt ist und ob die Mitarbeiter richtig geschult wurden. Und holen Sie das eine oder andere gegebenenfalls nach. Wenn sich jedoch herausstellt, dass sich bei Ihnen tatsächlich sehr selten Dubletten einschleichen, dann verlängern Sie den Zeitraum zwischen den Prüfungen.


Prüfung in der Mailingdatei

Hiermit hat es eine andere Bewandtnis als mit den zuvor genannten drei Prüfungen:
Dubletten sind unerwünschte doppelte Adressen. Doch in der Stammdatei müssen manche Adressen doppelt vorhanden sein. Beim Mailing sollen sie aber nur einmal angeschrieben werden. Insbesondere handelt es sich um verschiedene Firmen mit demselben Ansprechpartner:

3 Linden Hotel-Betriebs-GmbH & Co., Herrn Martin Feldner
3 Linden Hotel-Holding GmbH, Martin Feldner
3 Linden Restaurant-Betriebs-GmbH, z. Hd. Martin Feldner

Klar, dass Sie die drei Unternehmen bei der Rechnungsstellung nicht vertauschen dürfen. Aber braucht Herr Feldner tatsächlich drei Kataloge?

Fazit: Datenqualität ist ein Erfolgsfaktor. Ein Prozentwert, mit dem Sie den Gesamterfolg multiplizieren können. Ist die Datenqualität zwanzig Prozent besser, erhöht sich der Werbeerfolg um zwanzig Prozent. Aber die Kosten für Porto, Druck und Lettershop bleiben gleich.


Literatur

Kraus C.: Adress- und Kundendatenbanken für das Direktmarketing. – Verlag BusinessVillage, Göttingen, 2004.
Berson A., Dubov L.: Master Data Management and Customer Data Integration for a Global Enterprise. – The McGraw-Hill Companies, New York, 2007.
Schober K.: Die neue Dimension im Direktmarketing: Market-Uniserve-Database. – Econ Verlag, Düsseldorf, München, 1997.
Günter B., Helm S. (Hrsg.): Kundenwert. Grundlagen – Innovative Konzepte – Praktische Umsetzungen. – Gabler Verlag, Wiesbaden, 2006.
Wang R. Y., Ziad M., Lee Y. W.: Data Quality. – In: Kluwer International Series on Advances in Database Systems, Springer-Verlag, 2000.
Img of Carsten Kraus

Carsten Kraus ist Gründer & Geschäftsführer von Omikron Data Quality und Casablanca.ai. Er ist AI & Data Science Experte.