← Alle Artikel

Massenpost-Deduplizierung: Weniger Briefe, gleiche Reichweite

Auch verfügbar in:FrançaisEspañol
Adressliste mit markierten Duplikaten vor dem Massenversand

Jedes Unternehmen, das regelmässig Mailings verschickt, kennt die Situation: Die Adressliste wächst, die Portokosten steigen, aber die Ergebnisse stagnieren. Ein Grund dafür wird häufig übersehen – Duplikate. Dieselbe Person erhält denselben Brief zwei- oder dreimal, weil sie unter verschiedenen Schreibweisen in der Datenbank steht.

Bei einem Versand von 50.000 Briefen pro Kampagne und einer typischen Duplikatquote von 4 bis 8 Prozent gehen 2.000 bis 4.000 Sendungen an Empfänger, die den Brief bereits im Briefkasten haben. Bei Dialogpost-Porto von 0,28 EUR pro Stück sind das 560 bis 1.120 EUR – pro Versand. Geld, das niemanden erreicht, den es nicht schon erreicht hat.

Deduplizierung vor dem Versand beseitigt dieses Problem. Sie reduziert die Versandmenge, senkt die Kosten und verbessert gleichzeitig die Wahrnehmung beim Empfänger, denn niemand reagiert positiv auf den dritten identischen Brief in einer Woche.

Warum Duplikate in Massenversand-Listen so häufig sind

Duplikate entstehen nicht durch Schlamperei, sondern durch die Art, wie Adressdaten über Jahre hinweg gesammelt werden. Jede Quelle bringt eigene Formate, Konventionen und Fehler mit:

Quelle 1 – CRM (Vertrieb):
Dr. Thomas Müller | Hauptstr. 15 | 80331 München

Quelle 2 – Webshop-Bestellungen:
Thomas Mueller | Hauptstraße 15 | 80331 Muenchen

Quelle 3 – Messe-Scans:
T. Müller | Hauptstr. 15 | 80331 München

→ 3 Einträge in der Versandliste
→ 1 Person
→ 2 Briefe zu viel

Typische Ursachen im Detail:

UrsacheBeispielHäufigkeit
Umlaut-VariantenMüller vs. Mueller15–25 % aller Duplikate
AbkürzungenStr. vs. Straße, Dr. vs. Doktor10–20 %
NamensvariantenHans-Peter vs. H.P. vs. Hanspeter10–15 %
TippfehlerSchmitt vs. Schmidt5–10 %
AdressformatBerliner Str. 12a vs. Berliner Straße 12 A10–15 %
QuellenüberlappungCRM + Newsletter + Shop20–30 %

Je mehr Datenquellen ein Unternehmen nutzt, desto höher die Duplikatquote. Unternehmen mit drei oder mehr Systemen (CRM, Shop, Newsletter-Tool, Messe-Datenbank) haben erfahrungsgemäss Duplikatraten von 5 bis 12 Prozent.

Einfache Duplikatsuche und ihre Grenzen

Der erste Reflex bei Duplikaten ist meist Excel: Daten markieren, "Duplikate entfernen" klicken, fertig. Das funktioniert – aber nur bei exakten Übereinstimmungen.

Was Excel findet:
Thomas Müller | Hauptstr. 15 | 80331 München
Thomas Müller | Hauptstr. 15 | 80331 München
→ Identisch, wird erkannt ✓

Was Excel NICHT findet:
Thomas Müller  | Hauptstr. 15    | 80331 München
Thomas Mueller | Hauptstraße 15  | 80331 Muenchen
→ Unterschiedliche Zeichen, wird als 2 Personen behandelt ✗

In der Praxis sind exakte Duplikate die Ausnahme. Studien zeigen, dass 60 bis 80 Prozent aller Duplikate in Adresslisten sogenannte "unscharfe Duplikate" sind – gleiche Person, unterschiedliche Schreibweise. Ein reiner Textvergleich erkennt davon nichts.

Was stattdessen funktioniert: Fuzzy Matching

Fuzzy-Matching-Algorithmen vergleichen nicht Zeichen für Zeichen, sondern messen die Ähnlichkeit zwischen zwei Einträgen. Die wichtigsten Verfahren:

Eine professionelle Deduplizierung kombiniert mehrere dieser Verfahren und gewichtet sie nach Feldtyp – Name, Strasse, PLZ und Ort werden unterschiedlich behandelt.

Die Kosten von Duplikaten: Eine Beispielrechnung

Konkrete Zahlen machen das Einsparpotenzial greifbar. Nehmen wir ein mittelständisches Versandunternehmen mit regelmässigem Dialogpost-Versand:

Ausgangssituation:
Adressbestand:              80.000 Adressen
Versandfrequenz:            4 Kampagnen pro Jahr
Duplikatquote (unbereinigt): 6 %
Duplikate:                  4.800

Kosten pro überflüssiger Sendung:
Dialogpost-Porto:           0,28 EUR
Druck + Kuvertierung:       0,14 EUR
Gesamt pro Duplikat:        0,42 EUR

Verschwendung pro Kampagne: 4.800 × 0,42 = 2.016 EUR
Verschwendung pro Jahr:     4 × 2.016 = 8.064 EUR

Nach Deduplizierung:
Duplikatquote (bereinigt):  0,5 % (Restfehler)
Verbleibende Duplikate:     400
Verschwendung pro Jahr:     4 × 400 × 0,42 = 672 EUR

Jährliche Ersparnis:        8.064 – 672 = 7.392 EUR

Dazu kommt ein indirekter Effekt: Empfänger, die denselben Brief mehrfach erhalten, reagieren seltener positiv. Doppelsendungen signalisieren dem Empfänger, dass das Unternehmen seine Daten nicht im Griff hat. Die Response-Rate steigt typischerweise um 5 bis 15 Prozent, wenn jeder Empfänger genau einen Brief bekommt.

Deduplizierung in der Praxis: Der Ablauf

Ein systematischer Deduplizierungsprozess besteht aus vier Schritten:

1. Daten normalisieren

Vor dem Vergleich müssen die Daten in ein einheitliches Format gebracht werden. Ohne Normalisierung scheitert auch Fuzzy Matching an trivialen Unterschieden:

2. Vergleichspaare bilden

Bei 80.000 Adressen müsste man theoretisch 3,2 Milliarden Paare vergleichen (n × (n-1) / 2). Das ist selbst mit schnellen Algorithmen unpraktikabel. Stattdessen werden Blocking-Strategien eingesetzt: Nur Adressen mit gleicher PLZ oder gleichem Anfangsbuchstaben des Nachnamens werden miteinander verglichen. Das reduziert die Vergleiche auf einen Bruchteil.

3. Ähnlichkeit bewerten

Jedes Vergleichspaar bekommt einen Score zwischen 0 (keine Ähnlichkeit) und 100 (identisch). Typische Schwellenwerte:

ScoreBewertungAktion
90–100Sicheres DuplikatAutomatisch zusammenführen
75–89Wahrscheinliches DuplikatManuell prüfen
50–74Möglicherweise verwandtNur bei Bedarf prüfen
0–49Kein DuplikatKeine Aktion

4. Zusammenführen (Merge)

Erkannte Duplikate werden zu einem Datensatz zusammengeführt. Dabei gilt: Der vollständigste Datensatz gewinnt. Wenn ein Eintrag den akademischen Titel enthält und der andere die vollständige Strasse, entsteht ein kombinierter Datensatz mit beiden Informationen.

Haushaltsduplikate: Der vergessene Kostenfaktor

Neben Personenduplikaten gibt es einen zweiten Kostentreiber, der oft übersehen wird: Haushaltsduplikate. Wenn zwei verschiedene Personen an derselben Adresse wohnen, erhalten beide einen Brief – obwohl einer gereicht hätte.

Haushaltsdublette:
Maria Schneider  | Gartenweg 8 | 50667 Köln
Thomas Schneider | Gartenweg 8 | 50667 Köln

→ Selber Haushalt, 2 Briefe
→ 1 Brief mit "Familie Schneider" hätte genügt
→ Ersparnis: 0,42 EUR (Porto + Druck)

Bei Privatkunden-Mailings liegt die Haushalts-Duplikatquote typischerweise bei 2 bis 5 Prozent. Für das Beispiel mit 80.000 Adressen sind das 1.600 bis 4.000 zusätzlich vermeidbare Sendungen – nochmal 672 bis 1.680 EUR pro Kampagne.

Mehr zu Haushaltsbereinigung und den technischen Hintergründen finden Sie im Artikel zur Dialogpost-Optimierung.

Wie ListenFix Massenversand-Listen bereinigt

ListenFix kombiniert fünf verschiedene Fuzzy-Matching-Algorithmen, um Duplikate zu finden, die einzelne Verfahren übersehen. Die Software erkennt Umlaut-Varianten, Abkürzungen, Namensvarianten und Tippfehler in einem Durchlauf und markiert sowohl Personen- als auch Haushaltsduplikate.

Die Verarbeitung läuft komplett lokal auf Ihrem Rechner – keine Daten werden an Server übertragen. Das ist besonders bei Adressdaten relevant, die unter die DSGVO fallen. Sie laden Ihre Liste, starten die Bereinigung und exportieren das Ergebnis. Für 80.000 Adressen dauert das wenige Minuten.

Konkrete Preise und Funktionen finden Sie auf der Startseite. Der Einstieg ist kostenlos.

Porto sparen beginnt vor dem Druck

Deduplizierung ist kein einmaliges Projekt, sondern ein Prozess. Adressdaten verändern sich ständig – neue Kontakte kommen dazu, bestehende Adressen veralten, Systeme werden zusammengeführt. Wer vor jedem Versand dedupliziert, hält die Kosten dauerhaft niedrig.

Die Rechnung ist einfach: Bei typischen Duplikatraten von 4 bis 8 Prozent spart Deduplizierung 1.600 bis 3.360 EUR pro 100.000 Sendungen – allein an Porto. Mit Druck- und Handling-Kosten verdoppelt sich der Betrag. Gleichzeitig steigt die Qualität des Versands, weil jeder Empfänger genau eine Sendung erhält.

Wer seine Portokosten systematisch senken will, findet im Artikel Porto optimieren weitere Strategien über die Deduplizierung hinaus.

Adressen bereinigen — jetzt testen

ListenFix erkennt per Fuzzy Matching deutlich mehr Duplikate als Excel. 100% offline, DSGVO-konform.

Kostenlos testen