← Alle Artikel

Doppelte Adressen finden: Schritt-fuer-Schritt-Anleitung

Auch verfügbar in:EnglishFrançaisEspañol
Adressliste mit farblich markierten doppelten Eintraegen, die Schritt fuer Schritt bereinigt werden

Wer regelmaessig Briefe, Kataloge oder Spendenaufrufe verschickt, kennt das Problem: In der Adressliste tauchen Namen doppelt oder dreifach auf. Manchmal offensichtlich, oft aber gut versteckt hinter unterschiedlichen Schreibweisen, vertauschten Feldern oder fehlenden Angaben.

Die Folgen sind messbar. Jede doppelte Adresse kostet Porto, Druck und Versandmaterial. Bei einem Dialogpost-Mailing mit 20.000 Empfaengern und einer Duplikatquote von 10 Prozent gehen 2.000 Sendungen an Personen, die den Brief bereits erhalten haben. Bei 0,28 EUR pro Stueck sind das 560 EUR – pro Versand. Bei monatlichen Mailings summiert sich das auf knapp 6.700 EUR im Jahr.

Dieser Artikel zeigt in sechs Schritten, wie Sie doppelte Adressen in Ihrer Datenbank systematisch finden und beseitigen.

Schritt 1: Bestandsaufnahme – wie schlimm ist es wirklich?

Bevor Sie mit der Bereinigung beginnen, brauchen Sie ein realistisches Bild der Lage. Die Erfahrungswerte aus der Praxis:

DatenquelleTypische Duplikatquote
Einzelnes CRM-System, gut gepflegt3–5%
CRM nach Datenmigration8–15%
Zusammengefuehrte Listen aus mehreren Quellen12–25%
Historisch gewachsene Vereinsdatenbank10–20%
Gekaufte oder gemietete Adresslisten5–12%

Eine einfache Methode fuer den Schnellcheck: Sortieren Sie Ihre Liste nach Nachname und PLZ. Scrollen Sie durch die sortierten Daten. Wenn Sie innerhalb weniger Minuten bereits offensichtliche Doppelungen sehen, liegt die tatsaechliche Quote deutlich hoeher – denn die subtilen Duplikate fallen beim manuellen Pruefen nicht auf.

Zaehlen Sie die offensichtlichen Treffer und multiplizieren Sie mit dem Faktor 3 bis 5. Das ergibt eine brauchbare Schaetzung der realen Duplikatmenge.

Schritt 2: Daten vorbereiten und normalisieren

Doppelte Adressen verstecken sich hinter Formatunterschieden. Bevor Sie ueberhaupt nach Duplikaten suchen, muessen die Daten in ein einheitliches Format gebracht werden.

Was Normalisierung konkret bedeutet

Vorher:                              Nachher:
Dr. Max Müller                  →    Max Mueller
Hauptstr. 12a                   →    Hauptstrasse 12a
  70001  Stuttgart              →    70001 Stuttgart

Prof. MAX MUELLER               →    Max Mueller
Hauptstraße 12 A                →    Hauptstrasse 12a
70001 Stuttgart                 →    70001 Stuttgart

Beide Eintraege sehen nach der Normalisierung nahezu identisch aus – was sie vorher nicht taten.

Die wichtigsten Normalisierungsregeln

RegelVorherNachher
Umlaute aufloesenMüller, Böhm, JägerMueller, Boehm, Jaeger
Gross-/KleinschreibungMAX MUELLER, muellerMueller
Titel entfernenDr., Prof., Dipl.-Ing.(entfernt)
StrassenabkuerzungenStr., StrasseStrasse
Leerzeichen bereinigen" Max Mueller ""Max Mueller"
Hausnummern-Zusaetze12 a, 12A, 12/a12a
Sonderzeichen entfernenMüller-SchmidtMueller Schmidt

Ohne Normalisierung scheitert jeder weitere Schritt. Selbst das beste Matching-Verfahren wird "Dr. Max Müller" und "MAX MUELLER" nur als entfernt aehnlich bewerten, obwohl es offensichtlich dieselbe Person ist.

In Excel koennen Sie Normalisierungsregeln mit Formeln umsetzen – etwa =GROSS2(GLÄTTEN(A2)) fuer die Bereinigung von Leerzeichen und Gross-/Kleinschreibung. Fuer Umlaut-Ersetzung brauchen Sie verschachtelte WECHSELN-Formeln. Ab einer gewissen Komplexitaet wird das allerdings unuebersichtlich und fehleranfaellig.

Schritt 3: Schluesselfelder definieren

Nicht alle Felder einer Adresse sind gleich relevant fuer die Duplikatsuche. Wer alle Felder gleichwertig vergleicht, produziert entweder zu viele Fehlalarme oder uebersieht echte Duplikate.

Die richtige Feldgewichtung

Hohe Relevanz:
  Nachname       → Kerninformation zur Identifikation
  Strasse        → Ortsbezogene Einordnung
  PLZ            → Geographische Zuordnung

Mittlere Relevanz:
  Vorname        → Unterscheidung bei gleichem Nachnamen
  Hausnummer     → Praezisierung innerhalb der Strasse

Niedrige Relevanz:
  Ort            → Redundant bei korrekter PLZ
  Anrede         → Keine Identifikationsfunktion
  Firma          → Nur bei B2B-Listen relevant

Eine bewaehrte Strategie: Bilden Sie einen Suchschluessel aus Nachname + PLZ als Vorfilter. Alle Datensaetze mit gleichem Schluessel kommen in die engere Auswahl. Auf diese Kandidatenpaare wenden Sie dann die genaueren Verfahren an.

Beispiel Suchschluessel:
"Mueller|70001" → Findet: Max Mueller, M. Mueller, Petra Mueller-Schmidt
"Schmidt|10115" → Findet: Hans Schmidt, H. Schmitt, Hannelore Schmidt

Bereits dieser einfache Ansatz reduziert die Vergleichsmenge drastisch. Statt 20.000 × 20.000 = 400 Millionen Paarvergleiche pruefen Sie nur noch die Datensaetze innerhalb jeder Schluesselgruppe – typischerweise wenige tausend Vergleiche insgesamt.

Schritt 4: Vergleichsmethoden anwenden

Mit normalisierten Daten und definierten Schluesselfeldern koennen Sie die eigentliche Duplikatsuche starten. Drei Verfahren haben sich in der Praxis bewaehrt:

Exakter Vergleich

Der simpelste Ansatz: Zeichen fuer Zeichen vergleichen. Findet nur identische Eintraege. Taugt als erster Schnelldurchlauf, erkennt aber nur 10 bis 20 Prozent der tatsaechlichen Duplikate.

Phonetischer Vergleich

Algorithmen wie die Koelner Phonetik wandeln Namen in Lautcodes um. "Meyer", "Meier" und "Maier" erhalten denselben Code und werden als potenzielle Duplikate erkannt.

Koelner Phonetik:
"Meyer"  → 67
"Meier"  → 67
"Maier"  → 67
"Müller" → 657
"Miller" → 657

Phonetische Verfahren sind besonders stark bei Namensvarianten, haben aber Grenzen bei Adressen – "Hauptstrasse" und "Lindenweg" klingen nicht aehnlich und sollen es auch nicht.

Fuzzy Matching

Die leistungsfaehigste Methode. Algorithmen wie Levenshtein oder Jaro-Winkler berechnen einen Aehnlichkeitswert zwischen 0 und 100 Prozent. Wie Fuzzy Matching fuer Adressvergleich im Detail funktioniert, erklaeren wir in einem eigenen Beitrag.

Vergleich 1:
"Max Mueller, Hauptstrasse 12, 70001"
"Max Mueller, Hauptstr 12, 70001"
→ Aehnlichkeit: 92% → Dublette

Vergleich 2:
"Max Mueller, Hauptstrasse 12, 70001"
"Hans Weber, Lindenweg 5, 80331"
→ Aehnlichkeit: 18% → Keine Dublette

Vergleich 3:
"Max Mueller, Hauptstrasse 12, 70001"
"Petra Mueller, Hauptstrasse 12, 70001"
→ Aehnlichkeit: 84% → Pruefungsfall (gleicher Haushalt?)

Die Schwelle, ab der ein Paar als Dublette gilt, liegt typischerweise zwischen 80 und 90 Prozent. Den optimalen Wert muessen Sie auf Ihren Datenbestand abstimmen – zu niedrig erzeugt Fehlalarme, zu hoch laesst echte Duplikate durch.

Mehr ueber die einzelnen Algorithmen und ihre Staerken erfahren Sie in unserem Artikel Dubletten erkennen: 7 Methoden fuer saubere Adressdaten.

Schritt 5: Ergebnisse pruefen und zusammenfuehren

Die automatische Suche liefert eine Liste von Duplikat-Kandidaten. Jetzt beginnt die eigentliche Arbeit: Welche Treffer sind echte Duplikate, und welcher Datensatz soll erhalten bleiben?

Drei typische Entscheidungssituationen

Situation 1 – Eindeutiges Duplikat:

A: Max Mueller  | Hauptstrasse 12 | 70001 Stuttgart | Tel: 0711-123456
B: Max Mueller  | Hauptstrasse 12 | 70001 Stuttgart | Tel: —
→ A behalten (vollstaendigerer Datensatz)

Situation 2 – Ergaenzende Informationen:

A: Max Mueller  | Hauptstrasse 12 | 70001 Stuttgart | Tel: 0711-123456
B: M. Mueller   | Hauptstr. 12    | 70001 Stuttgart | Email: max@example.de
→ Zusammenfuehren: Voller Name aus A, Email aus B

Situation 3 – Haushalt statt Duplikat:

A: Max Mueller   | Hauptstrasse 12 | 70001 Stuttgart
B: Petra Mueller | Hauptstrasse 12 | 70001 Stuttgart
→ Kein Duplikat, sondern zwei Personen im selben Haushalt

Situation 3 zeigt ein haeufiges Problem: Personen mit gleichem Nachnamen an derselben Adresse sind nicht zwingend Duplikate. Fuer die Postoptimierung ist die Information trotzdem wertvoll – statt zwei Briefe an "Max Mueller" und "Petra Mueller" schicken Sie einen an "Familie Mueller". Tools wie ListenFix erkennen solche Haushaltszusammengehoerigkeit automatisch und bieten die Moeglichkeit, pro Haushalt nur eine Sendung zu verschicken.

Regeln fuer das Zusammenfuehren

Legen Sie vorab fest, welcher Datensatz Vorrang hat:

Schritt 6: Laufende Kontrolle einrichten

Einmal bereinigen reicht nicht. Neue Duplikate entstehen taeglich – durch manuelle Erfassung, Webformulare, Datenimporte oder CRM-Synchronisierung.

Duplikate an der Quelle verhindern

MassnahmeWirkung
Pflichtfelder im WebformularVerhindert unvollstaendige Eintraege
PLZ-Validierung bei EingabeReduziert fehlerhafte Adressen
Echtzeit-Duplikatcheck bei NeuererfassungWarnt vor dem Speichern
Einheitliche ErfassungsrichtlinienMinimiert Formatvarianten
Regelmaessiger Bereinigungslauf (quartalsweise)Faengt durch das Netz gefallene Duplikate

Ein quartalsweiser Bereinigungslauf ist ein guter Kompromiss zwischen Aufwand und Datenqualitaet. Wer haeufiger versendet – etwa monatliche Mailings – sollte die Pruefung vor jedem Versand durchfuehren.

Die manuelle Bereinigung in Excel wird bei wachsenden Datenmengen schnell unpraktikabel. Warum genau Excel bei der Duplikatsuche an seine Grenzen stoesst, beschreibt unser Artikel Adressduplikate entfernen: Warum Excel nicht reicht. Professionelle Tools wie ListenFix automatisieren die Schritte 2 bis 5 dieses Leitfadens: Sie laden Ihre CSV- oder Excel-Datei hoch, starten die Analyse und erhalten innerhalb von Sekunden eine bereinigte Liste mit Protokoll der erkannten Duplikate. Die gesamte Verarbeitung findet lokal auf Ihrem Rechner statt – Ihre Adressdaten werden zu keinem Zeitpunkt uebertragen.

Wie viel sparen Sie konkret?

Die Einsparung haengt von drei Faktoren ab: der Groesse Ihrer Liste, der Duplikatquote und der Versandfrequenz.

Rechenbeispiel:
Adressbestand:         30.000
Duplikatquote:         12%
Duplikate:             3.600
Porto pro Stueck:      0,28 EUR (Dialogpost)
Einsparung pro Mailing:  1.008 EUR
Mailings pro Jahr:     6
Jaehrliche Einsparung: 6.048 EUR

Dazu kommen indirekte Einsparungen: weniger Ruecklaufer, praezisere Responsequoten und keine doppelten Kundenkontakte, die das Unternehmensbild beschaedigen. Welche systematischen Fehler beim Adressdaten bereinigen am haeufigsten vorkommen, zeigt unser separater Leitfaden.

Selbst bei kleineren Bestaenden lohnt sich die Bereinigung. Bei 5.000 Adressen mit 8 Prozent Duplikaten und vier Versendungen im Jahr sparen Sie immer noch ueber 400 EUR jaehrlich – mehr als die Kosten fuer ein professionelles Tool.

Doppelte Adressen systematisch beseitigen

Die sechs Schritte in der Zusammenfassung:

  1. Bestandsaufnahme – Duplikatquote schaetzen und Handlungsbedarf erkennen
  2. Normalisierung – Einheitliches Format fuer alle Felder schaffen
  3. Schluesselfelder – Die richtigen Felder fuer den Vergleich waehlen
  4. Vergleichsmethoden – Von exakt ueber phonetisch bis Fuzzy Matching
  5. Zusammenfuehrung – Ergebnisse pruefen und den besten Datensatz behalten
  6. Laufende Kontrolle – Neue Duplikate verhindern statt nur alte beseitigen

Der Aufwand fuer die erstmalige Bereinigung ist ueberschaubar. Die jaehrliche Ersparnis uebersteigt die Investition in der Regel ab dem ersten groesseren Mailing. Entscheidend ist, nicht bei der einmaligen Bereinigung stehen zu bleiben, sondern einen wiederkehrenden Prozess zu etablieren, der die Datenqualitaet dauerhaft sichert.

Adressen bereinigen — jetzt testen

ListenFix erkennt per Fuzzy Matching deutlich mehr Duplikate als Excel. 100% offline, DSGVO-konform.

Kostenlos testen