Adress-Deduplizierung: Doppelte Kontakte automatisch erkennen

27. März 2026·6 min read·ListenFix

Adress-DeduplizierungDubletten erkennenDatenbereinigungAdressqualitaetFuzzy Matching

Doppelte Adressdatensaetze werden erkannt und zu einem einzigen sauberen Eintrag zusammengefuehrt

Wer regelmaeßig Mailings verschickt, kennt das Problem: Dieselbe Person taucht in der Datenbank zwei-, drei- oder sogar fuenfmal auf. Einmal als "Dr. Thomas Mueller", einmal als "T. Müller", einmal als "Mueller, Thomas" mit einer alten Adresse. Der Empfaenger erhaelt drei Briefe, das Unternehmen zahlt dreimal Porto und wirkt unprofessionell.

Das ist kein Randproblem. Branchenstudien gehen davon aus, dass 8 bis 15 Prozent aller Adressdatensaetze in Unternehmen Duplikate sind. Bei zusammengefuehrten Datenbanken – etwa nach einer Firmenfusion oder beim Import aus mehreren CRM-Systemen – steigt der Anteil auf 20 bis 30 Prozent. Bei einem Mailing mit 50.000 Empfaengern und 12 Prozent Dubletten verschenken Sie rund 6.000 Sendungen. Bei Dialogpost-Tarifen von 0,28 EUR pro Stueck sind das 1.680 EUR, die direkt im Papierkorb landen.

Adress-Deduplizierung loest dieses Problem systematisch. Aber nicht jeder Ansatz funktioniert gleich gut, und die Unterschiede sind erheblich.

Was Adress-Deduplizierung von einfachem Duplikate-Entfernen unterscheidet

Excel hat eine Funktion "Duplikate entfernen". Sie vergleicht Zeilen Zeichen fuer Zeichen und loescht identische Eintraege. Fuer Produktlisten oder Artikelnummern reicht das. Fuer Adressen nicht.

Das Problem: Adressen sind keine strukturierten Codes. Menschen schreiben denselben Namen und dieselbe Anschrift auf dutzende verschiedene Arten.

Datensatz 1: Dr. Thomas Mueller  | Hauptstr. 12    | 70173 Stuttgart
Datensatz 2: Mueller, Thomas     | Hauptstrasse 12  | 70173 Stuttgart
Datensatz 3: Tomas Müller        | Hauptstraße 12a  | 70173 Stuttgart

Alle drei Eintraege bezeichnen vermutlich dieselbe Person. Ein zeichengenauer Vergleich erkennt keine einzige dieser Dubletten. Echte Adress-Deduplizierung arbeitet anders: Sie normalisiert Schreibweisen, vergleicht phonetisch, berechnet Aehnlichkeitsgrade und beruecksichtigt die Struktur von Adressen.

Einen detaillierten Vergleich der Erkennungsmethoden finden Sie in unserem Artikel Dubletten erkennen: 7 Methoden fuer saubere Adressdaten.

Die fuenf Stufen einer professionellen Deduplizierung

Professionelle Adress-Deduplizierung laeuft in klar definierten Schritten ab. Jeder einzelne Schritt erhoeht die Erkennungsrate deutlich.

Stufe 1: Normalisierung

Bevor ueberhaupt verglichen wird, muessen die Daten in ein einheitliches Format gebracht werden. Das umfasst:

Anreden und Titel entfernen oder vereinheitlichen ("Dr.", "Prof.", "Herr", "Frau")
Abkuerzungen aufloesen ("Str." zu "Strasse", "Pl." zu "Platz")
Umlaute einheitlich behandeln ("ue" und "ü" als identisch werten)
Gross-/Kleinschreibung vereinheitlichen
Fuehrende und doppelte Leerzeichen entfernen

Allein durch Normalisierung steigt die Erkennungsrate um 15 bis 25 Prozent gegenueber einem Rohvergleich.

Stufe 2: Phonetischer Abgleich

Die Koelner Phonetik wandelt deutsche Namen in Lautcodes um. "Mueller", "Müller", "Muller" und "Myller" erhalten denselben Code. Das ist entscheidend, weil Namensvarianten die haeufigste Ursache fuer unerkannte Dubletten sind.

"Schneider"  → Phonetik-Code: 8627
"Schnaider"  → Phonetik-Code: 8627
"Schnyder"   → Phonetik-Code: 8627
→ Alle drei werden als potenzielle Dubletten erkannt

Stufe 3: Fuzzy Matching

Fuzzy-Matching-Algorithmen berechnen, wie aehnlich sich zwei Zeichenketten sind. Statt "gleich oder ungleich" liefern sie einen Prozentwert. Die gaengigsten Verfahren:

Algorithmus	Staerke	Typischer Einsatz
Levenshtein-Distanz	Erkennt Tippfehler (eingefuegte/geloeschte Zeichen)	Strassennamen, Ortsnamen
Jaro-Winkler	Gewichtet Uebereinstimmung am Wortanfang hoeher	Nachnamen, Firmennamen
N-Gramm-Vergleich	Robust bei Wortumstellungen	Vollstaendige Adresszeilen
Soundex/Metaphone	Lautbasierter Vergleich	Internationale Namen

Eine ausfuehrliche Erklaerung dieser Verfahren mit Rechenbeispielen finden Sie in unserem Artikel Fuzzy Matching bei Adressen.

Stufe 4: Regelbasierte Gewichtung

Nicht jedes Feld ist gleich wichtig. Eine professionelle Deduplizierung gewichtet die Uebereinstimmung nach Relevanz:

Nachname: 30 Prozent Gewichtung
Strasse + Hausnummer: 25 Prozent
PLZ + Ort: 20 Prozent
Vorname: 15 Prozent
Zusatzfelder (Firma, Geburtsdatum): 10 Prozent

Ein Treffer bei "Nachname + Strasse + PLZ" mit hohem Aehnlichkeitsgrad ist fast sicher eine Dublette, selbst wenn der Vorname leicht abweicht.

Stufe 5: Zusammenfuehrung

Erkannte Dubletten muessen zusammengefuehrt werden. Das klingt trivial, hat aber Tuecken: Welcher Datensatz ist der "richtige"? Die beste Praxis ist ein Merge, der aus allen Dubletten den vollstaendigsten Datensatz bildet:

Quelle A: Thomas Mueller  | Hauptstr. 12   | 70173 Stuttgart | Tel: -
Quelle B: Dr. T. Müller   | Hauptstrasse 12 | 70173 Stuttgart | Tel: 0711-1234567

Ergebnis: Dr. Thomas Müller | Hauptstrasse 12 | 70173 Stuttgart | Tel: 0711-1234567

Was Adress-Deduplizierung konkret spart

Die Einsparungen lassen sich fuer jede Datenbank individuell berechnen. Hier ein realistisches Szenario fuer ein mittelstaendisches Unternehmen:

Kennzahl	Wert
Adressbestand	80.000 Datensaetze
Dublettenquote (typisch)	12 Prozent
Erkannte Dubletten	9.600
Mailings pro Jahr	6
Porto pro Sendung (Dialogpost)	0,28 EUR
Verschwendetes Porto pro Jahr	16.128 EUR
Druck + Kuvertierung pro Stueck	0,15 EUR
Verschwendete Produktion pro Jahr	8.640 EUR
Gesamtersparnis pro Jahr	24.768 EUR

Dazu kommen indirekte Kosten: Beschwerden von Empfaengern, die denselben Brief mehrfach erhalten, verfaelschte Responsequoten und der Aufwand fuer manuelle Korrekturen im Nachhinein.

Warum Excel und Access fuer Adress-Deduplizierung nicht ausreichen

Viele Unternehmen versuchen, Dubletten mit Bordmitteln zu bereinigen. Das funktioniert bis zu einer gewissen Groesse, stoesst aber schnell an Grenzen:

Excel: Die Funktion "Duplikate entfernen" findet nur exakte Treffer. SVERWEIS-Konstruktionen fuer unscharfe Vergleiche sind fragil und ab 10.000 Zeilen extrem langsam. Phonetische Vergleiche sind ohne VBA-Makros gar nicht moeglich.

Access: Bietet mehr Moeglichkeiten durch SQL-Abfragen, aber kein eingebautes Fuzzy Matching. Selbstgebaute Loesungen erfordern erheblichen Programmieraufwand und sind schwer zu warten.

Manuelle Sichtung: Bei kleinen Listen (unter 500 Eintraegen) machbar, bei groesseren Bestaenden nicht realistisch. Ein Mensch braucht etwa 2 Sekunden pro Vergleich. Bei 80.000 Datensaetzen mit je 10 Vergleichskandidaten waeren das ueber 440 Stunden Arbeit.

Einen detaillierten Vergleich zwischen Excel-Bordmitteln und spezialisierten Tools finden Sie in unserem Artikel Adressduplikate in Excel entfernen.

Automatische Deduplizierung mit ListenFix

ListenFix kombiniert alle fuenf Stufen der professionellen Deduplizierung in einer Desktop-Anwendung, die ohne Cloud-Anbindung arbeitet. Sie laden Ihre Adressliste (CSV, Excel oder direkt aus dem CRM-Export), starten den Abgleich und erhalten innerhalb von Sekunden eine bereinigte Liste.

Die Software nutzt fuenf verschiedene Fuzzy-Algorithmen parallel, erkennt Haushaltsdubletten (gleiche Adresse, verschiedene Personen), validiert Postleitzahlen fuer 29 Laender und normalisiert Strassennamen automatisch. Da die gesamte Verarbeitung lokal auf Ihrem Rechner stattfindet, verlassen Ihre Adressdaten zu keinem Zeitpunkt das Unternehmen – ein entscheidender Punkt fuer die DSGVO-Konformitaet.

Checkliste: So starten Sie mit der Adress-Deduplizierung

Bevor Sie ein Tool einsetzen, sollten Sie drei Fragen klaeren:

Wie gross ist Ihr Bestand? Unter 500 Adressen koennen Sie manuell pruefen. Ab 1.000 Adressen lohnt sich ein spezialisiertes Tool.
Wie oft aktualisieren Sie? Einmalige Bereinigung reicht nicht. Neue Dubletten entstehen bei jedem Datenimport. Planen Sie quartalsweise Abgleiche ein.
Welche Felder haben Sie? Je mehr Felder (Name, Adresse, Telefon, E-Mail, Geburtsdatum), desto praeziser die Erkennung. Felder wie Geburtsdatum oder Kundennummer senken die Fehlalarmquote deutlich.
Wohin exportieren Sie? Stellen Sie sicher, dass das bereinigte Ergebnis in Ihr CRM oder Ihre Versandsoftware zurueckfliessen kann. Gaengige Formate sind CSV und Excel.
Wer prueft die Ergebnisse? Vollautomatisches Loeschen ist riskant. Professionelle Tools markieren Dubletten und schlagen eine Zusammenfuehrung vor, die ein Mensch bestaetigt. Dieser Review-Schritt sollte fester Bestandteil Ihres Prozesses sein.

Wenn Sie Ihre Adressliste bereinigen moechten, finden Sie in unserem Artikel Adressliste bereinigen: Der komplette Leitfaden eine Schritt-fuer-Schritt-Anleitung fuer den gesamten Prozess.

Adressen bereinigen — jetzt testen

ListenFix erkennt per Fuzzy Matching deutlich mehr Duplikate als Excel. 100% offline, DSGVO-konform.

Kostenlos testen