Arztpraxis: Patientendaten bereinigen ohne Datenschutzrisiko

In einer durchschnittlichen Hausarztpraxis sammeln sich über die Jahre 3.000 bis 8.000 Patientenstammdaten an. Fachärzte mit Überweisungspatienten kommen leicht auf 15.000 oder mehr. Und in jedem dieser Bestände stecken Dubletten: Der Patient "Schmidt, Thomas" existiert dreimal – einmal mit alter Adresse, einmal als "Schmitt, Thomas" mit Tippfehler, einmal als "Schmidt, Th." aus einem Notfall-Eintrag.
Diese Dubletten sind kein Schönheitsfehler. Sie führen zu Recall-Briefen an falsche Adressen, doppelten Terminvergaben und im schlimmsten Fall zu verwechselten Patientenakten. Gleichzeitig unterliegen Patientendaten dem strengsten Datenschutz, den das deutsche Recht kennt: der ärztlichen Schweigepflicht nach §203 StGB.
Warum Patientendaten besonders geschützt sind
Patientendaten sind nicht einfach personenbezogene Daten im Sinne der DSGVO. Sie sind Gesundheitsdaten – eine besondere Kategorie nach Art. 9 DSGVO, deren Verarbeitung grundsätzlich verboten ist und nur unter strengen Ausnahmen erlaubt wird.
Zusätzlich greift §203 StGB: Die ärztliche Schweigepflicht. Ein Verstoß ist eine Straftat, keine Ordnungswidrigkeit. Der Strafrahmen reicht bis zu einem Jahr Freiheitsstrafe. Und das Berufsrecht der Ärztekammer kennt weitere Sanktionen bis hin zum Entzug der Approbation.
Was das für die Datenbereinigung bedeutet
Jede Software, die Patientendaten verarbeitet, muss diese doppelte Hürde nehmen:
| Anforderung | DSGVO | §203 StGB |
|---|---|---|
| Rechtsgrundlage | Art. 9 Abs. 2 DSGVO (Gesundheitsversorgung) | Einwilligung oder gesetzliche Erlaubnis |
| Datenübertragung an Dritte | AVV nach Art. 28 erforderlich | Grundsätzlich verboten, Ausnahmen eng begrenzt |
| Cloud-Verarbeitung | Technische Schutzmaßnahmen nötig | Extrem problematisch – Offenbarung an Cloud-Anbieter |
| Sanktionen bei Verstoß | Bis 20 Mio. EUR oder 4% des Jahresumsatzes | Freiheitsstrafe bis 1 Jahr, Approbationsverlust |
Hier liegt das zentrale Problem: Viele Cloud-basierte Bereinigungstools erfordern den Upload der Patientenliste auf externe Server. Das kann bereits eine strafbare Offenbarung nach §203 StGB darstellen – selbst wenn der Cloud-Anbieter einen Auftragsverarbeitungsvertrag unterschrieben hat.
Typische Datenprobleme in der Arztpraxis
Patientenstammdaten kommen aus verschiedenen Quellen in die Praxissoftware: elektronische Gesundheitskarte (eGK), manuelle Eingabe am Empfang, Überweisungsscheine, Online-Terminbuchung. Jede Quelle erzeugt eigene Fehlertypen.
Beispiel: So sehen Dubletten in der Praxis aus
Patient 1: Schmidt, Thomas | Hauptstr. 12 | 80331 München | geb. 15.03.1978
Patient 2: Schmitt, Thomas | Hauptstraße 12 | 80331 München | geb. 15.03.1978
Patient 3: Schmidt, Th. | Hauptstr. 12 | 80331 Muenchen | geb. 15.03.1978
Patient 4: Schmidt-Berger, Anna | Hauptstr. 12 | 80331 München | geb. 22.07.1981
Patient 1, 2 und 3 sind dieselbe Person – erkennbar am Geburtsdatum und der Adresse. Patient 4 wohnt an derselben Adresse, ist aber eine andere Person (vermutlich die Partnerin).
Ein einfacher Excel-Abgleich findet diese Dubletten nicht: "Schmidt" und "Schmitt" sind nicht identisch, "Hauptstr." und "Hauptstraße" ebenso wenig. "Muenchen" und "München" scheitert an der Umlaut-Schreibweise.
Die häufigsten Fehlerquellen
- Tippfehler bei der Aufnahme – Unter Zeitdruck am Empfang: "Maier" statt "Meier", "Bahnhofstr." statt "Bahnhofsstraße"
- Namensänderungen – Heirat, Scheidung: "Frau Müller" wird zu "Frau Müller-Weber", alter Datensatz bleibt bestehen
- Abkürzungen – "Dr." mal mit, mal ohne Punkt, "Str." vs. "Straße"
- eGK-Datenimport – Unterschiedliche Schreibweisen zwischen Krankenkasse und Praxis
- Umzüge – Neue Adresse, alter Datensatz nicht aktualisiert, Patient erscheint doppelt
Was doppelte Patientendaten in der Praxis kosten
Die Konsequenzen gehen über den administrativen Aufwand hinaus.
Direkte Kosten
Recall-Mailings an falsche Adressen: Eine Hausarztpraxis verschickt pro Quartal 200 bis 500 Recall-Briefe (Vorsorge, Impfauffrischung, Kontrolltermine). Bei einer Dublettenquote von 5–8% landen 10 bis 40 Briefe an veraltete Adressen oder gehen doppelt raus.
Rechenbeispiel für eine mittelgroße Praxis (6.000 Patienten, 400 Recalls/Quartal):
- Dublettenquote 6% = 24 fehlerhafte Briefe pro Quartal
- Kosten pro Brief (Druck + Porto): 1,10 EUR
- Verschwendete Kosten pro Quartal: 26,40 EUR
- Verschwendete Kosten pro Jahr: 105,60 EUR
Das klingt überschaubar – aber es kommt der indirekte Schaden dazu.
Indirekte Kosten
- Doppelte Terminvergabe: Patient steht zweimal im System, bekommt zwei Terminerinnerungen, blockiert einen Slot
- Verwechslungsgefahr: Zwei Datensätze für denselben Patienten mit unterschiedlichen Befunden, Medikationen oder Allergien – ein klinisches Risiko
- DSGVO-Auskunftsrecht: Patient verlangt Auskunft nach Art. 15 DSGVO. Wenn drei Datensätze existieren, müssen alle gefunden und zusammengeführt werden. Zeitaufwand: 30–60 Minuten pro Fall statt 5 Minuten
Warum Cloud-Bereinigung für Arztpraxen keine Option ist
Viele Bereinigungstools arbeiten in der Cloud: Daten hochladen, verarbeiten lassen, Ergebnis herunterladen. Für einen Webshop mit Kundenadressen mag das funktionieren. Für eine Arztpraxis ist es ein Risiko, das sich nicht lohnt.
§203 StGB verbietet die Offenbarung von Patientengeheimnissen. Das Hochladen einer Patientenliste auf einen externen Server – auch wenn der Anbieter einen AVV hat – kann als Offenbarung gewertet werden. Die Rechtslage ist hier strenger als bei der DSGVO: Auch ein sorgfältig aufgesetzter AVV schützt nicht zuverlässig vor strafrechtlicher Verantwortung.
Die KBV (Kassenärztliche Bundesvereinigung) empfiehlt in ihren IT-Sicherheitsrichtlinien (§75b SGB V), Patientendaten grundsätzlich nicht in externe Cloud-Dienste zu übertragen, die nicht für den Gesundheitssektor zertifiziert sind.
Die sichere Alternative: Software, die komplett auf dem Praxisrechner läuft, ohne Daten nach außen zu senden. Mehr dazu, warum Offline-Verarbeitung DSGVO-konform ist, finden Sie in unserem Artikel zur DSGVO-konformen Adressbereinigung.
Patientendaten bereinigen – so geht es offline
Ein praxistauglicher Bereinigungsprozess für Patientenstammdaten sieht so aus:
Schritt 1: Export aus der Praxissoftware
Die meisten Praxisverwaltungssysteme (PVS) wie medatixx, CGM TURBOMED oder Dampsoft erlauben den Export der Patientenstammdaten als CSV oder Excel-Datei. Exportieren Sie mindestens diese Felder:
- Nachname, Vorname
- Geburtsdatum
- Straße, PLZ, Ort
- Patientennummer (als Referenz)
Wichtig: Exportieren Sie keine medizinischen Daten (Diagnosen, Befunde, Medikation). Für die Adressbereinigung brauchen Sie nur Stammdaten.
Schritt 2: Fuzzy Matching statt exaktem Vergleich
Excel kann nur exakte Übereinstimmungen finden. "Schmidt" und "Schmitt" sind für Excel zwei verschiedene Personen. Sie brauchen Fuzzy Matching – Algorithmen, die Ähnlichkeiten erkennen:
- Levenshtein-Distanz: Misst die Anzahl der Zeichenänderungen. "Schmidt" → "Schmitt" = 1 Änderung = 93% Übereinstimmung
- Phonetische Analyse: "Meier", "Meyer", "Maier" klingen gleich – phonetisches Matching erkennt das
- Token-basierter Vergleich: "Dr. Thomas Schmidt" und "Schmidt, Thomas" werden als identisch erkannt, obwohl die Reihenfolge anders ist
Diese Verfahren können auch Doppelnamen wie "Müller-Weber" mit "Weber" oder "Müller" abgleichen – ein häufiges Szenario bei Namensänderungen durch Heirat.
Schritt 3: Haushaltserkennung nutzen
Neben Dubletten gibt es in Patientendaten häufig Familienmitglieder an derselben Adresse. Das ist keine Dublette – Vater und Sohn an der gleichen Adresse sind zwei Patienten. Aber für Recall-Mailings kann es sinnvoll sein, nur einen Brief pro Haushalt zu versenden ("Familie Schmidt, bitte an Vorsorge-Termine denken").
Haushaltserkennung gruppiert Patienten nach Adresse und identifiziert zusammengehörende Datensätze, ohne sie fälschlich als Dubletten zu markieren.
Schritt 4: PLZ-Validierung
Veraltete oder falsche PLZ-Angaben sind ein häufiges Problem, besonders bei Patienten die umgezogen sind. Eine PLZ-Validierung prüft:
- Ist die PLZ formal korrekt (5 Stellen in Deutschland)?
- Existiert die PLZ tatsächlich?
- Passt die PLZ zum angegebenen Ort? (PLZ 80331 = München, nicht Stuttgart)
Fehlerhafte PLZ-Ort-Kombinationen werden markiert und können korrigiert werden – bevor der Recall-Brief an die falsche Adresse geht.
Schritt 5: Ergebnisse in die Praxissoftware zurückspielen
Nach der Bereinigung importieren Sie die korrigierten Stammdaten zurück in Ihr PVS. Die meisten Systeme unterstützen den CSV-Import mit Zuordnung über die Patientennummer.
ListenFix: Offline-Bereinigung für Arztpraxen
ListenFix wurde genau für solche Anforderungen entwickelt: Die gesamte Datenverarbeitung läuft lokal auf Ihrem Praxisrechner. Keine Cloud, kein Upload, keine Datenübertragung an Dritte.
Konkret bedeutet das für Ihre Praxis:
- §203 StGB-konform: Patientendaten verlassen nie den Praxisrechner. Kein Offenbarungsrisiko.
- Kein AVV nötig: Da keine Auftragsverarbeitung stattfindet, entfällt der gesamte Vertrags-Overhead.
- 5 Fuzzy-Matching-Algorithmen: Tippfehler, Abkürzungen, Namensänderungen und phonetische Ähnlichkeiten werden erkannt.
- Haushaltserkennung: Familienmitglieder an derselben Adresse werden gruppiert, nicht fälschlich zusammengeführt.
- PLZ-Validierung für 29 Länder: Auch Patienten mit ausländischen Adressen werden geprüft.
Der Starter-Plan (69 EUR einmalig) reicht für die meisten Einzelpraxen. Gemeinschaftspraxen mit regelmäßigem Bereinigungsbedarf profitieren vom Professional-Plan (99 EUR/Monat) mit automatisierten Bereinigungsläufen.
Mehr zum Thema Datenschutz bei der Adressbereinigung finden Sie auch in unserem Artikel zu Datenschutz und Kundendaten sowie im Leitfaden zum Adressdaten bereinigen.
Checkliste: Patientendaten-Bereinigung in 5 Schritten
Bevor Sie starten, prüfen Sie diese Punkte:
- Software läuft offline? Keine Cloud-Uploads, keine externen Server. Pflicht bei Patientendaten.
- Nur Stammdaten exportiert? Keine Diagnosen, Befunde oder Medikationen in der Export-Datei.
- Fuzzy Matching aktiv? Exakter Abgleich reicht bei Patientennamen nicht aus.
- Ergebnisse geprüft? Automatisch gefundene Dubletten vor dem Zusammenführen manuell bestätigen – eine falsche Zusammenführung ist schlimmer als eine übersehene Dublette.
- Bereinigung dokumentiert? DSGVO Art. 5 Abs. 2 verlangt Nachweisbarkeit. Protokollieren Sie, wann bereinigt wurde und welche Datensätze zusammengeführt wurden.
Die Bereinigung von Patientenstammdaten ist kein einmaliges Projekt, sondern sollte quartalsweise wiederholt werden – idealerweise vor jeder großen Recall-Aktion. So bleiben Ihre Daten sauber und Ihre Praxis bleibt auf der sicheren Seite von §203 StGB und DSGVO.
Adressen bereinigen — jetzt testen
ListenFix erkennt per Fuzzy Matching deutlich mehr Duplikate als Excel. 100% offline, DSGVO-konform.
Kostenlos testen