Dédoublonnage familial : reconnaître les liens de parenté

La famille Dupont vit au 42 Boulevard Haussmann, 75008 Paris. Quatre personnes au foyer : Pierre Dupont, son épouse Sophie Dupont-Lefèvre, leur fille majeure Camille Dupont et leur fils Louis, dix ans. Dans votre base CRM figurent cinq enregistrements à cette adresse : Pierre depuis une commande de 2021, Sophie Dupont-Lefèvre via la boutique en ligne en 2023, Sophie Lefèvre (nom de jeune fille) issue d'une inscription newsletter de 2018, Camille via une campagne récente, et Louis parce que sa mère l'a inscrit lors d'un événement sportif. Au prochain mailing de don, cinq courriers identiques partent vers le 42 Boulevard Haussmann.
Le dédoublonnage classique n'en détecte que trois, car Sophie Lefèvre et Sophie Dupont-Lefèvre sont traitées comme deux personnes distinctes, et Louis, mineur, ne devrait normalement pas recevoir de courrier publicitaire. Le dédoublonnage familial comble précisément cette lacune. Il reconnaît les liens familiaux même quand le nom change après un mariage, quand quelqu'un porte un nom composé, ou quand un enfant a été enregistré comme contact autonome.
Ce qui distingue le dédoublonnage familial du dédoublonnage au foyer
Le dédoublonnage au foyer pose la question : ces personnes habitent-elles à la même adresse ? Si oui, un seul courrier suffit. Cela fonctionne bien pour les colocations sans lien de parenté, car la seule information utile est l'adresse postale.
Le dédoublonnage familial descend d'un cran. Il utilise la similarité des noms comme signal complémentaire pour identifier les véritables liens de parenté et traiter les cas particuliers qu'un simple rapprochement d'adresses laisserait passer.
| Méthode | Signal principal | Reconnaît | Manque |
|---|---|---|---|
| Dédoublonnage simple | Personne A = personne B | Variantes d'orthographe d'une même personne | La famille comme entité |
| Dédoublonnage au foyer | Même adresse | Plusieurs personnes à une adresse | Nom de jeune fille, nom composé, mineurs |
| Dédoublonnage familial | Adresse + relation entre noms | Parents, enfants, conjoints sous ancien et nouveau nom | – |
La différence devient flagrante dès qu'une base contient des données historisées. Tout fichier accumulant des adresses depuis cinq ans ou plus contient nécessairement des doublons portant un nom différent pour la même personne. Un mariage, un divorce, un remariage, un enfant qui souhaite recevoir son propre courrier – chaque événement de vie génère un nouvel enregistrement qui appartient à la famille sans le montrer immédiatement.
Les cinq cas familiaux que les outils standards laissent passer
Cinq configurations reviennent systématiquement dans les opérations RNVP et de nettoyage de fichiers en France.
1. Mariage avec changement de nom
Sophie Lefèvre épouse Pierre Dupont et prend le nom Dupont. Dans le CRM coexistent deux enregistrements : un de l'inscription newsletter 2018 sous « Sophie Lefèvre » et un de la commande 2023 sous « Sophie Dupont ». Les deux résident désormais Boulevard Haussmann. Un simple rapprochement par adresse ne saura pas qu'il s'agit de la même personne – seule une logique de dédoublonnage familial avec reconnaissance des noms de jeune fille fait le lien.
2. Nom composé
Sophie choisit le nom composé Dupont-Lefèvre. La base contient maintenant trois variantes pour la même femme : Sophie Lefèvre, Sophie Dupont, Sophie Dupont-Lefèvre. Les outils classiques échouent souvent ici car les chaînes de caractères diffèrent et la phonétique ne donne pas de correspondance fiable.
3. Enfant majeur encore au foyer
Camille Dupont a 22 ans, étudie à Lyon, mais reçoit son courrier postal Boulevard Haussmann parce qu'elle n'y revient qu'aux vacances. Elle s'est abonnée à une newsletter associative avec l'adresse de ses parents. Résultat : un quatrième enregistrement à la même adresse, appartenant à la même famille.
4. Mineurs enregistrés comme contacts autonomes
Louis Dupont, dix ans, a été inscrit par sa mère lors d'une inscription à un club sportif pour enfants. Adresse : 42 Boulevard Haussmann. Louis pose un problème RGPD comme destinataire autonome – la publicité aux mineurs reste encadrée. Il figure malgré tout dans le CRM comme enregistrement individuel et reçoit des mailings.
5. Parents divorcés à deux adresses
Le couple se sépare, Sophie déménage 8 rue de Rivoli à Paris. Son nom de jeune fille était Lefèvre. Elle garde Dupont-Lefèvre. Le CRM contient désormais une personne historiquement rattachée à la famille Dupont du Boulevard Haussmann, mais qui réside ailleurs. La logique inverse s'impose : malgré la proximité des noms, ce n'est plus un foyer commun.
Comment les algorithmes reconnaissent un lien familial
La mise en œuvre technique se déroule en quatre étapes.
Étape 1 : créer des grappes d'adresses
Tous les enregistrements avec adresse normalisée identique sont pré-groupés. « Bd Haussmann 42 », « Boulevard Haussmann 42 » et « 42 Bd Haussmann, 75008 Paris » atterrissent dans la même grappe. Plus de détails sur la normalisation dans l'article Correspondance approximative des adresses.
Étape 2 : heuristique sur les noms
À l'intérieur de chaque grappe d'adresses, l'algorithme analyse la relation entre les noms. Trois règles s'appliquent :
- Nom identique : probablement membres d'une même famille
- Nom composé contenant un nom simple : « Dupont-Lefèvre » contient « Dupont » et « Lefèvre » – indice possible de mariage
- Proximité phonétique : « Lefèvre » et « Lefebvre » sont rapprochés via une fonction phonétique adaptée au français, à condition que l'adresse soit identique
Étape 3 : heuristique d'âge pour les mineurs
Si une date de naissance est présente, l'âge est calculé. Les enregistrements de personnes de moins de 15 ans sont signalés et automatiquement exclus des envois publicitaires. À défaut de date de naissance, la base de prénoms donne un signal faible : « Louis », « Léa » ou « Tom » sont souvent des prénoms d'enfants en France selon les statistiques de l'INSEE. Ce signal reste indicatif, pas démonstratif.
Étape 4 : déterminer la personne principale
Pour chaque famille identifiée, un destinataire principal est désigné. Règles habituelles :
- Personne la plus âgée (via date de naissance)
- Personne avec le plus haut historique de dons ou de commandes
- Personne dont l'enregistrement a été mis à jour le plus récemment
Avant le dédoublonnage familial :
ID Prénom Nom Naissance Adresse
1 Pierre Dupont 1972 42 Bd Haussmann, 75008 Paris
2 Sophie Dupont 1975 42 Bd Haussmann, 75008 Paris
3 Sophie Lefèvre 1975 42 Bd Haussmann, 75008 Paris
4 Sophie Dupont-Lefèvre (vide) 42 Bd Haussmann, 75008 Paris
5 Camille Dupont 2004 42 Bd Haussmann, 75008 Paris
6 Louis Dupont 2016 42 Bd Haussmann, 75008 Paris
Après le dédoublonnage familial :
Famille Destinataire principal Membres Envois
F-001 Pierre Dupont 4 adultes 1 courrier : « Famille Dupont »
+ 1 mineur exclu (Louis exclu)
De six enregistrements, on passe à un destinataire principal et quatre membres rattachés. La variante au nom de jeune fille (ID 3) et la variante composée (ID 4) sont identifiées comme la même personne. Louis est exclu car mineur.
Calcul de coûts : combien une association économise grâce au dédoublonnage familial
Le dédoublonnage familial est particulièrement rentable dans deux secteurs : les associations à adhésions familiales et les compagnies d'assurance qui ont historiquement vendu des contrats à différents membres d'une famille. Exemple avec une association caritative de taille moyenne.
Situation de départ :
- 18 000 enregistrements en base
- Trois appels aux dons par an en publipostage
- Tarif Destineo MD : 0,256 EUR par envoi
- Impression et mise sous pli : 0,42 EUR supplémentaires par envoi
Sans nettoyage, l'association expédie 18 000 plis à chaque opération. Un premier dédoublonnage au foyer réduit à 16 200 envois (10 % de recouvrement). Un dédoublonnage familial complémentaire, qui prend en compte les noms de jeune fille, les noms composés et les mineurs, abaisse à 14 940 plis – 8 % d'économies supplémentaires grâce aux liens familiaux détectés.
| Étape | Envois | Affranchissement | Impression | Total par opération |
|---|---|---|---|---|
| Avant nettoyage | 18 000 | 4 608 EUR | 7 560 EUR | 12 168 EUR |
| Après dédoublonnage au foyer | 16 200 | 4 147 EUR | 6 804 EUR | 10 951 EUR |
| Après dédoublonnage familial | 14 940 | 3 825 EUR | 6 275 EUR | 10 100 EUR |
Économie par opération par rapport à la situation initiale : 2 068 EUR. Sur trois opérations annuelles, cela représente 6 204 EUR par an. À ces économies chiffrées s'ajoute un effet qualitatif : les destinataires qui cessent de recevoir cinq plis identiques par campagne se plaignent moins et remettent moins en question leur soutien à la cause.
Le détail des tarifs Destineo et des conditions de publipostage La Poste figure dans le Guide du publipostage.
Quand le dédoublonnage familial est interdit
Plusieurs cas excluent le regroupement en famille.
Offres personnalisées par personne : si chaque membre dispose d'un code promo nominatif ou d'un compte fidélité, les envois individuels restent obligatoires.
Courrier juridiquement obligatoire : factures, mises en demeure, résiliations, attestations d'assurance – tout ce qui engage juridiquement une personne précise ne peut pas être fusionné en envoi familial.
Adultes cohabitant sans lien de parenté : une colocation de trois étudiants forme un foyer mais pas une famille. Le dédoublonnage au foyer suffit ; un dédoublonnage familial supposerait à tort une relation de parenté.
Cas particulier RGPD pour les enfants : la CNIL rappelle que le traitement des données d'un mineur de moins de 15 ans repose sur le consentement des titulaires de l'autorité parentale (art. 8 RGPD, transposé en droit français). Un dédoublonnage familial doit identifier les mineurs avec fiabilité et les exclure des envois publicitaires. La conformité globale est traitée dans Nettoyage d'adresses conforme RGPD.
Mettre en place le dédoublonnage familial avec ListenFix
ListenFix combine les heuristiques décrites dans un outil exécuté en local. Normalisation d'adresses, détection de doublons, logique de nom de jeune fille et reconnaissance des noms composés s'enchaînent dans un même traitement.
Concrètement, le logiciel vérifie à l'intérieur de chaque grappe d'adresses :
- Si un nom composé tel que « Dupont-Lefèvre » contient les composantes « Dupont » ou « Lefèvre » présentes comme noms simples à la même adresse
- Si des noms phonétiquement proches (Lefèvre / Lefebvre, Mathieu / Matthieu) à la même adresse appartiennent vraisemblablement à la même famille
- Si les dates de naissance signalent un membre comme mineur
- Si la normalisation d'adresses (« Bd » → « Boulevard », compléments de numéro de rue) a déjà été appliquée
Le traitement reste sur l'ordinateur de l'utilisateur, les données d'adresses ne quittent pas le système. Cela compte pour les associations, les cabinets médicaux ou les études notariales pour qui un envoi vers le cloud est exclu pour des raisons de confidentialité. Le résultat est un fichier Excel ou CSV dans lequel chaque famille reçoit un identifiant unique et où le destinataire principal est repéré. Les autres membres restent visibles dans le fichier mais sont supprimés de l'adressage final.
Pour ceux qui travaillaient jusqu'ici aux fonctions natives d'Excel, le problème est connu : « Supprimer les doublons » ne trouve que les correspondances exactes. Noms de jeune fille, noms composés et variantes d'orthographe passent à travers. Comparatif complet dans Supprimer les doublons d'adresses Excel.
Du chaos CRM à une base familiale propre
Trois étapes mènent du fichier non nettoyé à une structure familiale propre :
- État des lieux : chargez un export adresses récent dans un outil capable de détecter les liens familiaux. Mesurez la part des enregistrements appartenant à des familles identifiables. Une fourchette de 8 à 20 % est courante, et davantage pour les associations à adhésions familiales.
- Définir le règlement : fixez la règle de désignation du destinataire principal (personne la plus âgée, plus haut cumul de dons, activité la plus récente) et les champs utilisés pour la détection familiale. Pour les associations caritatives, le cumul de dons est généralement le bon critère.
- Intégrer au processus de mailing : le dédoublonnage familial s'effectue avant chaque envoi, pas une fois par an. Les adresses évoluent en permanence – mariage, divorce, départ des enfants, déménagement des parents. Un nettoyage ponctuel se périme en quelques mois.
Installer ces trois étapes produit un double effet : baisse des coûts d'envoi et meilleure réception des destinataires. Les deux jouent directement sur la rentabilité de chaque campagne. Téléchargez ListenFix gratuitement pour appliquer ce traitement à votre fichier dès aujourd'hui.
Nettoyez vos adresses — essayez maintenant
ListenFix détecte nettement plus de doublons qu'Excel grâce au fuzzy matching. 100% hors ligne, conforme au RGPD.
Essayer gratuitement