← Todos los artículos

Deduplicación familiar: reconocer parentescos en su CRM

También disponible en:DeutschFrançais
Miembros de una misma familia con apellidos distintos consolidados en un único registro

La familia García-Rodríguez vive en la Calle Gran Vía 28, 28013 Madrid. Cuatro personas en el domicilio: Carlos García, su esposa María García-Rodríguez, la hija mayor de edad Carmen García y el hijo Pablo, de diez años. En su CRM existen cinco registros para esta dirección: Carlos desde un pedido de 2021, María García-Rodríguez desde la tienda online en 2023, María Rodríguez (apellido de soltera) procedente de una suscripción al boletín en 2018, Carmen de una campaña reciente y Pablo, porque su madre lo inscribió en una actividad infantil. En la próxima campaña de captación, cinco cartas idénticas salen hacia la Calle Gran Vía 28.

La deduplicación clásica solo detecta tres, porque María Rodríguez y María García-Rodríguez aparecen como dos personas distintas, y Pablo, menor de edad, no debería recibir publicidad personalizada. La deduplicación familiar cubre exactamente ese hueco. Reconoce vínculos familiares incluso cuando el apellido cambia tras un matrimonio, cuando alguien usa un apellido compuesto o cuando un menor se ha registrado como contacto independiente.

Qué diferencia la deduplicación familiar de la deduplicación por hogar

La deduplicación por hogar plantea una pregunta: ¿estas personas viven en el mismo domicilio? Si la respuesta es sí, basta con un envío. Esto funciona bien para pisos compartidos sin parentesco, porque el único dato necesario es la dirección.

La deduplicación familiar va un paso más allá. Utiliza la similitud entre apellidos como señal complementaria para identificar vínculos familiares reales y tratar casos especiales que un simple cruce por dirección pasaría por alto.

MétodoSeñal principalReconoceNo detecta
Deduplicación simplePersona A = persona BVariantes ortográficas de la misma personaFamilia como unidad
Deduplicación por hogarMisma direcciónPersonas en una direcciónApellido de soltera, apellido compuesto, menores
Deduplicación familiarDirección + relación entre apellidosPadres, hijos, cónyuges con apellido antiguo y nuevo

La diferencia se nota en cuanto una base contiene datos históricos. Cualquier fichero que acumule direcciones desde hace cinco años o más contiene de forma inevitable registros con apellidos distintos para la misma persona. Un matrimonio, un divorcio, una segunda boda, un hijo que quiere recibir su propio correo – cada acontecimiento vital genera un registro nuevo que pertenece a la familia sin parecerlo a primera vista.

Los cinco casos familiares que las herramientas estándar pasan por alto

Cinco configuraciones aparecen una y otra vez en proyectos de limpieza de direcciones en España.

1. Matrimonio con uso del apellido del cónyuge

En España el apellido legal no cambia con el matrimonio, pero en la práctica algunas personas firman con un apellido compuesto que incluye el del cónyuge. María Rodríguez se presenta tras casarse como María García-Rodríguez. En el CRM coexisten dos registros: uno de la suscripción al boletín en 2018 como « María Rodríguez » y otro del pedido online de 2023 como « María García-Rodríguez ». Las dos viven ahora en la Calle Gran Vía 28. Un cruce solo por dirección no sabe que se trata de la misma persona – únicamente una lógica de deduplicación familiar con reconocimiento del apellido de soltera enlaza ambos.

2. Apellidos compuestos

La base contiene ahora tres variantes para la misma mujer: María Rodríguez, María García y María García-Rodríguez. Las herramientas clásicas fallan a menudo aquí porque las cadenas literales difieren y la fonética no aporta una coincidencia fiable. El reto se agudiza porque en España el segundo apellido (materno) es habitual: « García López » y « García-Rodríguez » son configuraciones diferentes que la heurística debe distinguir.

3. Hijos adultos que aún reciben correo en casa

Carmen García tiene 22 años, estudia en Barcelona, pero recibe la correspondencia en la Calle Gran Vía 28 porque solo vuelve en vacaciones. Se ha suscrito a una newsletter de una asociación con la dirección de sus padres. Resultado: un cuarto registro en la misma dirección que pertenece a la misma familia.

4. Menores como contactos independientes

Pablo García, de diez años, fue inscrito por su madre en un club deportivo infantil. Dirección: Calle Gran Vía 28. Pablo plantea un problema jurídico como destinatario directo – la publicidad a menores está limitada por el RGPD. Pese a ello, figura en el CRM como registro independiente y recibe mailings.

5. Padres separados en dos direcciones

La pareja se separa y María se traslada a Calle Goya 45, Madrid. Su apellido de soltera era Rodríguez. Sigue firmando como García-Rodríguez. El CRM contiene ahora una persona vinculada históricamente a la familia García de la Calle Gran Vía, pero que vive en otra dirección. La conclusión debe invertirse: a pesar de la coincidencia en los apellidos, ya no es un hogar común.

Cómo identifican los algoritmos un vínculo familiar

La implementación técnica se desarrolla en cuatro pasos.

Paso 1: agrupar direcciones

Todos los registros con dirección normalizada idéntica se preagrupan. « C/ Gran Vía 28 », « Calle Gran Vía 28 » y « Gran Vía 28, 28013 Madrid » caen en el mismo grupo. Más detalles sobre la normalización en el artículo Coincidencia aproximada de direcciones.

Paso 2: heurística sobre apellidos

Dentro de cada grupo de dirección, el algoritmo analiza la relación entre los apellidos. Se aplican tres reglas:

Paso 3: heurística por fecha de nacimiento para menores

Si existe una fecha de nacimiento, se calcula la edad. Los registros de personas menores de 14 años se marcan y se excluyen automáticamente de los envíos publicitarios (umbral establecido por la LOPDGDD para el consentimiento autónomo). Si no hay fecha de nacimiento, la base de nombres aporta una señal débil: « Pablo », « Lucía » o « Mateo » son a menudo nombres infantiles según las estadísticas del INE. Esta señal es indicativa, no concluyente.

Paso 4: determinar la persona principal

Para cada familia identificada se designa un destinatario principal. Reglas habituales:

Antes de la deduplicación familiar:
ID  Nombre    Apellido           Nacim.     Dirección
1   Carlos    García             1972       Gran Vía 28, 28013 Madrid
2   María     García             1975       Gran Vía 28, 28013 Madrid
3   María     Rodríguez          1975       Gran Vía 28, 28013 Madrid
4   María     García-Rodríguez   (vacío)    C/ Gran Vía 28, 28013 Madrid
5   Carmen    García             2004       Gran Vía 28, 28013 Madrid
6   Pablo     García             2016       Gran Vía 28, 28013 Madrid

Después de la deduplicación familiar:
Familia   Destinatario principal  Miembros            Envíos
F-001     Carlos García           4 adultos           1 carta: « Familia García »
                                  + 1 menor excluido  (Pablo excluido)

De seis registros se pasa a un destinatario principal y cuatro miembros vinculados. La variante con apellido de soltera (ID 3) y la variante compuesta (ID 4) se identifican como la misma persona. Pablo queda excluido por ser menor.

Cálculo de costes: cuánto ahorra una asociación con deduplicación familiar

La deduplicación familiar es especialmente rentable en dos sectores: asociaciones con cuotas familiares y aseguradoras que han vendido históricamente pólizas a distintos miembros de la familia. Ejemplo con una asociación benéfica de tamaño medio.

Punto de partida:

Sin limpieza, la asociación envía 18.000 cartas en cada operación. Una primera deduplicación por hogar reduce a 16.200 envíos (10 % de solapamiento). Una deduplicación familiar adicional, que tiene en cuenta apellidos de soltera, apellidos compuestos y menores, baja a 14.940 envíos – un 8 % de ahorro extra gracias a los vínculos familiares detectados.

EtapaEnvíosFranqueoImpresiónTotal por operación
Antes de limpiar18.0003.960 EUR7.560 EUR11.520 EUR
Tras deduplicación por hogar16.2003.564 EUR6.804 EUR10.368 EUR
Tras deduplicación familiar14.9403.287 EUR6.275 EUR9.562 EUR

Ahorro por operación frente al punto inicial: 1.958 EUR. Con tres operaciones al año son 5.874 EUR anuales. A este ahorro cuantificable se suma un efecto cualitativo: los destinatarios que dejan de recibir cinco cartas idénticas por campaña reducen sus quejas y cuestionan menos su compromiso con la causa.

Las tarifas Publicorreo y los requisitos del mailing postal en Correos se detallan en la Guía de mailing postal.

Cuándo no debe aplicarse la deduplicación familiar

Varios casos excluyen la agrupación por familia.

Ofertas personalizadas por persona: si cada miembro dispone de un código de descuento nominativo o de una cuenta de fidelización, los envíos individuales se mantienen.

Correo legalmente obligatorio: facturas, requerimientos de pago, resoluciones de contrato, certificados de seguro – todo aquello que vincula jurídicamente a una persona concreta no puede unificarse en un envío familiar.

Adultos que conviven sin parentesco: un piso compartido por tres estudiantes forma un hogar, pero no una familia. Basta la deduplicación por hogar; una deduplicación familiar supondría erróneamente un vínculo de parentesco.

Caso especial RGPD para menores: la LOPDGDD establece el consentimiento autónomo a partir de los 14 años; por debajo es necesario el consentimiento de los titulares de la patria potestad (art. 8 RGPD aplicado en España). Una deduplicación familiar debe identificar a los menores con fiabilidad y excluirlos de los envíos publicitarios. El marco completo se trata en Limpieza de direcciones conforme al RGPD.

Implementación de la deduplicación familiar con ListenFix

ListenFix combina las heurísticas descritas en una herramienta de ejecución local. Normalización de direcciones, detección de duplicados, lógica de apellido de soltera y reconocimiento de apellidos compuestos se encadenan en un único procesamiento.

En concreto, el software verifica dentro de cada grupo de dirección:

El procesamiento permanece en el equipo del usuario; los datos de direcciones no abandonan el sistema. Esto importa a asociaciones, consultas médicas o despachos de abogados para los que un envío a la nube queda descartado por motivos de confidencialidad. El resultado es un fichero Excel o CSV en el que cada familia recibe un identificador único y el destinatario principal está marcado. El resto de miembros sigue visible en el fichero, pero se omite en el adresado final.

Para quienes hasta ahora trabajaban con las funciones nativas de Excel, el problema es conocido: « Eliminar duplicados » solo encuentra coincidencias exactas. Apellidos de soltera, apellidos compuestos y variantes ortográficas pasan inadvertidos. Comparativa completa en Eliminar duplicados en Excel: direcciones.

Del caos del CRM a una base familiar limpia

Tres pasos llevan del fichero sin limpiar a una estructura familiar ordenada:

  1. Diagnóstico: cargue una exportación reciente de direcciones en una herramienta capaz de detectar vínculos familiares. Mida la proporción de registros que pertenecen a familias identificables. Un rango entre el 8 y el 20 % es habitual, y más alto en asociaciones con cuotas familiares.
  2. Definir el reglamento: fije la regla para designar al destinatario principal (persona de mayor edad, mayor historial de donaciones, actividad más reciente) y los campos que pueden utilizarse para la detección familiar. Para asociaciones benéficas suele tener sentido el mayor importe acumulado de donaciones.
  3. Integrar en el proceso de mailing: la deduplicación familiar se ejecuta antes de cada envío, no una vez al año. Las direcciones cambian de manera continua – matrimonio, divorcio, salida de los hijos, mudanza de los padres. Una limpieza puntual se queda obsoleta en pocos meses.

Quien instala estos tres pasos obtiene un doble efecto: menor coste de envío y mejor recepción por parte de los destinatarios. Ambos repercuten directamente en la rentabilidad de cada campaña. Descargue ListenFix gratis para aplicar este tratamiento a su fichero hoy mismo.

Limpia tus direcciones — pruébalo ahora

ListenFix detecta significativamente más duplicados que Excel gracias al fuzzy matching. 100% sin conexión, compatible con RGPD.

Probar gratis