Deduplicación por hogar: una carta por domicilio, no tres

La familia García vive en la Calle Gran Vía 28, 28013 Madrid. El señor García compró un producto en la tienda online en 2023, la señora García se suscribió al boletín en 2024 y su hijo Pablo descargó un catálogo. En su base de datos existen tres registros, y en su próxima campaña de mailing postal salen tres catálogos idénticos al mismo buzón. Con una tarifa de Publicorreo de Correos a 0,22 EUR por envío, los dos ejemplares innecesarios cuestan 0,44 EUR. Parece poco, pero con 25.000 direcciones y un solapamiento típico del 12 % entre hogares, el gasto superfluo supera los 1.300 EUR por campaña.
La deduplicación por hogar resuelve este problema. Identifica a las personas que residen en la misma dirección y agrupa los envíos: una sola carta por domicilio. En España, esta técnica resulta especialmente rentable para empresas que utilizan los servicios de mailing masivo de Correos, donde cada envío eliminado reduce directamente la factura postal.
Deduplicación por hogar vs deduplicación clásica
La deduplicación clásica busca personas duplicadas: ¿es «Juan García, C/ Gran Vía 28» la misma persona que «J. García, Calle Gran Vía 28»? Si la respuesta es sí, uno de los dos registros se fusiona o elimina.
La deduplicación por hogar plantea otra pregunta: ¿viven Juan García y María García en la misma dirección? Si es así, basta con un solo envío para todo el hogar. Ambas personas permanecen como registros independientes en la base de datos – solo se optimiza el envío.
| Método | Pregunta | Resultado |
|---|---|---|
| Deduplicación clásica | ¿A y B son la misma persona? | Se elimina un registro |
| Deduplicación por hogar | ¿A y B viven en el mismo sitio? | Un solo envío por dirección |
Esta diferencia es clave para el cumplimiento del RGPD: con la deduplicación por hogar no se borra ningún dato personal. Solo se optimiza la logística de envío.
Cómo funciona la deduplicación por hogar
El proceso consta de tres fases técnicas:
Fase 1: Normalización de direcciones
Las direcciones españolas presentan múltiples variantes de escritura. «C/» puede aparecer como «Calle», «CL» o «c/», «Avenida» como «Avda.» o «Av.», y los códigos postales a veces se escriben sin el cero inicial. Sin normalización previa, dos direcciones idénticas pasarán desapercibidas.
Datos originales:
Registro 1: García, Juan | C/ Gran Vía 28 | 28013 Madrid
Registro 2: García, María | Calle Gran Vía, 28 | 28013 Madrid
Registro 3: Rodríguez, Pablo | C/ Gran Vía 28, 3ºB | 28013 Madrid
Tras normalización:
Registro 1: García, Juan | Calle Gran Vía 28 | 28013 Madrid
Registro 2: García, María | Calle Gran Vía 28 | 28013 Madrid
Registro 3: Rodríguez, Pablo | Calle Gran Vía 28 3B | 28013 Madrid
Fase 2: Agrupación por hogar
Las direcciones normalizadas se comparan. Todas las personas con la misma calle, número y código postal forman un hogar. Los complementos de dirección importan: el 28 y el 28 3ºB son viviendas distintas. García (nº 28) y Rodríguez (nº 28 3B) son dos hogares separados.
Las herramientas profesionales emplean Fuzzy Matching para gestionar las variaciones residuales – «3ºB» frente a «3B» frente a «3º B» – porque la introducción manual de datos genera inconsistencias inevitables.
Fase 3: Selección del destinatario principal
Para cada hogar se designa un destinatario principal según criterios configurables:
- Última compra: la persona con la actividad más reciente
- Valor del cliente: el cliente con mayor facturación acumulada
- Antigüedad: el primer inscrito en la base de datos
Los demás miembros del hogar permanecen en la base – simplemente se excluyen del envío actual.
Cálculo de ahorro: impacto en campañas de mailing postal
Veamos un caso concreto con las tarifas de Correos 2026:
Supuestos:
- 25.000 direcciones en la base de datos
- 12 % de solapamiento entre hogares (media del sector)
- Tarifa Publicorreo: 0,22 EUR por envío
- 4 campañas al año
| Indicador | Sin deduplicación | Con deduplicación |
|---|---|---|
| Envíos por campaña | 25.000 | 22.000 |
| Coste postal por campaña | 5.500 EUR | 4.840 EUR |
| Ahorro por campaña | – | 660 EUR |
| Ahorro anual (4 campañas) | – | 2.640 EUR |
Este cálculo solo incluye el franqueo. Si añadimos la impresión (0,06 a 0,12 EUR por pieza) y la manipulación (0,02 a 0,04 EUR), el ahorro real supera los 3.500 EUR anuales.
Para asociaciones y ONG que envían llamamientos de donaciones, el impacto es aún mayor. Un fichero de donantes acumulado durante 10 años contiene inevitablemente duplicados de hogar – cónyuges inscritos por separado, hijos que han crecido en la misma dirección.
Comparativa de tarifas de Correos para mailing masivo
| Producto Correos | Tarifa unitaria | Peso máx. | Condición |
|---|---|---|---|
| Carta ordinaria | 0,75 EUR | 20 g | Unitario |
| Carta certificada | 4,30 EUR | 20 g | Unitario, con acuse |
| Publicorreo | desde 0,22 EUR | 50 g | ≥ 500 envíos |
| Publicorreo Premium | desde 0,32 EUR | 100 g | ≥ 500 envíos |
Cuanto mayor es el volumen de envíos, más baja la tarifa de Publicorreo – y más cuenta cada envío eliminado mediante deduplicación.
Cuándo la deduplicación por hogar tiene sentido – y cuándo no
Tiene sentido para:
- Catálogos y folletos comerciales
- Revistas de clientes y newsletters impresas
- Llamamientos de donaciones y correo asociativo
- Invitaciones a eventos (ferias, jornadas de puertas abiertas)
No tiene sentido para:
- Ofertas personalizadas por individuo (código de descuento nominativo)
- Correo con valor legal (facturas, reclamaciones)
- Mailings B2B a distintos interlocutores en la misma empresa
- Envíos donde cada destinatario debe figurar con su nombre
Las asociaciones con cuotas familiares son las más afectadas: es habitual que tres miembros de la misma familia reciban tres ejemplares idénticos del boletín trimestral. La tasa de solapamiento alcanza entonces el 20 al 30 %.
Errores frecuentes que conviene evitar
1. Ignorar los complementos de dirección El 28, el 28 1ºA y el 28 3ºB son tres viviendas. Fusionarlas en un solo hogar envía el correo a la persona equivocada.
2. Mezclar direcciones profesionales y particulares Si un empleado usa la dirección de la empresa como dirección de entrega, no debe fusionarse con la de otro compañero en el mismo centro de trabajo.
3. No actualizar periódicamente Los hogares cambian – mudanzas, separaciones, fallecimientos. Una base limpia en enero deja de estarlo en julio.
4. Agrupar sin normalización previa Sin normalizar primero, «C/ Gran Vía 28» y «Calle Gran Vía, 28» quedan como dos hogares distintos.
Deduplicación por hogar con ListenFix
ListenFix combina normalización de direcciones, deduplicación clásica y agrupación por hogar en una sola operación. Importe su fichero de direcciones y la herramienta identifica automáticamente los registros que pertenecen al mismo hogar.
Cinco algoritmos de comparación – entre ellos la distancia de Levenshtein y la fonética de Colonia – detectan coincidencias incluso cuando las direcciones están escritas de forma diferente. El procesamiento se realiza íntegramente en su ordenador, sin transmitir datos a servidores externos. Cumple con los requisitos del RGPD.
El resultado: una lista depurada donde cada hogar aparece una sola vez, con un destinatario principal claramente identificado. Los demás miembros del hogar se conservan en la exportación, marcados pero no eliminados.
Tres pasos para empezar a ahorrar
Antes de cada campaña de mailing postal, pase su fichero por una deduplicación por hogar. El proceso lleva pocos minutos y puede ahorrar miles de euros al año.
- Diagnóstico: importe su fichero en ListenFix y mida la tasa real de solapamiento de su base.
- Cálculo: multiplique los duplicados encontrados por su tarifa postal y el número de campañas anuales.
- Rutina: integre la deduplicación como paso sistemático antes de cada envío.
Cada carta duplicada que no llega a un buzón es una carta que no paga – ni en franqueo, ni en impresión, ni en manipulación. Descargar ListenFix gratis y comprobar el ahorro potencial de su fichero lleva menos de cinco minutos.
Limpia tus direcciones — pruébalo ahora
ListenFix detecta significativamente más duplicados que Excel gracias al fuzzy matching. 100% sin conexión, compatible con RGPD.
Probar gratis