Medir la calidad de los datos: KPI e indicadores para direcciones

Querer mejorar la calidad de los datos sin haberla medido antes equivale a pilotar a ciegas. Un equipo de marketing afirma que el fichero de direcciones está "más o menos bien" mientras el operador postal informa, sobre el mismo envío, de un 11 por ciento de devoluciones. Ambas afirmaciones pueden ser ciertas: describen dimensiones distintas del mismo problema. Sólo los indicadores medibles convierten una impresión en una base para decidir.
El obstáculo casi nunca es la voluntad de medir, sino la elección de los KPI adecuados. "Calidad de los datos" es un término abstracto, poco útil sin indicadores precisos. Este artículo presenta siete métricas que se pueden calcular sobre una base de 30 000 o 300 000 direcciones sin software especializado, y muestra cómo condensarlas en un informe trimestral comprensible tanto para un responsable de marketing como para un director general.
Las seis dimensiones de la calidad de los datos
Las normas ISO 8000 y DAMA-DMBOK definen la calidad de los datos no como un valor único, sino como combinación de varias dimensiones. Para datos de direcciones, seis de ellas resultan especialmente relevantes:
| Dimensión | Pregunta que responde | Ejemplo de incumplimiento |
|---|---|---|
| Integridad | ¿Están rellenos todos los campos obligatorios? | Código postal vacío en el 4 por ciento de las fichas |
| Exactitud | ¿Los valores coinciden con la realidad? | Calle "Gran Va." en lugar de "Calle Gran Vía" |
| Coherencia | ¿Se introducen los mismos contenidos de forma homogénea? | "S.L." vs. "SL" vs. "Sociedad Limitada" |
| Unicidad | ¿Cada registro existe una sola vez? | Tres entradas para el mismo cliente |
| Actualidad | ¿Cuándo se modificó la ficha por última vez? | Ficha sin tocar desde hace 7 años |
| Validez | ¿Los valores cumplen las reglas definidas? | CP "28001A" o e-mail sin @ |
Cumplir las seis simultáneamente al máximo es el ideal teórico. En la práctica, lo importante es cuantificar cada dimensión y fijar umbrales a partir de los cuales hay que actuar.
KPI 1: Tasa de integridad
El punto de partida más sencillo. Para cada campo declarado obligatorio se calcula la proporción de fichas en las que el campo contiene un valor:
Tasa de integridad = (fichas con campo relleno / total) * 100
Ejemplo:
Total: 52 184 direcciones
Codigo postal relleno: 51 720
Integridad CP: 51 720 / 52 184 = 99,11 %
Integridad telefono: 33 410 / 52 184 = 64,02 %
Integridad tratamiento: 45 290 / 52 184 = 86,79 %
Aviso: "relleno" no significa "correcto". Un valor "-" o "N/D" está formalmente cubierto, pero es inútil. Defina para cada campo una lista de valores prohibidos y compruébela con una expresión regular estándar.
Valores de referencia:
- Campos postales obligatorios (nombre, calle, CP, ciudad): al menos 98 por ciento
- Campos de personalización (tratamiento, nombre): al menos 92 por ciento
- Campos de contacto opcionales (teléfono, e-mail): sin objetivo estricto, pero útil para seguimiento
KPI 2: Tasa de duplicados
Probablemente el indicador más caro de ignorar. Cada envío duplicado consume franqueo, papel y la paciencia del destinatario. El cálculo parece sencillo, y sólo lo es si se define con claridad el método de detección.
Tasa de duplicados = (duplicados detectados / total) * 100
La trampa: ¿qué cuenta como duplicado? Tres métodos habituales producen tres cifras distintas:
| Método | Ejemplo de coincidencia | Tasa típica de detección |
|---|---|---|
| Comparación exacta | Carácter a carácter idénticos | 2 a 4 por ciento |
| Hash de campos clave (apellido+CP+calle) | Combinación normalizada | 5 a 9 por ciento |
| Fuzzy matching (Levenshtein + fonético) | "García" = "Garcia", "Avda." = "Avenida" | 10 a 18 por ciento |
La elección lo cambia todo. Una base de 50 000 direcciones puede parecer "casi sin duplicados" con el método 1 y "urgente de sanear" con el método 3. Recomendación: publique siempre ambos valores – el exacto y el fuzzy. La diferencia entre ellos indica cuántas variantes ortográficas duermen en la base. Los algoritmos adecuados se describen en el artículo sobre deduplicación de direcciones.
KPI 3: Tasa de validez
La validez plantea: ¿el valor respeta el formato definido? Algunas reglas concretas:
Codigo postal Espana: Exactamente 5 cifras, primer digito 0-5
Codigo postal Francia: Exactamente 5 cifras, empieza por 01-95 o 97-98
Email: [caracteres]@[dominio].[TLD], TLD al menos 2 caracteres
Telefono Espana: Empieza por +34 o 6/7/8/9, al menos 9 cifras
Fecha de nacimiento: Fecha valida, no futura, no anterior a 1900
El cálculo por campo:
Tasa de validez = (valores validos / valores rellenos) * 100
Ejemplo e-mail:
Campos e-mail rellenos: 38 224
Formato valido: 37 590
Tasa de validez e-mail: 37 590 / 38 224 = 98,34 %
Ejemplo codigo postal:
Campos CP rellenos: 51 720
Formato valido: 51 488
Tasa de validez CP: 99,55 %
Tasas bajas suelen tener dos orígenes: importaciones sin control desde sistemas terceros o formularios web sin validación en el servidor. Ambos se corrigen, pero sólo si se miden regularmente.
KPI 4: Tasa de devoluciones
El único indicador que se obtiene después del envío, y precisamente por eso muy revelador. Correos, a través del servicio Publicorreo, devuelve la lista de envíos no entregables. Reparto habitual:
| Motivo de devolución | Cuota habitual | Qué indica sobre los datos |
|---|---|---|
| Desconocido | 4 a 6 por ciento | Falta de actualidad |
| Fallecido | 0,3 a 0,8 por ciento | Falta de actualidad, listas Robinson |
| Dirección incorrecta | 0,5 a 1,5 por ciento | Validez, exactitud |
| Rehusado | 0,3 a 0,8 por ciento | Datos de personalización erróneos |
Devoluciones totales en mailings B2C españoles: habitualmente entre el 5 y el 9 por ciento. Por encima del 10 por ciento la situación exige acción. Un envío de 5 000 cartas con un 11 por ciento de devoluciones tira a la basura unos 121 EUR de franqueo y producción (a 0,22 EUR por carta con Publicorreo) sin generar una sola respuesta. Antes de una operación de gran escala conviene una limpieza previa del fichero.
KPI 5: Índice de actualidad
Los datos envejecen. Según el INE, en España se inscriben cerca de 1,5 millones de cambios de domicilio al año (movimientos padronales), lo que equivale a un 3-4 por ciento de la población. Una base no actualizada en cinco años contiene estadísticamente entre el 15 y el 20 por ciento de direcciones obsoletas, más en grandes ciudades con alta rotación.
El índice de actualidad se calcula a partir de la fecha de última modificación de la ficha:
Edad de la ficha = Hoy - last_modified
Clases de actualidad:
< 12 meses -> reciente
12 a 24 meses -> aceptable
24 a 60 meses -> revisar
> 60 meses -> critica
Indice de actualidad = (fichas < 24 meses / total) * 100
Una base con un índice de 78 está claramente mejor que una con 41. Importante: "actualizada" no significa "corregida". Una ficha tocada en una operación masiva tiene una fecha nueva sin que su contenido haya cambiado. Un seguimiento serio distingue "último acceso" y "última modificación de contenido".
KPI 6: Tasa de coherencia
La coherencia es la dimensión olvidada. Mide si contenidos iguales se introducen de la misma manera. Ejemplos:
"Construcciones García SL"
"Construcciones Garcia S.L."
"CONSTRUCCIONES GARCIA SL"
"C. Garcia SL"
"Construcciones-Garcia"
-> Probablemente la misma empresa, pero cinco variantes.
La coherencia se cuantifica normalizando el campo (mayúsculas, caracteres especiales, abreviaturas) y midiendo cuántas fichas conservan su valor original:
Tasa de coherencia = (fichas sin diferencia tras normalizar / total) * 100
Ejemplo razon social:
52 184 fichas
identicas tras normalizar: 48 312
Tasa de coherencia razon social: 92,58 %
Una baja tasa de coherencia es a menudo el anuncio de un problema de duplicados: donde conviven variantes ortográficas, los duplicados ocultos están casi garantizados.
KPI 7: Tasa de verificación postal
Este indicador es opcional, pero muy útil para quien envía varios miles de cartas al año. Mide la proporción de direcciones cuya calle, número y municipio se han contrastado contra el callejero oficial (en España, el Callejero Cartográfico Postal y la base de Correos; en Francia, la RNVP) y se consideran entregables.
Tasa de verificacion = (direcciones verificables / total) * 100
Valores realistas:
- Base B2C reciente (< 2 anos) : 95 a 98 por ciento
- Base B2C madura (5 anos y mas) : 86 a 93 por ciento
- Base B2B : 88 a 95 por ciento
- Fondos muy antiguos (10 anos+) : 70 a 85 por ciento
La normalización postal abre acceso a tarifas Publicorreo de Correos, desde 0,22 EUR por carta, frente a 0,75 EUR de una carta ordinaria. Sobre 30 000 cartas, son más de 15 900 EUR de ahorro potencial – condicionado a la calidad de los datos.
Ejemplo numérico: lo que vale realmente una mejora de 4 puntos
Una empresa de venta por correo con 60 000 direcciones activas, cuatro envíos al año y 35 000 cartas por envío de media. Situación inicial y objetivo:
| Indicador | Situación actual | Objetivo | Diferencia |
|---|---|---|---|
| Integridad de campos obligatorios | 94 % | 98 % | +4 pts |
| Tasa de duplicados (fuzzy) | 11 % | 4 % | -7 pts |
| Validez código postal | 96 % | 99,5 % | +3,5 pts |
| Devoluciones | 9 % | 5 % | -4 pts |
| Índice de actualidad | 58 % | 80 % | +22 pts |
Reducir las devoluciones del 9 al 5 por ciento sobre 35 000 cartas a 0,33 EUR (Publicorreo con preselección postal) ahorra unos 462 EUR por envío, es decir 1 848 EUR al año sólo por menos cartas no entregadas. Reducir la tasa de duplicados del 11 al 4 por ciento elimina unos 2 450 envíos duplicados por operación, es decir otros 808 EUR. Total antes de efectos sobre la tasa de respuesta: alrededor de 2 656 EUR al año. Los efectos positivos sobre tasa de respuesta y valor de cliente a largo plazo se suman aparte.
El informe trimestral: con esta tabla basta
La calidad de los datos no mejora con análisis puntuales, sino con mediciones recurrentes. Un sencillo informe trimestral basta en la mayoría de organizaciones. Estructura propuesta:
| KPI | T1/2026 | T2/2026 | T3/2026 | T4/2026 | Objetivo | Tendencia |
|---|---|---|---|---|---|---|
| Integridad campos obligatorios | 94,1 % | 95,8 % | 96,2 % | 96,9 % | 98 % | ↑ |
| Tasa de duplicados (fuzzy) | 11,2 % | 9,4 % | 7,1 % | 5,3 % | 4 % | ↓ |
| Validez código postal | 96,3 % | 96,9 % | 98,1 % | 98,4 % | 99,5 % | ↑ |
| Devoluciones mailing | 9,1 % | 8,4 % | 7,2 % | 6,5 % | 5 % | ↓ |
| Índice de actualidad (< 24 m.) | 58 % | 62 % | 68 % | 71 % | 80 % | ↑ |
| Coherencia razón social | 88 % | 91 % | 92 % | 93 % | 95 % | ↑ |
Tres reglas para este informe:
- Misma lógica de cálculo en todos los trimestres. Cambiar el método hace ilegible la tendencia. Documente la fórmula y manténgala al menos cuatro trimestres.
- Seis a ocho KPI como máximo. Más no los lee nadie. Una tabla con doce indicadores termina en la papelera.
- Un responsable por KPI. ¿Quién hace mover la cifra? ¿A quién se le pide cuentas si se incumple el objetivo? Sin propietario, nada cambia.
Puesta en práctica con ListenFix
ListenFix es una herramienta para la limpieza y evaluación de ficheros de direcciones que calcula los KPI descritos en un único paso. El software analiza una lista importada, detecta duplicados con cinco algoritmos fuzzy configurables, contrasta los campos contra los callejeros oficiales de 29 países (entre ellos España) y produce tras cada pasada un informe con tasas de integridad, duplicados y validez.
El tratamiento se ejecuta localmente en el ordenador del usuario: los datos de direcciones no salen del puesto de trabajo. Es particularmente importante cuando la medición de KPI forma parte de una auditoría RGPD y las herramientas cloud externas plantean problemas jurídicos. Los resultados permiten construir un informe trimestral que muestra la evolución a lo largo de varios análisis.
De un concepto abstracto a una medida concreta
La calidad de los datos no es una intuición ni un porcentaje único. Es un conjunto de indicadores – integridad, unicidad, validez, actualidad, coherencia, devoluciones – cada uno con su cálculo, su valor objetivo y su responsable. Medir estos valores una vez al trimestre y registrarlos en una tabla sencilla deja, al cabo de un año, no sólo una base de datos mejor, sino un argumento sólido para cualquier futura iniciativa de calidad.
Tres pasos para empezar:
- Elija seis KPI. Como mínimo integridad, tasa de duplicados, validez, devoluciones, actualidad y un indicador de coherencia.
- Defina la lógica de cálculo. Documéntela sin pretensión jurídica, pero de manera que otra persona pueda reproducirla.
- Inicie la primera medición ahora. No "cuando llegue la nueva herramienta". Un análisis Excel con CONTAR.SI basta para el primer trimestre.
Quien empieza a medir sabe, al final del año, dónde está. Quien lo evita volverá a tirar a la basura el 9 por ciento de su próximo envío de primavera – y se sorprenderá.
Descargar ListenFix gratis en listenfix.com.
Limpia tus direcciones — pruébalo ahora
ListenFix detecta significativamente más duplicados que Excel gracias al fuzzy matching. 100% sin conexión, compatible con RGPD.
Probar gratis