Debate

La Calidad de Datos es fundamental para aprovechar al máximo su base de datos de clientes, evitar comunicaciones duplicadas y obtener un conocimiento único de sus clientes.

Especialistas en calidad de datos

Sigma Data Services es una empresa especializada en el diseño, desarrollo e implantación de soluciones avanzadas de tratamiento de datos y documentos para el sector del marketing. Hemos desarrollado potentes herramientas de depuración, tratamiento y normalización de bases de datos, que son la base de nuestros servicios de Calidad de Datos.

Con más de 20 años de experiencia en el sector, disponemos de las más modernas y eficaces herramientas de validación, corrección, normalización de direcciones postales y deduplicación de clientes, prospectos, empleados y proveedores, siempre elevando al máximo las expectativas del cliente.

diploma1-512_

Auditoría de datos

La Auditoría de Datos permite realizar un análisis profundo de su base de datos para conocer la verdadera situación de los datos y las oportunidades de mejorarlos.

El Informe de Auditoría de Datos analiza detalladamente cada campo y su contenido, y realiza validaciones para identificar:

Si el dato existe:

  • Si es correcto o erróneo
  • Si está completo o incompleto
  • Si hay varios datos en un campo preparado para un solo dato
  • Si está bien o mal formateado
  • Si hay datos y bloques de datos duplicados

Si el dato está ausente:

  • Si es recuperable o no

El Informe de Auditoría de Calidad de Datos recoge completos conteos y porcentajes globales y de cada campo, con el fin de conocer de manera exahustiva el estado de la calidad de los datos y tomar las decisiones oportunas sobre los procesos de calidad a realizar.

engineering-512_

Validación, corrección, normalización automática de direcciones postales

La Normalización de Bases de Datos consiste en corregir y transformar cada dato según los estándares que correspondan: conversión de nombres y apellidos a mayúsculas y eliminación de caracteres extraños, normalización de las direcciones postales según Correos e INE, conversión de direcciones de e-mail a minúsculas y sin acentos, etc.

La depuración de datos y normalización de direcciones postales son procesos muy complejos ya que en muchos casos faltan demasiados datos de la dirección postal para poder determinar con precisión la dirección correcta. Aquí es donde nuestras herramientas de última generación marcan la diferencia, llegando hasta el 95% de precisión en todos los datos que son corregibles por un ser humano.

El proceso de depuración de datos se realiza de forma automática y trata los siguientes campos, corrigiendo y normalizando allí donde es posible:

Datos de la persona física o jurídica:

  • Nombre y dos apellidos / Nombre de la empresa u organización
  • Sexo

Dirección postal:

  • Tipo de vía
  • Denominación de la vía
  • Nº / Km
  • Datos adicionales de dirección: escalera, piso, puerta, urbanización, etc.
  • Código postal
  • Localidad
  • Municipio
  • Provincia

Otros datos personales:

  • Nº de cuenta bancaria
  • Nº de tarjeta de crédito
  • Nº de Seguridad Social
  • Nº de teléfono fijo
  • Nº de teléfono móvil
  • Nº de DNI, Pasaporte, CIF, NIF, Tarjeta de Residente

El resultado del servicio de depuración de datos es el fichero extendido, es decir añadiendo al original los campos por duplicado, con el dato corregido y normalizado resultante del proceso.

add_database-512Enriquecimiento automático de datos

El proceso de Enriquecimiento Automático de Datos consiste en añadir nueva información a registros de personas físicas o jurídicas a través de la dirección postal. Para realizar este proceso es necesario que los datos originales se encuentren depurados y las direcciones postales se encuentren perfectamente normalizadas, de modo que la tasa de enriquecimiento sea suficientemente alta y aporte verdadera calidad a sus datos.

Todos los datos añadidos provienen de fuentes accesibles al público, por lo que son 100% legales. Esto es algo que Ud. siempre debe exigir a sus proveedores tratamiento de datos.

¿Qué datos enriquecemos a su base de datos?:
  • Asignación de sexo o empresa
  • Coordenada geográfica
  • Información INE
  • Datos catastrales
  • Información sociodemográfica de fuentes accesibles al público

El resultado de este servicio es el fichero original extendido, es decir añadiendo los campos por duplicado, con el dato corregido y normalizado resultante del proceso.

parallel_tasks-512_Deduplicación automática de personas

La Deduplicación de Personas consiste en identificar todos los registros iguales y similares, y proponer uno como instancia única a conservar en base de datos. Se eliminan los registros redundantes y se consigue reunir toda la información de una persona en un único registro, en línea con la filosofía del Customer Data Integration o CRM-360º.

La deduplicación de registros es un proceso complejo y delicado, ya que su resultado final consiste en conservar un registro único de cada persona, eliminando el resto de registros, con el consiguiente riesgo de eliminar información útil. Aquí es donde nuestras herramientas de última generación marcan la diferencia, llegando hasta el 100% de precisión al los más modernos y avanzados algoritmos de comparación.

El resultado de este proceso es el fichero original extendido, donde se añade un nuevo campo que identifica de cada grupo de duplicados el registro propuesto como principal, los registros propuestos para su eliminación y el Índice de Similitud entre estos y el principal. Para poder realizar este proceso con óptimas tasas de acierto, es necesario que los datos de partida  estén depurados y las direcicones postales normalizadas.

02-512Cualificación de bases de datos

La cualificación de bases de datos es un proceso manual, normalmente realizado a través de un equipo especializado en un centro de llamadas, a través del cual, el operador contacta telefónicamente con la persona individual o compañía, y verifica la existencia de de la entidad, confirma los datos existentes sobre el mismo y completa los datos faltantes.

Este tipo de servicios son ideales para completar y refrescar bases de datos de tamaño mediano y pequeño pero de alto valor comercial o administrativo. También se realiza este tipo de cualificación sobre bases de datos en las que es necesario obtener el consentimiento expreso de cara a la LOPD.

El resultado de este proceso es el fichero original extendido, donde se añade la información faltante e información de control como la fecha y hora de llamada, etc.

Descargas relacionadas

Enlaces externos relacionados

Consulte aquí el artículo de Microsoft sobre calidad de datos.