¿Por qué la calidad de los datos es fundamental para la transformación digital?

¿Por qué la calidad de los datos es fundamental para la transformación digital?

Los datos son el poder, pero solo si se recopilan, procesan y gestionan correctamente ¡Elimine y remedie la duplicación de datos! 

Según los informes, el 85% de las empresas no aprovechan eficazmente sus datos masivos para impulsar sus iniciativas de transformación digital. Si bien las causas del fracaso son diversas, desde problemas de procesos hasta problemas de personal, hay un desafío subyacente de calidad de datos que a menudo es la causa raíz de una transformación digital o un fracaso de big data. Una encuesta de Experian descubrió que el 68% de las empresas experimentan el impacto de la mala calidad de los datos en sus iniciativas de transformación y datos.

Con demasiada frecuencia, los problemas clave de calidad de datos se pasan por alto hasta que se convierten en un grave cuello de botella que provoca el fracaso de una iniciativa. Es sólo en este momento cuando las empresas se dan cuenta de que han estado construyendo los cimientos de sus datos sobre la arena. En este artículo se destacarán algunos de los principales problemas a los que se enfrentan las empresas y cómo rectificarlos.

El qué y el porqué de la calidad de los datos:

En pocas palabras, la calidad de los datos se refiere a la «salud» de sus datos y a si son aptos para su uso previsto. Esto significa que sus datos deben estar:

  • Limpios y libres de errores, como erratas, abreviaturas y errores de puntuación.
  • Válidos y completos en todos los campos críticos, como números de teléfono y direcciones de correo electrónico.
  • Únicos y libres de redundancias o duplicaciones
  • Precisos y fiables para la información, los informes y los cálculos estadísticos.
  • Fiables, actualizados y accesibles siempre que sea necesario.

Para la mayoría de las organizaciones, el problema de los datos solo sale a la luz cuando se detiene una iniciativa de migración o transformación digital porque los datos no están preparados o no son lo suficientemente buenos.

Tipo de errores de datos:

No hay texto alternativo para esta imagen

A menudo, en el caso de las fusiones, las empresas son las que más luchan contra las consecuencias de unos datos deficientes. Cuando el sistema de gestión de las relaciones con los clientes (CRM) de una empresa se estropea, afecta a todo el proceso de migración: donde se supone que el tiempo y el esfuerzo se emplean en comprender e implementar el nuevo sistema, ¡se gastan en ordenar los datos!

¿En qué consisten exactamente los datos deficientes? Pues bien, si sus datos presentan:

  • Errores humanos, como faltas de ortografía, errores tipográficos, problemas de mayúsculas y minúsculas, falta de coherencia en las convenciones de nomenclatura en todo el conjunto de datos.
  • Formato de datos incoherente en todo el conjunto de datos, como números de teléfono con y sin código de país o números con puntuación.
  • Datos de direcciones no válidos o incompletos, con falta de nombres de calles o códigos postales
  • Nombres, direcciones o números de teléfono falsos

entonces se considera que son datos defectuosos, estas cuestiones se consideran superficiales y son inevitables y universales: mientras haya seres humanos formulando e introduciendo los datos, se producirán errores.

Sin embargo, la mala calidad de los datos va más allá de los problemas superficiales. Si los datos están aislados, son de difícil acceso y están duplicados, tenemos serios problemas. De hecho, la duplicación de datos es un reto clave que la mayoría de las organizaciones encuentran difícil de abordar.

La duplicación de datos y la mala gestión de los mismos como reto principal

Por término medio, las empresas tienen unas 400 fuentes de datos diferentes. Las empresas están literalmente ahogadas en datos, especialmente en datos duplicados. Existen múltiples formas de crear datos duplicados, de las cuales algunas de las más comunes son:

Un usuario que introduce sus datos varias veces a través de diferentes canales: Alguien puede registrarse utilizando varios correos electrónicos, lo que hace que se infle el número de usuarios. Una empresa puede pensar que tiene 10 nuevas inscripciones cuando en realidad sólo tiene tres. Un usuario puede tener varios nombres y apodos. Por ejemplo, J.C. Sánchez puede ser también Juan Sánchez o Juan Camilo Sánchez. El Sr. Sánchez puede introducir su nombre como J.C. Sánchez en un formulario web, pero cuando se convierte en un cliente de pago y se requiere información de facturación, su nombre puede quedar registrado en el CRM de la empresa de forma completa.

En este ejemplo concreto, el registro de J.C. Sánchez se ha duplicado en dos fuentes de datos diferentes que también utilizan dos departamentos distintos.

Fallos técnicos o procesos en las bases de datos y fuentes de datos que pueden dar lugar a la duplicación de datos.

Duplicaciones parciales creadas por errores humanos: cuando un representante de ventas o un representante de atención al cliente introducen la información manualmente, por ejemplo.

Esto provoca un desajuste aunque los registros contengan el mismo nombre o número de teléfono. Un error ortográfico, la dificultad para registrar nombres no latinos y otros casos similares pueden crear duplicados. Los duplicados parciales son los más difíciles de superar, especialmente porque no se detectan durante un proceso normal de depuración.

La duplicación de datos se produce principalmente por la falta de gobernanza de los datos y la mala gestión de los mismos. A medida que las organizaciones crecen, se centran simplemente en recopilar datos. Más clientes potenciales, más compradores, más ventas. Se utilizan métricas de vanidad para medir el éxito.

Si las empresas ordenarán realmente sus datos, verían una diferencia drástica entre lo que creen que tienen y lo que realmente tienen.

¿En qué consisten exactamente los datos deficientes? Pues bien, si sus datos presentan:

  • Errores humanos, como faltas de ortografía, errores tipográficos, problemas de mayúsculas y minúsculas, falta de coherencia en las convenciones de nomenclatura en todo el conjunto de datos.
  • Formato de datos incoherente en todo el conjunto de datos, como números de teléfono con y sin código de país o números con puntuación.
  • Datos de direcciones no válidos o incompletos, con falta de nombres de calles o códigos postales
  • Nombres, direcciones o números de teléfono falsos

entonces se considera que son datos defectuosos, estas cuestiones se consideran superficiales y son inevitables y universales; Mientras haya seres humanos formulando e introduciendo los datos, se producirán errores.

Sin embargo, la mala calidad de los datos va más allá de los problemas superficiales. Si los datos están aislados, son de difícil acceso y están duplicados, tenemos serios problemas. De hecho, la duplicación de datos es un reto clave que la mayoría de las organizaciones encuentran difícil de abordar.

Inicia sesión para ver o añadir un comentario.

Más artículos de Datos Maestros™ Calidad & Gestión de Datos

Otros usuarios han visto

Ver temas