Categorías
Análisis de Datos

Si ve datos desconfíe

Hoy nos encontramos en la era de la información y algo más. Hoy se habla del Big Data, del IoT (internet of things) y otras tecnologías vinculadas con la generación y procesamiento de grandes cantidades de datos.

Los datos, una vez procesados se convierten en información que apoyan la toma de decisión. Dicha toma de decisión solo puede ser tan robusta como los datos a partir de los cuales se generó la información utilizada.

Hace muchos años leí una frase (i):

Si le muestran a usted cifras, desconfíe de ellas; si le muestran instrumentos de medición, desconfíe; y si le muestran un análisis químico desconfíe de él.”

Kaouru Ishikawa

Ishikawa establece que las cifras pueden ser falsas o equivocadas o simplemente imposibles de obtener. Asimismo, pueden existir desde los errores tipográficos hasta la manipulación intencional de datos. Ishikawa explica que la principal fuente de datos falsos o manipulados se debe a la gerencia media la cual lo hace:

  • Para quedar bien
  • Para ocultar sus errores
  • Para asegurarse de no quedar en desventaja
  • Sin saberlo e inconscientemente.

Finalmente Ishikawa aclara que todo esto se debe, en gran medida a malos hábitos por parte de la alta gerencia los cuales obligan a los mandos medios a incurrir en las prácticas ya mencionadas. Situaciones como accesos de cólera por parte de la alta dirección, la falta de comprensión de los principios estadísticos y la costumbre de echar la culpa a los demás son algunas de los comportamientos que pueden afectar la calidad de los datos.

Para detectar estos problemas es necesario siempre echar un vistazo a los datos.

“La primera regla de la estadística: Observe los datos” (ii)

A continuación una serie de recomendaciones expuestas por Jonathan G. Koomey (iii):

  • Si los datos vienen de una fuente no electrónica, teclee los datos en la computadora UD mismo, asumiendo que es una cantidad manejable de datos.
  • Verifique que los totales principales son la suma de los subtotales.
  • Verifique que la información esté actualizada.
  • Verifique que puede rastrear los cálculos de otra persona en una forma lógica.
  • Compare los números con algo más con lo que esté familiarizado.
  • Ponga atención a los números demasiado grandes o pequeños en comparación con los demás. Pueden existir errores tipográficos.
  • Tenga cuidado con los datos que no suman apropiadamente debido a redondeos más que a errores de cálculo.

En los últimos 20 años me ha tocado ver de todo, desde campos vacíos (ausencia de datos), datos escritos que no se sabe a que renglón de un formato se refieren, registros en formatos que son completamente ilegibles, inconsistencias en bases de datos, hasta fórmulas manipuladas para mostrar un resultado deseado.

Ante ello, es difícil realizar un correcto análisis que arroje información confiable, pero siguiendo las recomendaciones expuestas, se puede minimizar el efecto. A ello debemos sumar un adecuado esfuerzo de entrenamiento del personal en la captura de los datos, así como revisiones o auditorías periódicas para asegurar la confiabilidad de los datos.

¿Y tú revisas la confiabilidad de los datos que recibes? ¿Qué medidas has implementado para no ser presa de datos “poco confiables”? ¿Existen prácticas y políticas al respecto en tu empresa?

(i) Kaoru Ishikawa, ¿Qué es el Control Total de Calidad?, Ed. Norma, 1985

(ii) Juran, Joseph; Godfrey, A. Blanton; Juran’s Quality Handbook, McGraw-Hill, 5a Edición, 1999

(iii) Jonathan G. Koomey, Best Practices for Understanding Quantitative Data, B-Eye Network, February 14, 2006 (www.b-eye-network.com/view/2386)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *