Etiqueta: Análisis de Datos

  • Si ve datos desconfíe

    Hoy nos encontramos en la era de la información y algo más. Hoy se habla del Big Data, del IoT (internet of things) y otras tecnologías vinculadas con la generación y procesamiento de grandes cantidades de datos.

    Los datos, una vez procesados se convierten en información que apoyan la toma de decisión. Dicha toma de decisión solo puede ser tan robusta como los datos a partir de los cuales se generó la información utilizada.

    Hace muchos años leí una frase (i):

    Si le muestran a usted cifras, desconfíe de ellas; si le muestran instrumentos de medición, desconfíe; y si le muestran un análisis químico desconfíe de él.”

    Kaouru Ishikawa

    Ishikawa establece que las cifras pueden ser falsas o equivocadas o simplemente imposibles de obtener. Asimismo, pueden existir desde los errores tipográficos hasta la manipulación intencional de datos. Ishikawa explica que la principal fuente de datos falsos o manipulados se debe a la gerencia media la cual lo hace:

    • Para quedar bien
    • Para ocultar sus errores
    • Para asegurarse de no quedar en desventaja
    • Sin saberlo e inconscientemente.

    Finalmente Ishikawa aclara que todo esto se debe, en gran medida a malos hábitos por parte de la alta gerencia los cuales obligan a los mandos medios a incurrir en las prácticas ya mencionadas. Situaciones como accesos de cólera por parte de la alta dirección, la falta de comprensión de los principios estadísticos y la costumbre de echar la culpa a los demás son algunas de los comportamientos que pueden afectar la calidad de los datos.

    Para detectar estos problemas es necesario siempre echar un vistazo a los datos.

    “La primera regla de la estadística: Observe los datos” (ii)

    A continuación una serie de recomendaciones expuestas por Jonathan G. Koomey (iii):

    • Si los datos vienen de una fuente no electrónica, teclee los datos en la computadora UD mismo, asumiendo que es una cantidad manejable de datos.
    • Verifique que los totales principales son la suma de los subtotales.
    • Verifique que la información esté actualizada.
    • Verifique que puede rastrear los cálculos de otra persona en una forma lógica.
    • Compare los números con algo más con lo que esté familiarizado.
    • Ponga atención a los números demasiado grandes o pequeños en comparación con los demás. Pueden existir errores tipográficos.
    • Tenga cuidado con los datos que no suman apropiadamente debido a redondeos más que a errores de cálculo.

    En los últimos 20 años me ha tocado ver de todo, desde campos vacíos (ausencia de datos), datos escritos que no se sabe a que renglón de un formato se refieren, registros en formatos que son completamente ilegibles, inconsistencias en bases de datos, hasta fórmulas manipuladas para mostrar un resultado deseado.

    Ante ello, es difícil realizar un correcto análisis que arroje información confiable, pero siguiendo las recomendaciones expuestas, se puede minimizar el efecto. A ello debemos sumar un adecuado esfuerzo de entrenamiento del personal en la captura de los datos, así como revisiones o auditorías periódicas para asegurar la confiabilidad de los datos.

    ¿Y tú revisas la confiabilidad de los datos que recibes? ¿Qué medidas has implementado para no ser presa de datos «poco confiables»? ¿Existen prácticas y políticas al respecto en tu empresa?

    (i) Kaoru Ishikawa, ¿Qué es el Control Total de Calidad?, Ed. Norma, 1985

    (ii) Juran, Joseph; Godfrey, A. Blanton; Juran’s Quality Handbook, McGraw-Hill, 5a Edición, 1999

    (iii) Jonathan G. Koomey, Best Practices for Understanding Quantitative Data, B-Eye Network, February 14, 2006 (www.b-eye-network.com/view/2386)

  • El mito del promedio

    El cálculo del promedio es algo que tenemos sumamente arraigado en nuestra cultura empresarial. Podemos hablar del precio promedio de los productos, o del sueldo promedio de los colaboradores, así como de las ventas promedio en un cierto mes.

    El promedio se ha vuelto algo intuitivo y lo usamos pues, al parecer, todos le entendemos. Existen, algunos detalles, sin embargo, que conviene examinar para evitar errores de interpretación.

    Supongamos que tu tienes un sueldo de $50 a la semana y esperas recibir $50 cada semana. En un mes acumularas $200 y en promedio, pues lo obvio: $200/4 = $50.

    Supongamos ahora que la primer semana recibes $40, la segunda $75, la siguiente $25 y la última $60. Seguramente esto alterará tus planes de vida, pues no estás recibiendo tus $50, sin embargo, si lo expresamos en promedio pues: $40 + $75 + $25 + $60 = $200 y $200/4 = $50. Así que en promedio recibes lo mismo.

    Este comportamiento puede ser engañoso si solo vemos el promedio. Comparar o decidir en base a promedios, sin entender el comportamiento de los datos, como en esta situación, nos diría que todo sigue igual o que todo está bien.

    Una forma de evitar esto es acompañar el cálculo de una gráfica que muestre el comportamiento de los valores individuales.

    Gráficas para ver el efecto que oculta el promedio.

    Existe otro caso muy particular de los promedios. Supongamos que tenemos ahora 10 vendedores. A continuación las ventas de cada uno de ellos:

    $500,000
    $350,000
    $100,000
    $50,000
    $50,000
    $30,000
    $25,000
    $15,000
    $10,000
    $5,000

    Si determinamos el promedio (la suma de todo entre 10) tendríamos el valor de $113,500.

    Tomar decisiones “pensado que mis vendedores” generan en promedio $113,500 pesos es engañoso, pues en realidad, la mayoría vende menos de eso. Solo 2 vendedores generan una cantidad mayor a ese valor. ¿Qué ha sucedido?

    Resulta que el promedio, como medida de tendencia central de un conjunto de datos, es sensible a los extremos. Esto es tiende a moverse hacia el lado en que el valor extremo esté muy alejado de los demás. ¿Cómo resolver esto? ¿Cómo tener un valor de tendencia central más realista?

    Para no vernos afectados por este “comportamiento” del promedio, la recomendación es utilizar la Mediana. Que es una medida de tendencia central que no se ve afectada por los extremos.

    No entraré aquí en el detalle para determinar la mediana, pero en cualquier hoja de cálculo puede sacarse el valor sin mayor problema. Para el caso de los vendedores, la mediana es: $40,000. Lo cual es mucho más representativo de la mayoría de los vendedores. Este valor permitiría tomar decisiones mucho más acertadas que el valor obtenido con el promedio.

    Y tú ¿usas el promedio? ¿Sabías de estos detalles? ¿Te ha pasado verte “engañado” por los valores promedio? ¿Cómo lo has manejado?

  • Toma de decisión basada en hechos

    Acabo de estar en un evento relacionado con calidad y hubo una breve charla tocando el tema de la Calidad 4.0 y dentro de ello se tocó el tema del análisis de datos y el Big Data.

    Se platicó que una tendencia es el aprovechamiento de las enormes cantidades de datos que las empresas almacenan el día de hoy, por el uso de la tecnología.

    Me llamó la atención el concepto del «científico de datos» como alguien especializado en procesar cantidades masivas de información para poder dar respuesta y sustento a las decisiones en las empresas.

    Y aunque hoy en día hablamos justamente de análisis masivo de datos, el concepto de tomar decisiones basadas en hechos, justamente a partir de los datos, no es nuevo.

    “No dispongo de ningún dato todavía – respondió – Es un completo error ponerse a teorizar sin disponer de toda la información, pues predispone el juicio.”

    Sherlock Holmes

    No hace mucho el tema en cuestión era el Business Intelligence o la Inteligencia de Negocios, mediante la cual se aplican conceptos de minería de datos en bases de datos preparadas especialmente para responder preguntas sobre lo que sucede en el negocio.

    Business Intelligence (Inteligencia de Negocios) ayuda a los gerentes tomar mejores decisiones más rápidamente en los niveles estratégico y operativo. Normalmente se analizan datos provenientes de muchas fuentes. El análisis conduce a ideas, muchas de ellas pequeñas, y se espera que unas cuantas grandes. Estas ideas sugieren maneras de mejorar el negocio cuando se actúa sobre ellas; estas ideas pueden ser medidas para ver si funcionan. Estas mediciones también proveen más datos para el análisis, y el ciclo comienza de nuevo.

    Vitt, Luckevich y Misner en su libro Business Intelligence 

    Sin embargo, considero que aunque la tecnología permite hoy en día el manejo de mayores cantidades de datos y cada vez más rápido, la habilidad y el conocimiento básicos del análisis de datos se ha descuidado. Generamos grandes cantidades de datos, pero ¿Cómo sacar sentido de esos datos?

    Probablemente menos del 1% de aquellos que preparan tablas y gráficas han sido entrenados en diseñarlas para una comunicación efectiva y eficiente”. 

    Stephen Few

    Existen técnicas muy complejas basada en análisis estadísticos, pero también existen conceptos básicos y fundamentales que tenemos que conocer si somos quienes recibimos los datos y debemos evaluar si ellos poseen algún grado de información útil. Es difícil ser un gerente sin conocer y dominar algunas herramientas básicas sobre el manejo de datos e información.

    Ya en los años ochenta en su emblemático libro ¿Qué es el control total de la calidad?, Kaouru Ishikawa comentaba:

    «Si un gerente no utiliza cifras y métodos estadísticos, y solo se vale de su propia experiencia, su sexto sentido y sus corazonadas, está reconociendo que su empresa no posee una alta tecnología.”

    Kaoru Ishikawa

    ¿Le has dedicado tiempo a desarrollar tus habilidades de análisis e interpretación de datos a nivel de negocios? ¿Qué técnicas usas? ¿Qué problemas padeces para acceder a los datos? ¿Cuenta tu empresa con Inteligencia de Negocios? ¿Los datos e información que recibes son confiables para la toma de decisión? ¿Cuáles son los retos en tu empresa para el análisis de información y la toma de información basada en datos y hechos?

    Hace unos años desarrollé 2 talleres uno sobre Gráficas y Tablas Efectivas para Negocios y otro sobre Análisis de Información de Negocios. Ambos enfocados a Gerentes y Ejecutivos. Estoy pensado compartir información sobre los mismos y crear un taller en línea ¿Sería de tu interés?