Un gráfico de control para gobernarlos a todos

This post is also available in: English (Inglés)

Los gráficos basados en datos de conteo son gráficos de valores individuales. Independientemente de que sea un recuento o una tasa, lo que se obtiene es un valor por período de tiempo y se traza un punto cada vez que ese valor es obtenido. Por este motivo se desarrollaron cuatro gráficos de control específicos para datos basados en conteos antes de que se descubriera que existe un enfoque general para el registro de valores individuales.

Los cuatro gráficos que menciono son bien conocidos por los Green y Black Belt (y más gente): el gráfico p (p-chart), el gráfico np (np-chart), el gráfico c (c-chart) y el gráfico u (u-chart). La pregunta que todos se preguntan (o nos hemos preguntado alguna vez) es cuándo usar unos u otros.

Fue un viejo conocido de esta sección, Walter Shewhart, quien inventó el gráfico p allá por 1924. Por aquel entonces aún no se había desarrollado la técnica de usar un rango móvil para medir la dispersión de un conjunto de valores individuales. Tal idea la concibió en 1942 un olvidado estadístico, W. J. Jennett, quien la publicó en el libro «Quality control charts» de la British Standards Institution durante el año 1942, junto con aportaciones de otros autores como E. S. Pearson (el del lema fundamental de Neyman-Pearson) y Bernard P. Dudding (un gurú tan olvidado como Jennett).

Shewhart se enfrentó el problema de crear un gráfico de comportamiento de un proceso para valores individuales basados en conteos. Era obvio que se podían trazar estos datos en un registro y usar un valor promedio como la línea central para dicho registro de ejecución. El obstáculo era medir la dispersión para poder filtrar la variación de causa común o rutinaria. La desviación estándar global decididamente estaría inflada por cualquier variación excepcional, de modo que decidió usar límites teóricos basados en un modelo de probabilidad.

Los modelos de probabilidad clásicos para datos de conteo simples son la distribución Binomial y la de Poisson (que, en realidad, es un caso extrema de la anterior). Shewhart sabía que ambos modelos disponen de un parámetro de dispersión que es función de su ubicación. Esto significó que la estimación de la ubicación obtenida a partir de los datos también podía usarse para estimar la dispersión. Por lo tanto, con una estadística de ubicación se podía estimar tanto la línea central como la distancia de tres sigmas (variación).

Este doble uso de un promedio para caracterizar tanto la ubicación como la dispersión significa que los gráficos p, los gráficos np, los gráficos c y los gráficos u tienen límites basados en una relación teórica entre la media y la dispersión. Puede decirse que todos estos gráficos utilizan límites teóricos. Si los conteos pueden ser modelados razonablemente mediante una distribución Binomial o una distribución de Poisson, entonces uno de estos gráficos específicos proporcionará los límites apropiados para los datos.

A lo largo de los años, muchos libros de texto (y también muchos estándares) han olvidado que la suposición de un modelo binomial o de Poisson es requisito previo para el uso de estos cuadros especializados. Y esto es un problema porque hay datos de conteo que no se pueden caracterizar por una distribución Binomial o de Poisson. eso significa que cuando dichos datos se colocan en un gráfico p, un gráfico np, un gráfico c o un gráfico u, los límites teóricos obtenidos serán erróneos.

¿Qué podemos hacer? El problema de los límites teóricos radica en creer que conocemos la relación exacta entre la línea central y la distancia de tres sigmas. Lo cual es mucho decir. La solución pasa por obtener una estimación separada de la dispersión, y eso es justo lo que hace el gráfico de control denominado XmR: mientras el promedio caracteriza la ubicación y sirve como línea central para el gráfico X, el rango móvil promedio caracteriza la dispersión y sirve para calcular la distancia de tres sigma.

Por lo tanto, la principal diferencia entre los anteriores gráficos específicos y el gráfico XmR está en la forma en que se calcula la distancia de tres sigma. El gráfico p, el gráfico np, el gráfico c y el gráfico u tienen el mismo registro de ejecución y esencialmente las mismas líneas centrales, al igual que el gráfico X. Pero cuando se trata de calcular los límites de tres sigma, los gráficos específicos utilizan una relación teórica supuesta mientras que el gráfico XmR mide la variación presente en los datos y construye límites empíricos.

Veamos unos ejemplos.

El primero usa los datos que se muestran en la siguiente figura: son los valores de un departamento de contabilidad que realiza seguimiento de cuántos cierres mensuales se finalizan a tiempo. Los recuentos mostrados son los números mensuales de cierres a tiempo de un total de 35.

Como puede observarse, tanto los cálculos np como los X dan esencialmente los mismos límites (el valor límite superior de 36.8 no se muestra porque excede el valor máximo de 35 cierres de tiempo). Los dos enfoques son esencialmente idénticos porque estos conteos parecen estar adecuadamente modelados por una distribución binomial. Si usted, caro lector, es lo suficientemente sofisticado como para saber determinar cuándo tal cosa sucederá, no pierda cuidado: sabrá cuándo usar el np-chart y hacerlo con éxito. Por si carece del grado de sofisticación necesario para vislumbrar una distribución binomial, no se preocupe: siempre podrá usar un gráfico XmR. Como hemos visto en el ejemplo anterior, los límites empíricos de la gráfica X imitarán los límites teóricos de la gráfica np y no habrá perdido usándola sin complejos.

En nuestro siguiente ejemplo vamos a analizar datos de envíos a tiempo para una empresa. Los datos se muestran a continuación junto con el gráfico X y el gráfico p.

La gráfica X muestra un proceso con tres puntos en o por debajo del límite inferior. Los límites del gráfico p de ancho variable son cinco veces mayores que los límites encontrados usando los rangos móviles. Ningún punto queda fuera de dichos límites. Esta discrepancia entre los dos conjuntos de límites es una clara indicación de que los datos, en esta ocasión, no satisfacen las condiciones binomiales. Específicamente, la probabilidad de que un envío sea puntual no es la misma para todos los envíos en un mes determinado. Debido a que el modelo binomial es inapropiado, los límites teóricos del gráfico p son incorrectos. Sin embargo, los límites empíricos del gráfico XmR, que no dependen de la idoneidad de un modelo de probabilidad particular, son correctos.

Veamos un último ejemplo final. Son los datos que se muestran a continuación. Disponemos del porcentaje de envíos entrantes para una planta de ensamblaje de componentes electrónicos que se enviaron mediante transporte aéreo.

Dos puntos quedan fuera de los límites del gráfico p mientras que ningún punto cae fuera de los límites del gráfico X. esto es lo que sucede cuando el área de oportunidad para un conteo de artículos se vuelve excesivamente grande. El modelo binomial requiere que todos los elementos en un período de tiempo dado tengan la misma posibilidad de poseer el atributo que se está contando. Aquí este requisito no se cumple. Con miles de envíos cada mes, la probabilidad de que un envío se envíe por aire no es la misma para todos los envíos. Por lo tanto, el modelo binomial es inapropiado y los límites teóricos del gráfico p son incorrectos. Los límites del gráfico X, que aquí son el doble de anchos que los límites del gráfico p, caracterizan adecuadamente tanto la ubicación como la dispersión de estos datos y son los límites correctos a utilizar.

Por lo tanto, la dificultad de usar un gráfico p, un gráfico np, un gráfico c o un gráfico u es la de determinar si los modelos Binomial o Poisson son apropiados. Si se pasan por alto los requisitos previos para un gráfico específico, se arriesga uno a cometer un grave error. Por esta razón debe evitarse utilizar los gráficos específicos si no sabe cómo evaluar la idoneidad de los modelos de probabilidad.

En contraste con los modelos teóricos, que pueden o no ser correctos, el gráfico XmR nos proporciona límites empíricos que se basan realmente en la variación presente en los datos. Esto significa que se puede utilizar un gráfico XmR con datos basados en conteos en cualquier momento que uno desee. Dado que la gráfica p, la gráfica np, la gráfica c y la gráfica u son todos casos especiales de la gráfica para valores individuales, la gráfica XmR imitará a las gráficas especializadas cuando estas sean apropiadas y diferirá de ellas cuando estén equivocados.

Para especialistas y Black Belts: en el caso de gráficos específicos con ancho variable, el gráfico XmR imitará los límites según el área de oportunidad de tamaño promedio.

Moraleja

Si no tiene titulación en estadística o similar, o teniéndola hace mucho que se le olvidaron estas cosas y tiene dificultad para determinar si los conteos siguen la distribución Binomial o la de Poisson, emplee un gráfico XmR o verifique que ha elegido el gráfico específico correcto comparando los límites teóricos con los límites empíricos del gráfico XmR. Si los límites empíricos son aproximadamente los mismos que los límites teóricos, entonces el modelo de probabilidad funciona. Si los límites empíricos no se aproximan a los límites teóricos, entonces el modelo de probabilidad es incorrecto. Pero, teniendo un gráfico correcto, ¿para qué necesita otro más específico a no ser que desee usted pavonearse de sus conocimientos ante terceros?

Y recuerde: el enfoque empírico siempre será correcto.

LSSQ-CONSULTING

18 de septiembre de 2024 Responder

2 Comments

César Maldonado

16 de abril de 2024 Responder

Hola antes que nada reciba el mejor de los saludos.
Estoy de acuerdo con usted de que 6S es un ideal, sucede que el valor de 3.4 PPM en un millón de oportunidades, se obtiene partir de una distribución normal, imagine usted un barreno, éste al ser maquinado, tendrá un valor objetivo (especificación) y después de su maquinado, podría quedar un poquito más grande o un poquito más pequeño (USL – LSL), al describir la distribución de frecuencias del proceso de maquinado, por la naturaleza misma del tipo de proceso, será un distribución normal. El valor de 3.4 PPM se obtiene restando a 6 desviaciones estándar de cada lado de la campana 1.5 desviaciones estándar, y como un barreno sólo puede quedar ya sea grande o pequeño, sólo se considera un lado de la campana. Así se obtienen los 3.4 PMM, la desviación estándar sería la obtenida del proceso (muestreo). El 1.5 sigma es un criterio que bien pude ser válido (bien no), y refiere a que una muestra describe una población, por lo que estadísticamente se debe considerar un intervalo para las medias, los de Motorola determinaron que 1.5 sigmas estaría bien. Lo cierto es que no todos los procesos corresponden a una salida con una distribución normal, consideremos por ejemplo el tiempo de espera para ser atendido en una clínica, o el tiempo que llevó atender al paciente, esas son distribuciones de otro tipo (exponencial y Poison), por lo que no aplicaría el 3.4 PPM que corresponde a una distribución normal, es más, habrá entregas (salidas) que ni siquiera correspondan a algún tipo de distribución matemática, atributos por ejemplo (color, sabor, etc). Es muy interesante su página y su visión, gracias por compartir la historia de Motorola. Un sincero saludo.
LSSQ-CONSULTING

18 de septiembre de 2024 Responder

Muchas gracias por su interesante comentario.

En nuestra opinión, los procesos pueden aproximarse a una distribución normal, pero rara vez son verdaderamente normales. El desplazamiento 1,5 sigma fue creada por Mikel Harry basándose en mediciones de espesor de una pila de discos, y estableció que, a largo plazo, todos los procesos se desplazan una cantidad igual a 1,5 sigma, con independencia de que obtengamos 5, 500 o 50.000 mediciones. Este concepto del desplazamiento 1,5 sigma es puramente especulativo y genera división entre los profesionales de la calidad en la industria. Cuando un proceso está sujeto a control estadístico de procesos (SPC), nunca se observará tal desplazamiento (que no es pequeño, sino muy grande). E incluso si el proceso no está sujeto a control estadístico de procesos (SPC), algunos cambiarán menos de 1,5 sigma y otros cambiarán más.

Los procesos que están “fuera de control” son impredecibles. La causa especial puede ser un cojinete defectuoso, un controlador que funciona mal o cualquier otro motivo. Los puntos fuera de control advierten de que se ha de investigar de inmediato lo que sucede. Este y no otro es el propósito de los gráficos de control. Los procesos impredecibles pueden hacer cualquier cosa: no podemos estar seguros de que se está fabricando un producto de buena calidad y realmente no importa tanto dónde se coloquen los límites de especificación.

Por supuesto, una causa especial puede ser intermitente. Tal vez sólo algunos puntos de datos ocasionales puedan verse afectados por la causa especial. La media del proceso puede no verse afectada en gran medida. Sin embargo, cuando la media del proceso cambia, todos los puntos de datos se ven afectados. Se garantiza que los puntos quedarán fuera de los límites de control, lo que advierte de la presencia de una causa especial.