{"id":1533,"date":"2020-04-24T20:18:06","date_gmt":"2020-04-24T19:18:06","guid":{"rendered":"https:\/\/lssq-consulting.com\/?p=1533"},"modified":"2020-04-26T14:24:02","modified_gmt":"2020-04-26T13:24:02","slug":"lo-normal","status":"publish","type":"post","link":"https:\/\/lssq-consulting.com\/en\/lo-normal\/","title":{"rendered":"Lo normal y lo que no es normal (en estad\u00edstica)"},"content":{"rendered":"<p>La inferencia estad\u00edstica utiliza datos de una muestra para obtener conclusiones sobre toda una poblaci\u00f3n. Es una herramienta potente. Pero no basta con utilizarla sin m\u00e1s. Conviene verificar las suposiciones en que se basa u obtendremos resultados err\u00f3neos. Si esto sucede, cuando los apliquemos a nuestro problema no se resolver\u00e1.<\/p>\n<h4><strong>PRIMERA SUPOSICI\u00d3N: LA MUESTRA ES ALEATORIA<\/strong><\/h4>\n<p>En cualquier empresa se suele trabajar con un reducido conjunto de supuestos: muestras aleatorias, independencia, normalidad, igual varianza, estabilidad, sistema de medici\u00f3n exacto y preciso.<\/p>\n<p>Una muestra es aleatoria cuando cada punto de datos en su poblaci\u00f3n tiene las mismas posibilidades de ser incluido en la muestra. Esto quiere decir que la selecci\u00f3n de cualquier individuo ocurre por casualidad y no por elecci\u00f3n . De esta manera se reducen las posibilidades de que los resultados est\u00e9n sesgados. El problema es que no existe ninguna prueba que asegure que se ha realizado un muestreo aleatorio. Para ello podemos seguir alguna recomendaci\u00f3n habitual, como elegir cada en\u00e9sima unidad o muestrear en determinados momentos espec\u00edficos del d\u00eda. Mi recomendaci\u00f3n, no obstante, es emplear una tabla de n\u00fameros aleatorios, que son muy f\u00e1ciles de obtener, y seguirla escrupulosamente a la hora de elegir las muestras.<\/p>\n<h4><strong>SEGUNDA SUPOSICI\u00d3N: LA INDEPENDENCIA ESTAD\u00cdSTICA<\/strong><\/h4>\n<p>La independencia estad\u00edstica es una suposici\u00f3n cr\u00edtica para muchas pruebas estad\u00edsticas. Por independencia estad\u00edstica queremos decir que el valor de una observaci\u00f3n no influye en el valor del resto de observaciones. Seguir buenas t\u00e9cnicas de muestreo ayuda a garantizar que las muestras son independientes. Esto es lo que NO sucede cuando, por ejemplo, las observaciones est\u00e1n muy pr\u00f3ximas en el tiempo o en el espacio, o est\u00e1n anidadas unas con otras. Creo que todos hemos sido alguna vez testigos de un muestreo incorrecto: es lo que sucede cuando el encargado de tomar muestras no quiere dedicarle ni tiempo ni esmero a la tarea y toma las quince primeras de todo un lote. Hay que dedicar tiempo y esfuerzo a recopilar y analizar datos. Esto es crucial si queremos alcanzar conclusiones correctas que nos ayuden a resolver un problema.<\/p>\n<h4><strong>TERCERA SUPOSICI\u00d3N: LOS DATOS SON NORMALES<\/strong><\/h4>\n<p>Una de las suposiciones m\u00e1s habituales consiste en asegurar que los datos se distribuyen normalmente.\u00a0En estad\u00edstica, al hablar de normal nos referimos a una distribuci\u00f3n normal, que es la famosa campana de Gauss, llamada as\u00ed porque fue este gran matem\u00e1tico quien la estudi\u00f3 y obtuvo sus importantes propiedades. Se caracteriza por ser sim\u00e9trica alrededor de la media y porque la media y la mediana coinciden. Su gran ventaja es que permite calcular probabilidades de aparici\u00f3n de datos y, de ese modo, poder inferir datos de la poblaci\u00f3n a partir de los obtenidos de la muestra. Es la base de toda la estad\u00edstica inferencial.<\/p>\n<p>Hay muchos ejemplos de no normalidad en procesos industriales. Baste citar a todos aquellos donde la variable aleatoria no puede tomar valores de -\u221e a +\u221e. Por ejemplo: el proceso de taladrado, donde el di\u00e1metro de la broca es el l\u00edmite inferior del posible taladro. Otro ejemplo: los procesos qu\u00edmicos como el galvanizado en que se van a\u00f1adiendo espesores en el recubrimiento.<\/p>\n<div id=\"attachment_1539\" style=\"width: 586px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1539\" class=\"wp-image-1539 \" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/no-normal.jpg\" alt=\"Ejemplo de proceso no normal\" width=\"576\" height=\"197\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/no-normal.jpg 748w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/no-normal-300x103.jpg 300w\" sizes=\"auto, (max-width: 576px) 100vw, 576px\" \/><p id=\"caption-attachment-1539\" class=\"wp-caption-text\">Ejemplo de proceso no normal: si la variabilidad es grande en relaci\u00f3n con el espesor medio, es de esperar una distribuci\u00f3n asim\u00e9trica<\/p><\/div>\n<p>Y si nos alejamos de la industria, hay m\u00e1s casos de datos no normales. Por ejemplo, en medicina se sabe que el consumo de alcohol no se agrupa de forma sim\u00e9trica alrededor de una media. Habr\u00e1 un n\u00famero grande de personas alrededor del cero (abstemios y bebedores muy ocasionales) y una larga cola hacia la derecha formada por personas con un consumo m\u00e1s alto. Esta cola se prolongar\u00e1 para incluir a los alcoh\u00f3licos, que desayunan aguardiente.<\/p>\n<p>Hay m\u00e9todos gr\u00e1ficos que ayudan a determinar visualmente si los datos siguen la normal o no. El <strong>histograma<\/strong> o el <strong>diagrama de cajas<\/strong> suelen ser \u00fatiles a la hora de comprobar si la distribuci\u00f3n est\u00e1 sesgada, si es demasiado plana o\u00a0 si tiene valores extremos. Otro gr\u00e1fico, a\u00fan m\u00e1s espec\u00ed\u00adfico, es el de probabilidad normal (q-q plot), en el que los valores se ajustan a una l\u00ed\u00adnea diagonal si la distribuci\u00f3n es normal.<\/p>\n<p>Pero no esperen que sea obvio. En las gr\u00e1ficas siguientes representamos los histogramas y el ajuste a la l\u00ednea normal de dos conjuntos de datos aleatorios obtenidos de una distribuci\u00f3n normal. El gr\u00e1fico superior (C2) es de 20 muestras y el de abajo (C3) de 1.000. <strong>Ambos son normales<\/strong>, pero solo el inferior lo parece. Deseng\u00e1\u00f1ese, usted normalmente no va a tomar mil muestras si para evaluar su problema solo necesita veinte.<\/p>\n<div id=\"attachment_1534\" style=\"width: 724px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1534\" class=\"wp-image-1534 \" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC2-1024x342.jpg\" alt=\"20 muestras aleatorias\" width=\"714\" height=\"239\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC2-1024x342.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC2-300x100.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC2-768x256.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC2-1536x513.jpg 1536w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC2-1140x380.jpg 1140w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC2.jpg 1986w\" sizes=\"auto, (max-width: 714px) 100vw, 714px\" \/><p id=\"caption-attachment-1534\" class=\"wp-caption-text\">20 muestras aleatorias<\/p><\/div>\n<div id=\"attachment_1535\" style=\"width: 733px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1535\" class=\"wp-image-1535 \" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC3-1024x340.jpg\" alt=\"1000 muestras aleatorias\" width=\"723\" height=\"240\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC3-1024x340.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC3-300x100.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC3-768x255.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC3-1536x510.jpg 1536w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC3-1140x380.jpg 1140w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC3.jpg 1986w\" sizes=\"auto, (max-width: 723px) 100vw, 723px\" \/><p id=\"caption-attachment-1535\" class=\"wp-caption-text\">1000 muestras aleatorias<\/p><\/div>\n<p>En el siguiente gr\u00e1fico realizamos una prueba de normalidad y representamos no solo el histograma, tambi\u00e9n los gr\u00e1ficos de cajas y los resultados de una prueba estad\u00edstica de Anderson-Darling. Esta prueba es una medida de lo lejos que caen los puntos del gr\u00e1fico de la l\u00ednea ajustada en una gr\u00e1fica de probabilidad. La estad\u00edstica es una distancia cuadrada ponderada hasta la l\u00ednea ajustada, dando m\u00e1s peso a las colas de la distribuci\u00f3n. Para un conjunto de datos y una distribuci\u00f3n espec\u00edficos, cuanto mejor se ajuste la distribuci\u00f3n a los datos, m\u00e1s peque\u00f1a ser\u00e1 esta estad\u00edstica.<\/p>\n<div id=\"attachment_1536\" style=\"width: 1034px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1536\" class=\"wp-image-1536 size-large\" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC23-1024x384.jpg\" alt=\"Resumen gr\u00e1fico C2-C3\" width=\"1024\" height=\"384\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC23-1024x384.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC23-300x112.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC23-768x288.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC23-1536x576.jpg 1536w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/NC23.jpg 1972w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><p id=\"caption-attachment-1536\" class=\"wp-caption-text\">Resumen gr\u00e1fico C2-C3<\/p><\/div>\n<p>La estad\u00edstica descriptiva, por tanto, se puede resumir en varios gr\u00e1ficos: histograma de datos con una curva normal superpuesta, distribuci\u00f3n respecto de la diagonal, el diagrama de cajas con los intervalos de confianza del 95% para la media y la mediana, y el informe de la prueba estad\u00edstica, incluyendo <a href=\"https:\/\/lssq-consulting.com\/leptocurtofobicos\/\">asimetr\u00edas y curtosis<\/a>.<\/p>\n<h4><strong>EL TEOREMA DEL L\u00cdMITE CENTRAL<\/strong><\/h4>\n<p>Todo proceso industrial est\u00e1 sometido a una serie de factores de car\u00e1cter aleatorio que hace que resulte <strong>imposible<\/strong> fabricar dos productos exactamente iguales. A esto nos referimos cuando decimos que la fabricaci\u00f3n de un producto presenta variabilidad, una variabilidad que es indeseable, Nuestro objetivo es reducirla lo m\u00e1s posible o, al menos, confinarla dentro de unos l\u00edmites.<\/p>\n<p>Hay muchos factores que producen variabilidad: las oscilaciones de las caracter\u00edsticas del material que se utiliza, las variaciones de temperatura y humedad ambiental, el comportamiento del propio operario, las fluctuaciones intr\u00ednsecas de la maquinaria que se emplea, etc. Si el proceso funciona de modo que las oscilaciones de todos estos factores son peque\u00f1as y ninguno predomina frente a los dem\u00e1s, entonces es esperable que la calidad del producto se distribuya seg\u00fan una curva normal.<\/p>\n<p>El enunciado matem\u00e1tico que demuestra esta afirmaci\u00f3n se denomina &#8220;<em>Teorema del L\u00edmite Central<\/em>&#8221; , un importante resultado de 1920 del gran matem\u00e1tico h\u00fangaro George P\u00f3lya (el mismo que dijo aquello de &#8220;<em>si no puedes con un problema es porque hay una manera m\u00e1s sencilla de resolverlo<\/em>&#8220;), y establece que <strong>si una variable aleatoria se obtiene como suma de muchas causas independientes, cada una de poca importancia respecto al conjunto, entonces su distribuci\u00f3n se aproxima de forma asint\u00f3tica a una distribuci\u00f3n normal<\/strong>.<\/p>\n<p>Al conjunto de toda esa multitud de factores y fluctuaciones las denominamos <em>causas comunes<\/em>. Cuando existe un factor predominante, la calidad no tiene por qu\u00e9 seguir una distribuci\u00f3n normal y se dice que est\u00e1 condicionada por una <em>causa especial o asignable<\/em>. Es lo que puede suceder cuando una f\u00e1brica cambia de proveedor de materias primas y contin\u00faa fabricando materiales que pueden ser muy distintos: es posible que los productos fabricados sean significativamente distintos a partir del nuevo lote.<\/p>\n<p>Un proceso se encuentra bajo control estad\u00edstico cuando <em>no hay causas asignables<\/em> presentes. Su calidad sigue una distribuci\u00f3n normal y es posible realizar predecir en qu\u00e9 intervalo del proceso se encontrar\u00e1n las caracter\u00edsticas deseadas de la pieza fabricada.<\/p>\n<h4><strong>CONFLICTO: LOS DATOS NO SON NORMALES<\/strong><\/h4>\n<p>La ausencia de normalidad obliga a reconsiderar muchas peque\u00f1as cuestiones que seguimos al implantar control estad\u00edstico o efectuar pruebas de media y varianza.<\/p>\n<ul>\n<li>La interpretaci\u00f3n de los \u00edndices de capacidad Cp, Cpk, Pp, Ppk y su intervalo de confianza han de calcularse para la distribuci\u00f3n que realmente siga el proceso.<\/li>\n<li>Si no se conoce la distribuci\u00f3n, tampoco podremos calcular los l\u00edmites de control: todo lo m\u00e1s que podremos decir que, si la media es \u03bc y la desviaci\u00f3n t\u00edpica es \u03c3, al menos la mitad de sus valores se encontrar\u00e1n en el intervalo <span class=\"mwe-math-element\"><img decoding=\"async\" class=\"mwe-math-fallback-image-inline\" src=\"https:\/\/wikimedia.org\/api\/rest_v1\/media\/math\/render\/svg\/095b4536892df57bdf2208e47a327e66fe7b3833\" alt=\"{\\displaystyle (\\mu -{\\sqrt {2}}\\sigma ,\\mu +{\\sqrt {2}}\\sigma )}\" aria-hidden=\"true\" \/><\/span>.<\/li>\n<li>Pese a ello, y gracias al <em>teorema central del l\u00edmite<\/em>, es posible que la distribuci\u00f3n del gr\u00e1fico de medias sea a pesar de todo normal. No obstante, si la distribuci\u00f3n del proceso tiene una alta asimetr\u00eda es necesario que el tama\u00f1o de la muestra sea superior a 25 o 30 para que se pueda considerar normal.<\/li>\n<li>No podremos usar las habituales pruebas t-Student o efectuar un an\u00e1lisis de varianza (ANOVA). Todos ellos precisan que la distribuci\u00f3n sea normal. Es cierto que la prueba t-Student es robusta, pero solo si el tama\u00f1o muestral es grande (n &gt; 80). En caso contrario, lo id\u00f3neo es no utilizarla.<\/li>\n<\/ul>\n<h4><strong>SOLUCI\u00d3N AL CONFLICTO<\/strong><\/h4>\n<p>En estos casos, lo m\u00e1s recomendable es proceder del siguiente modo:<\/p>\n<ul>\n<li>Puesto que la causa de no normalidad es intr\u00ednseca al proceso, se debe tomar una muestra de al menos 25 o 30 unidades, de manera que la distribuci\u00f3n de la muestra sea lo m\u00e1s pr\u00f3xima a la normal. De esta manera se puede mantener el control de las derivas en el proceso.<\/li>\n<li>Estudiar la distribuci\u00f3n (calcular media, desviaci\u00f3n t\u00edpica y coeficiente de asimetr\u00eda). En el caso de que la distribuci\u00f3n no se encuentre contenida en el intervalo de tolerancias, ya se puede anticipar la incapacidad del proceso. Si se encuentra contenida en el intervalo de tolerancias de manera muy ajustada, es posible que el resto de las causas de variaci\u00f3n presentes en la operaci\u00f3n habitual del proceso haga que parte de la producci\u00f3n est\u00e9 fuera de tolerancia.<\/li>\n<\/ul>\n<p>Para una gran mayor\u00eda de analistas, la no normalidad no es un problema porque <em>siempre<\/em> se puede transformar los datos no normales en normales, aunque ya vimos (<a href=\"https:\/\/lssq-consulting.com\/leptocurtofobicos\/\">aqu\u00ed<\/a>) que los l\u00edmites tres-sigma funcionan por fuerza bruta sin necesitar de suposiciones de normalidad. En cualquier caso, se puede realizar una transformaci\u00f3n de normalizaci\u00f3n de los datos. En biolog\u00eda se usa mucho, por ejemplo, la transformaci\u00f3n logar\u00ed\u00adtmica, en casos de contagio por pat\u00f3genos, como vemos estos d\u00edas de coronavirus.<\/p>\n<p>Por lo general, las transformaciones de Box- Cox suelen funcionar bastante bien: maximizan una <em>extra\u00f1a<\/em> funci\u00f3n &#8220;verosimilitud&#8221; definida a partir de unos datos transformados seg\u00fan la siguiente\u00a0expresi\u00f3n:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-1548\" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/00BoxCox-300x77.jpg\" alt=\"Transformaci\u00f3n Box-Cox\" width=\"300\" height=\"77\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/00BoxCox-300x77.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/00BoxCox.jpg 567w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/>,<\/p>\n<p>y la funci\u00f3n verosimilitud que ha de maximizarse para un cierto \u03bb es:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-1549\" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/01BoxCox-300x59.jpg\" alt=\"\" width=\"300\" height=\"59\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/01BoxCox-300x59.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/01BoxCox.jpg 487w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/>.<\/p>\n<p>&nbsp;<\/p>\n<p>No se preocupe si le suena a chino o canton\u00e9s. Casi todo el mundo emplea esta t\u00e9cnica sin conocer sus entresijos matem\u00e1ticos. Qu\u00e9dese con la idea de que un valor de \u03bb = 1 es equivalente a usar los datos originales. Por tanto, si el intervalo de confianza del \u03bb \u00f3ptimo incluye 1, entonces no necesita transformar nada.<\/p>\n<p>La gente de Minitab es muy proactiva y nos deja un ejemplo. Los datos son los siguientes:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1554 \" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0005BC-1024x683.jpg\" alt=\"\" width=\"656\" height=\"437\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0005BC-1024x683.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0005BC-300x200.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0005BC-768x512.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0005BC-570x380.jpg 570w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0005BC-380x254.jpg 380w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0005BC-285x190.jpg 285w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0005BC.jpg 1080w\" sizes=\"auto, (max-width: 656px) 100vw, 656px\" \/><\/p>\n<p>Debemos inspeccionar los datos para comprobar\u00a0 si siguen una distribuci\u00f3n normal porque, en caso contrario, no podemos fiarnos de los l\u00edmites y promedios obtenidos. Para ello, empleamos una prueba de Anderson-Darling, donde claramente observamos asimetr\u00eda en el histograma y c\u00f3mo el valor-p es inferior a 0,005, por lo que concluimos que los datos no son normales:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-1558 aligncenter\" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0002BC-1.jpg\" alt=\"\" width=\"614\" height=\"461\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0002BC-1.jpg 960w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0002BC-1-300x225.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0002BC-1-768x576.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0002BC-1-380x285.jpg 380w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0002BC-1-285x214.jpg 285w\" sizes=\"auto, (max-width: 614px) 100vw, 614px\" \/><\/p>\n<p>Llegados a este punto, hemos de decidir si buscamos una distribuci\u00f3n no normal apropiada o, por el contrario, transformamos los datos. En el primer caso, en este ejemplo observamos que podr\u00edamos emplear la distribuci\u00f3n Lognormal y en ning\u00fan caso la Exponencial:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1557 \" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0006BC-1024x683.jpg\" alt=\"\" width=\"671\" height=\"447\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0006BC-1024x683.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0006BC-300x200.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0006BC-768x512.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0006BC-570x380.jpg 570w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0006BC-380x254.jpg 380w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0006BC-285x190.jpg 285w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0006BC.jpg 1080w\" sizes=\"auto, (max-width: 671px) 100vw, 671px\" \/><\/p>\n<p>Podr\u00edamos efectuar un an\u00e1lisis de capacidad teniendo en cuenta esta distribuci\u00f3n. Otra opci\u00f3n es optar por la transformaci\u00f3n num\u00e9rica de normalizaci\u00f3n:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1553 \" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0004BC-1024x683.jpg\" alt=\"\" width=\"706\" height=\"471\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0004BC-1024x683.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0004BC-300x200.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0004BC-768x512.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0004BC-570x380.jpg 570w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0004BC-380x254.jpg 380w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0004BC-285x190.jpg 285w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0004BC.jpg 1080w\" sizes=\"auto, (max-width: 706px) 100vw, 706px\" \/><\/p>\n<p>En este caso, para la transformaci\u00f3n de Box-Cox encontramos en el intervalo de confianza de 95% para \u03bb (\u22122.87 a 0.66) el valor estimado \u00f3ptimo de \u22121.03. Su valor redondeado es \u22121, por lo que podr\u00edamos transformar los datos utilizando \u03bb = \u22121, que corresponde a la transformaci\u00f3n inversa (valor transformado = 1 \/ valor original).<\/p>\n<p>Los datos transformados s\u00ed siguen la distribuci\u00f3n normal:<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1560 \" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0009BC-1-1024x625.jpg\" alt=\"\" width=\"733\" height=\"448\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0009BC-1-1024x625.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0009BC-1-300x183.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0009BC-1-768x469.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0009BC-1.jpg 1080w\" sizes=\"auto, (max-width: 733px) 100vw, 733px\" \/><\/p>\n<p>Con los datos transformados confirmados como normales, podremos efectuar el an\u00e1lisis que proceda, por ejemplo un gr\u00e1fico de control I-MR:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1556 \" src=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0008BC-1024x683.jpg\" alt=\"\" width=\"755\" height=\"504\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/0008BC-1024x683.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0008BC-300x200.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0008BC-768x512.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0008BC-570x380.jpg 570w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0008BC-380x254.jpg 380w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0008BC-285x190.jpg 285w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/0008BC.jpg 1080w\" sizes=\"auto, (max-width: 755px) 100vw, 755px\" \/><\/p>\n<p>Para conocer los l\u00edmites de control, solo tenemos que deshacer la transformaci\u00f3n, que en este caso coincide con la inversa. Desechamos los datos del I-MR original y nos quedamos con una media de 489,23 y los l\u00edmites de control (339,2 &#8211; 877,2), y de igual modo con MR.<\/p>\n<h4><strong>OTRA SOLUCI\u00d3N AL CONFLICTO<\/strong><\/h4>\n<p>Otra posibilidad es emplear pruebas <strong>no param\u00e9tricas<\/strong>, que no precisan de ninguna asunci\u00f3n sobre la distribuci\u00f3n de la variable. Entre ellas destacan la comparaci\u00f3n de dos medias de datos no pareados mediante el test de la suma de rangos de Wilcoxon. En caso de comparaciones entre varias medias, el test de Kruskal-Wallis es el equivalente no param\u00e9trico al de ANOVA. El equivalente no param\u00e9trico de coeficiente de correlaci\u00f3n de Pearson es el coeficiente de correlaci\u00f3n de Spearman.<\/p>\n<p>Todas estas pruebas son m\u00e1s exigentes que sus equivalentes param\u00e9tricos. Pero de todo ello hablaremos, mejor, en otra ocasi\u00f3n. De momento ya tenemos bastante.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La inferencia estad\u00edstica utiliza datos de una muestra para obtener conclusiones sobre toda una poblaci\u00f3n. Es una herramienta potente. Pero no basta con utilizarla sin m\u00e1s. Conviene verificar las suposiciones en que se basa u obtendremos resultados err\u00f3neos. Si esto sucede, cuando los apliquemos a nuestro problema no se resolver\u00e1. PRIMERA SUPOSICI\u00d3N: LA MUESTRA ES&hellip;<\/p>\n<p class=\"more-link\"><a href=\"https:\/\/lssq-consulting.com\/en\/lo-normal\/\" class=\"themebutton2\">Read More<\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[67],"tags":[153,152,154,97,151,14],"class_list":["post-1533","post","type-post","status-publish","format-standard","hentry","category-six-sigma","tag-analisis-no-parametricos","tag-analisis-parametricos","tag-asimetria","tag-curtosis","tag-distribucion-normal","tag-six-sigma"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts\/1533","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/comments?post=1533"}],"version-history":[{"count":0,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts\/1533\/revisions"}],"wp:attachment":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/media?parent=1533"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/categories?post=1533"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/tags?post=1533"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}