{"id":1100,"date":"2019-06-25T11:23:44","date_gmt":"2019-06-25T10:23:44","guid":{"rendered":"http:\/\/lssq-consulting.com\/?p=1100"},"modified":"2020-04-25T18:59:28","modified_gmt":"2020-04-25T17:59:28","slug":"leptocurtofobicos","status":"publish","type":"post","link":"https:\/\/lssq-consulting.com\/en\/leptocurtofobicos\/","title":{"rendered":"Leptocurtof\u00f3bicos"},"content":{"rendered":"<p><em>Los leptocurtof\u00f3bicos sienten un deseo insaciable de transformar cualquier dato hasta\u00a0que se asemeje lo m\u00e1ximo posible a una distribuci\u00f3n normal. En los tiempos (no tan remotos) en que este tipo de transformaciones no lineales no eran sencillas de realizar, la fobia se manten\u00eda controlada. Pero con el advenimiento de paquetes inform\u00e1ticos\u00a0 capaces de realizar todo tipo de transformaciones con solo apretar un bot\u00f3n, la leptocurtofobia se ha extendido.<\/em><\/p>\n<pre>Leptocurtosis significaba, originalmente, \"<em>mont\u00edculo delgado<\/em>\" y se refer\u00eda a los modelos de probabilidad que tienen un mont\u00edculo central m\u00e1s estrecho que el de una distribuci\u00f3n normal. En la pr\u00e1ctica, debido a las matem\u00e1ticas, la leptocurtosis se refiere a todos aquellos modelos de probabilidad cuyas colas son m\u00e1s pesadas que la distribuci\u00f3n normal. La mayor\u00eda de las distribuciones leptoc\u00farticas est\u00e1n sesgadas..<\/pre>\n<p>Si usted pregunta de manera rutinaria si los datos est\u00e1n distribuidos normalmente y los transforma para que parezcan menos leptoc\u00farticos y m\u00e1s &#8220;en forma de mont\u00edculo&#8221;, perd\u00f3neme que le siga, pero usted sufre de leptocurtofobia.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-1110\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen10-1024x472.jpg\" alt=\"\" width=\"1024\" height=\"472\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen10-1024x472.jpg 1024w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen10-300x138.jpg 300w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen10-768x354.jpg 768w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen10.jpg 1274w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p>Los or\u00edgenes de la leptocurtofobia se remontan a la d\u00e9cada de los ochenta, cuando comenz\u00f3 a extenderse la ense\u00f1anza del control estad\u00edstico de procesos (SPC). En los a\u00f1os previos, en EEUU solo dos universidades ense\u00f1aban SPC y solo unos pocos formadores dispon\u00edan de alguna experiencia real con SPC. Esto dio como resultado que muchos formadores de SPC de la d\u00e9cada de los 80 fueran, forzosamente, ne\u00f3fitos. Como consecuencia de ello, se extendieron un gran n\u00famero de ense\u00f1anzas que solo pueden clasificarse como supersticiones. Una de ellas es que los datos han de estar distribuidos normalmente antes de poder confeccionar un gr\u00e1fico de control.<\/p>\n<p>Cuando W. Shewart cre\u00f3 el gr\u00e1fico de comportamiento del proceso, buscaba una manera de separar la variaci\u00f3n rutinaria (causas comunes) de la variaci\u00f3n excepcional (causas asignables). Como la variaci\u00f3n excepcional domina, por definici\u00f3n, a la variaci\u00f3n rutinaria, Shewhart dedujo que la forma m\u00e1s f\u00e1cil de diferenciarlas era filtrar cuanta m\u00e1s variaci\u00f3n rutinaria mejor. Muy pronto descubri\u00f3 que los l\u00edmites tres sigma cubren toda o casi toda la variaci\u00f3n rutinaria para pr\u00e1cticamente todos los tipos de datos.<\/p>\n<p>Veamos la siguiente gr\u00e1fica, que ya apareci\u00f3 en otra entrada de esta bit\u00e1cora.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1082\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen6-1.jpg\" alt=\"\" width=\"538\" height=\"705\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen6-1.jpg 538w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen6-1-229x300.jpg 229w\" sizes=\"auto, (max-width: 538px) 100vw, 538px\" \/><\/p>\n<p>Hemos representado seis modelos de probabilidad diferentes para la variaci\u00f3n rutinaria. Estos modelos van de la distribuci\u00f3n uniforme a la distribuci\u00f3n exponencial (los \u00faltimos tres modelos son leptoc\u00farticos). Cada uno de ellos se encuentra estandarizado para que todos dispongan de media cero y desviaci\u00f3n est\u00e1ndar de 1,00. La figura muestra tambi\u00e9n los l\u00edmites de tres sigma y la proporci\u00f3n del \u00e1rea debajo de cada curva que cae dentro de esos l\u00edmites de tres sigmas.<\/p>\n<p>Algunas ense\u00f1anzas que se aprenden de la anterior figura son:<\/p>\n<ol>\n<li><em>Los l\u00edmites de tres sigma filtrar\u00e1n pr\u00e1cticamente todas las variaciones rutinarias con independencia de la forma del histograma<\/em>. Los seis modelos son radicalmente distintos entre s\u00ed, pero aun con todo, los l\u00edmites de tres sigmas cubren el 98 por ciento al 100 por ciento del \u00e1rea bajo la curva.<\/li>\n<li><em>Cualquier conjunto de datos que se encuentre fuera de los l\u00edmites de tres sigma, ser\u00e1 una se\u00f1al potencial de cambio en el proceso<\/em>. Dado que ser\u00e1 extra\u00f1o que la variaci\u00f3n de rutina lleve a un evento fuera de los l\u00edmites de tres sigma, lo m\u00e1s probable ser\u00e1 que cualquier punto que caiga fuera de dichos l\u00edmites sea una se\u00f1al de un cambio de proceso.<\/li>\n<li><em>Los l\u00edmites sim\u00e9tricos de tres sigma funcionan con datos sesgados<\/em>. Cuatro de los seis modelos est\u00e1n sesgados. A medida que exploramos las figuras, vemos que no importa cu\u00e1n sesgado sea el modelo ni qu\u00e9 tan pesada son las cosas: los l\u00edmites de tres sigma se estiran esencialmente tanto como las colas. Esto significa que la longitud de la cola determinar\u00e1 la distancia de tres sigmas en cada caso y que los l\u00edmites de tres sigmas cubrir\u00e1n la mayor parte de la cola alargada, sin importar cu\u00e1n sesgados est\u00e9n los datos. &#8220;<em>Pero eso ciertamente hace que el otro l\u00edmite parezca tonto<\/em>&#8220;, responder\u00e1 usted. Y s\u00ed, es verdad, lo hace. En la mayor\u00eda de los casos, los datos sesgados se producen cuando los datos se acumulan en una barrera o condici\u00f3n de contorno. Cuando un valor de l\u00edmite cae dentro de los l\u00edmites calculados, el l\u00edmite tiene prioridad sobre el l\u00edmite calculado y el gr\u00e1fico es de un solo lado. Cuando esto sucede, el l\u00edmite restante cubre la cola larga y nos permite separar la variaci\u00f3n rutinaria de las posibles se\u00f1ales de desviaci\u00f3n del l\u00edmite. es as\u00ed como los l\u00edmites sim\u00e9tricos de tres sigma pueden funcionar bien con datos sesgados.<\/li>\n<li><em>Cualquier incertidumbre sobre d\u00f3nde dibujar las l\u00edneas de tres sigma no afectar\u00e1 en gran medida la cobertura de los l\u00edmites<\/em>. Las curvas son tan planas en el momento en que alcanzan la vecindad de los l\u00edmites de tres sigmas que cualquier error que podamos cometer al estimar los l\u00edmites tendr\u00e1, como m\u00e1ximo, un efecto m\u00ednimo sobre el funcionamiento del gr\u00e1fico.<\/li>\n<\/ol>\n<p>Estos seis modelos de probabilidad resumen lo que uno puede encontrarse al examinar miles de modelos de probabilidad diferentes para distintas familias de modelos de uso com\u00fan.\u00a0<em><strong>Los l\u00edmites tres sigma funcionan por fuerza bruta<\/strong><\/em>. Son lo suficientemente generales que pueden trabajar con todos los tipos y formas de histogramas. Trabajan con datos sesgados y funcionan incluso cuando los l\u00edmites se basan en pocos datos.<\/p>\n<p>Usemos a continuaci\u00f3n el modelo de probabilidad exponencial de la figura anterior para ilustrar este comentario. Con dicho modelo hemos generado los valores mostrados en las filas de la siguiente tabla, cuyo histograma se muestra a continuaci\u00f3n. Dado que dichos valores deber\u00edan, por definici\u00f3n, mostrar solo variaci\u00f3n rutinaria, esperaremos encontrar casi todas las observaciones dentro de los l\u00edmites tres sigma. Por tanto, el gr\u00e1fico de comportamiento del proceso funcionar\u00e1 como se anuncia incluso con datos sesgados.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1101\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/wheeler2.gif\" alt=\"\" width=\"485\" height=\"161\" \/><\/p>\n<p style=\"text-align: center;\"><em>Cien observaciones de la distribuci\u00f3n exponencial estandarizada<\/em><\/p>\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1102\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/wheeler3.gif\" alt=\"\" width=\"176\" height=\"224\" \/><br \/>\n<em>Histograma de las cien observaciones exponenciales<\/em><\/p>\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1103\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/wheeler4.gif\" alt=\"\" width=\"485\" height=\"132\" \/><br \/>\n<em>Gr\u00e1fica X para las cien observaciones exponenciales<\/em><\/p>\n<p>No se necesita verificar la normalidad de los datos, ni tampoco definir una distribuci\u00f3n de referencia antes de calcular los l\u00edmites. En realidad, no hay necesidad alguna de complicarse la vida lamentablemente.<\/p>\n<h4>Transformaciones de los datos<\/h4>\n<p>&#8220;<em>Pero, oiga, \u00a1el software sugiere transformar los datos!<\/em>&#8221;<\/p>\n<p>\u00bfY qu\u00e9 quiere que le diga? Ning\u00fan dato contiene un significado aparte del de su contexto. El an\u00e1lisis comienza con el contexto, es impulsado por el contexto y termina con los resultados interpretados en el contexto de los datos originales. Este principio requiere que siempre haya un v\u00ednculo entre lo que se hace con los datos y el contexto original de los mismos. Cualquier transformaci\u00f3n de los datos corre el riesgo de romper este enlace.<\/p>\n<p>Si una transformaci\u00f3n tiene sentido tanto en t\u00e9rminos de los datos originales como de los objetivos del an\u00e1lisis, entonces la transformaci\u00f3n ser\u00e1 correcta. Este tipo de transformaciones <em>correctas<\/em> podr\u00edan ser, por ejemplo, calcular los promedios diarios o semanales en lugar de los valores por hora, o el uso de proporciones en lugar de conteos.\u00a0Solo el usuario puede determinar cu\u00e1ndo una transformaci\u00f3n tiene sentido en el contexto de los datos (el software no conoce el contexto).<\/p>\n<p>Una segunda clase de transformaciones ser\u00edan aquellas que vuelven a escalar los datos para lograr ciertas propiedades estad\u00edsticas. Y es realmente el \u00fanico tipo de transformaci\u00f3n que deber\u00eda sugerir cualquier software. El objetivo es hacer que los datos parezcan m\u00e1s &#8220;distribuidos normalmente&#8221; para tener una &#8220;estimaci\u00f3n de la dispersi\u00f3n que sea independiente de la estimaci\u00f3n de la ubicaci\u00f3n&#8221;. Por desgracia, estas transformaciones tienden a ser muy complejas y son no lineales por naturaleza, involucrando funciones exponenciales, exponenciales inversas o logar\u00edtmicas. (\u00bfUsted sabe qu\u00e9 demonios representa el logaritmo del porcentaje de env\u00edos a tiempo?).\u00a0este tipo de transformaciones no lineales distorsionar\u00e1n los datos de dos maneras: en un extremo del histograma, los valores que estaban originalmente muy separados ahora estar\u00e1n muy juntos; en el otro extremo del histograma, los valores que originalmente estaban cerca juntos ahora estar\u00e1n muy separados.<\/p>\n<p>Para ilustrar el efecto de las transformaciones para lograr propiedades estad\u00edsticas, utilizaremos los siguientes tiempos de tr\u00e1nsito de acero fundido en una colada.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1104\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/wheeler5.gif\" alt=\"\" width=\"485\" height=\"191\" \/><\/p>\n<p style=\"text-align: center;\"><em>Tiempos de tr\u00e1nsito de metal fundido (en minutos)<\/em><\/p>\n<p>Construyamos con ellos el histograma correspondiente.<\/p>\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1105\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/wheeler6.gif\" alt=\"\" width=\"485\" height=\"185\" \/><br \/>\n<em>Histograma de tiempos de tr\u00e1nsito de metal fundido<\/em><\/p>\n<p>Dada la naturaleza sesgada de los datos en el histograma, algunos programas sugerir\u00e1n el uso de una transformaci\u00f3n logar\u00edtmica. Hag\u00e1moslo. Tomemos el logaritmo natural de cada uno de estos tiempos y representemos el histograma modificado.<\/p>\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1106\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/wheeler7.gif\" alt=\"\" width=\"485\" height=\"241\" \/><br \/>\n<em>Histograma de los logaritmos de tiempos de tr\u00e1nsito<\/em><\/p>\n<p>En esta \u00faltima gr\u00e1fica, las escalas horizontales muestran los valores originales y los valores transformados. Es interesante observar que, en el histograma sin transformar, los valores a la izquierda est\u00e1n espaciados mientras que los de la derecha se amontonan juntos, y que despu\u00e9s de la transformaci\u00f3n, la distancia de 20 a 25 minutos es aproximadamente del mismo tama\u00f1o que la distancia de 140 a 180 minutos. \u00bfC\u00f3mo explicar esto al jefe?<\/p>\n<p>Por s\u00ed misma, la distorsi\u00f3n de los datos es suficiente para poner en tela de juicio la pr\u00e1ctica de transformar los datos para lograr propiedades estad\u00edsticas. Sin embargo, el impacto de estas transformaciones no lineales no se limita a los histogramas. Veamos\u00a0el gr\u00e1fico X para los datos originales no transformados.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1107\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/wheeler8.gif\" alt=\"\" width=\"485\" height=\"133\" \/><\/p>\n<p>11 de 141 tiempos de tr\u00e1nsito est\u00e1n por encima del l\u00edmite superior, lo que confirma la impresi\u00f3n dada por el histograma de que estos datos provienen de una mezcla de dos o m\u00e1s procesos.\u00a0Sin embargo, si transformamos los datos antes de colocarlos en una tabla de comportamiento del proceso, observamos lo siguiente:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-1108\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/wheeler9.gif\" alt=\"\" width=\"485\" height=\"140\" \/><\/p>\n<p>\u00a1Ya no hay puntos fuera de los l\u00edmites!\u00a0Claramente la transformaci\u00f3n logar\u00edtmica ha borrado las se\u00f1ales. \u00bfDe qu\u00e9 sirve una transformaci\u00f3n que cambia el mensaje contenido en los datos? La transformaci\u00f3n de los datos para lograr propiedades estad\u00edsticas es simplemente una forma compleja de distorsionar tanto los datos como la verdad.<\/p>\n<p>Los resultados que se muestran aqu\u00ed son t\u00edpicos de lo que sucede con las transformaciones no lineales de los datos originales. Estas transformaciones ocultan las se\u00f1ales contenidas dentro de los datos simplemente porque se basan en c\u00e1lculos que suponen que no hay se\u00f1ales dentro de los datos.<\/p>\n<p>Para una medida descriptiva de la ubicaci\u00f3n usualmente usamos el promedio, que se basa simplemente en la suma de los datos. Sin embargo, una vez que dejamos atr\u00e1s el promedio, las f\u00f3rmulas se vuelven mucho m\u00e1s complejas. Para una medida descriptiva de dispersi\u00f3n usamos com\u00fanmente la desviaci\u00f3n est\u00e1ndar global, que es una funci\u00f3n de las desviaciones cuadradas del promedio. Para las medidas descriptivas de la forma, usamos com\u00fanmente las estad\u00edsticas de sesgo y curtosis que, respectivamente, dependen de la tercera y cuarta potencias de las desviaciones de los datos del promedio. Cuando agregamos los datos de esta manera y usamos la segunda, tercera y cuarta potencias de la distancia entre cada observaci\u00f3n y el valor promedio, asumimos impl\u00edcitamente que estos siete c\u00e1lculos tienen sentido. Tanto si se trata de medidas de dispersi\u00f3n, como de medidas de sesgo, o incluso medidas de curtosis, cualquier estad\u00edstica descriptiva de alto orden que se calcule globalmente se basa impl\u00edcitamente en una suposici\u00f3n muy fuerte de que los datos son homog\u00e9neos.<\/p>\n<p>Cuando los datos no son homog\u00e9neos, no es la forma del histograma lo que est\u00e1 mal, sino que el c\u00e1lculo y el uso de las estad\u00edsticas descriptivas son err\u00f3neos. No necesitamos distorsionar el histograma para hacer que los valores transformados sean m\u00e1s homog\u00e9neos, pero s\u00ed debemos detenernos y cuestionar qu\u00e9 significa la falta de homogeneidad en el contexto de las observaciones originales.<\/p>\n<p>Entonces, \u00bfc\u00f3mo determinar cu\u00e1ndo un conjunto de datos es homog\u00e9neo? \u00a1Justo ese es el prop\u00f3sito del gr\u00e1fico de comportamiento del proceso! Transformar los datos para lograr propiedades estad\u00edsticas antes de colocarlos en una tabla de comportamiento del proceso es un ejemplo de c\u00f3mo hacerlo todo al rev\u00e9s.<\/p>\n<p>El enfoque de Shewhart, con sus l\u00edmites gen\u00e9ricos de tres sigma calculados emp\u00edricamente a partir de los datos, ni siquiera requiere la especificaci\u00f3n de un modelo de probabilidad: &#8220;<em>&#8230; no nos preocupa la forma funcional del universo<\/em> (es decir, el modelo de probabilidad), <em>sino simplemente la suposici\u00f3n de que existe un universo<\/em>&#8220;. La cursiva es del original (<em>Statistical Method from the Viewpoint of Quality Control, p\u00e1g. 54)<\/em><\/p>\n<p>Transformar los datos para lograr propiedades estad\u00edsticas es enga\u00f1arse uno a s\u00ed mismo y a quienes no saben suficiente estad\u00edstica para advertir el enga\u00f1o. Verificar la normalidad de los datos antes de colocarlos en un gr\u00e1fico de control es practicar vud\u00fa estad\u00edstico. Transformar los datos antes de usarlos es un error de colosales proporciones.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Los leptocurtof\u00f3bicos sienten un deseo insaciable de transformar cualquier dato hasta\u00a0que se asemeje lo m\u00e1ximo posible a una distribuci\u00f3n normal. En los tiempos (no tan remotos) en que este tipo de transformaciones no lineales no eran sencillas de realizar, la fobia se manten\u00eda controlada. Pero con el advenimiento de paquetes inform\u00e1ticos\u00a0 capaces de realizar todo&hellip;<\/p>\n<p class=\"more-link\"><a href=\"https:\/\/lssq-consulting.com\/en\/leptocurtofobicos\/\" class=\"themebutton2\">Read More<\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[67],"tags":[154,97,96,14],"class_list":["post-1100","post","type-post","status-publish","format-standard","hentry","category-six-sigma","tag-asimetria","tag-curtosis","tag-curvas-normales","tag-six-sigma"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts\/1100","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/comments?post=1100"}],"version-history":[{"count":0,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts\/1100\/revisions"}],"wp:attachment":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/media?parent=1100"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/categories?post=1100"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/tags?post=1100"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}