{"id":1044,"date":"2019-06-14T09:59:43","date_gmt":"2019-06-14T08:59:43","guid":{"rendered":"http:\/\/lssq-consulting.com\/?p=1044"},"modified":"2020-04-24T11:56:34","modified_gmt":"2020-04-24T10:56:34","slug":"bayesianos-y-frecuentistas","status":"publish","type":"post","link":"https:\/\/lssq-consulting.com\/en\/bayesianos-y-frecuentistas\/","title":{"rendered":"Bayesianos y Frecuentistas"},"content":{"rendered":"<p>La estad\u00edstica es una forma de tomar decisiones cuando enfrente se encuentra la incertidumbre: es decir, casi todo el tiempo. Y si hablamos de incertidumbre, tenemos que pensar en t\u00e9rminos de probabilidad. De hecho, el edificio de la estad\u00edstica descansa por completo en el concepto de probabilidad, y hay dos formas de interpretar esta idea: la interpretaci\u00f3n cl\u00e1sica (o frecuentista) y la interpretaci\u00f3n bayesiana.<\/p>\n<ul>\n<li>La interpretaci\u00f3n cl\u00e1sica, mayoritaria hasta el momento, define la probabilidad en t\u00e9rminos de experimentaci\u00f3n. Si se repite un experimento un n\u00famero infinito de veces y se compruebas que en 150 de cada 1.000 ocasiones se ha producido un cierto resultado, el frecuentista concluye que la probabilidad de ese resultado es del 15%. Esta aproximaci\u00f3n se basa, por tanto, en estudiar la probabilidad &#8220;real&#8221; de las cosas, tratando de determinar hasta qu\u00e9 punto una medici\u00f3n realizada sobre un conjunto se aproxima a la probabilidad real subyacente. Por este motivo el frecuentista define la probabilidad como una expresi\u00f3n matem\u00e1tica que predice en qu\u00e9 medida es veros\u00edmil que ciertos eventos ocurran bas\u00e1ndose en el patr\u00f3n observado hasta este momento. Uno de los padres de la estad\u00edstica frecuentista moderna ya apareci\u00f3 <a href=\"http:\/\/lssq-consulting.com\/datos-y-procesos\/\">en otro apunte<\/a> de este blog: es Sir Ronald Fisher.<\/li>\n<li>Por el contrario, la interpretaci\u00f3n bayesiana se basa en el conocimiento limitado que tenemos de las cosas. Afirma que s\u00f3lo se puede asociar una probabilidad a un evento porque existe incertidumbre sobre el mismo. O lo que es igual: que no se puede conocer el conjunto de todos los hechos. El enfoque bayesiano se basa en la idea de refinar las predicciones a partir de nuevas evidencias. Un bayesiano define la probabilidad como la expresi\u00f3n matem\u00e1tica que mide el nivel de conocimiento que tenemos para realizar una predicci\u00f3n. Para un bayesiano es incorrecto decir &#8220;<em>hay un 30% de probabilidad de que suceda el evento A<\/em>&#8220;. Para un bayesiano ha de decirse &#8220;<em>bas\u00e1ndome en el conocimiento actual que tengo, dispongo de un 30% de certeza de que A va a ocurrir<\/em>&#8220;.\u00a0El reverendo Thomas Bayes descubri\u00f3 el teorema de probabilidad condicional que lleva su nombre y que forma la base de los m\u00e9todos estad\u00edsticos bayesianos.<\/li>\n<\/ul>\n<div id=\"attachment_1046\" style=\"width: 576px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1046\" class=\"size-full wp-image-1046\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen8.jpg\" alt=\"\" width=\"566\" height=\"304\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen8.jpg 566w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen8-300x161.jpg 300w\" sizes=\"auto, (max-width: 566px) 100vw, 566px\" \/><p id=\"caption-attachment-1046\" class=\"wp-caption-text\">Thomas Bayes (izq) y Ronald Fisher (der)<\/p><\/div>\n<p>Pero como en este blog hablamos de ciclos de mejora, tanto si es el PDCA de Deming como el DMAIC de Six Sigma, que son pr\u00e1cticamente el mismo en lo fundamental (una aplicaci\u00f3n del m\u00e9todo cient\u00edfico a los procesos productivos y de fabricaci\u00f3n), observemos este apasionante tema desde la perspectiva del m\u00e9todo.<\/p>\n<p>De una forma simplificada se puede resumir el m\u00e9todo cient\u00edfico en los siguientes pasos:<\/p>\n<ol>\n<li>Realizar una observaci\u00f3n o formular una pregunta<\/li>\n<li>Formar una hip\u00f3tesis<\/li>\n<li>Probar la hip\u00f3tesis a trav\u00e9s de un experimento<\/li>\n<li>Revisar la hip\u00f3tesis y, si es necesario, volver al punto anterior para mejorar la hip\u00f3tesis<\/li>\n<li>Obtener conclusiones y publicar el resultado para que otros tambi\u00e9n lo comprueben<\/li>\n<\/ol>\n<p>Un experimento bien dise\u00f1ado proporciona la mayor cantidad de informaci\u00f3n posible. Pero como los datos del mundo real contienen ruido, se emplean t\u00e9cnicas estad\u00edsticas para comparar las hip\u00f3tesis con los experimentos.<\/p>\n<pre>Nota: Tambi\u00e9n se pueden emplear estas t\u00e9cnicas para predecir. De hecho, los fabricantes y las empresas de seguros basan sus garant\u00edas y p\u00f3lizas en \u00e1rea estad\u00edstica relacionado con la predicci\u00f3n, denominada fiabilidad.<\/pre>\n<p>Si un fabricante de alimentos quiere saber cu\u00e1nta grasa contiene la mantequilla que produce, algo que debe conocer para proporcionar una etiqueta nutricional precisa, puede realizar un an\u00e1lisis comparativo con un cierto valor certificado. En este tipo de an\u00e1lisis se suele encontrar frases como la siguiente: &#8220;<em>la incertidumbre ampliada corresponde a un intervalo de cobertura del 95 por ciento<\/em>&#8220;. Pero, \u00bfqu\u00e9 demonios significa lo de &#8220;<em>intervalo de cobertura del 95 por ciento<\/em>&#8220;? \u00bfEs una media? Un frecuentista dir\u00eda que, si realizamos el mismo experimento de medici\u00f3n 100 veces y analizamos los datos producidos de una misma manera, esperamos que 95 de los 100 experimentos produzcan intervalos que incluyan el verdadero valor de la cantidad de sustancia que nos interesa conocer &#8220;. El\u00a0bayesiano, en cambio, responde que la anterior afirmaci\u00f3n es una interpretaci\u00f3n razonable, siempre y cuando el experimento de medici\u00f3n se pueda repetir de manera perfecta. Porque,\u00a0\u00bfqu\u00e9 pasa con los eventos que no son repetibles, como por ejemplo los aterrizajes de las sondas espaciales de la NASA en Marte? Solo suceden una \u00fanica vez. Los ingenieros seleccionan un lugar donde aterrizar y cuantifican la incertidumbre de que la nave se pose en dicho lugar con una cierta probabilidad. Para estos casos, una interpretaci\u00f3n de frecuencias puras no cubre la situaci\u00f3n&#8221;.<\/p>\n<p>La anterior disquisici\u00f3n t\u00e9cnica es, ciertamente, compleja. A la postre,\u00a0frecuentistas y bayesianos basan sus t\u00e9cnicas en los mismos fundamentos.\u00a0desde un punto de vista pr\u00e1ctico, son muy similares y conducen a las mismas conclusiones. Pero resultaba interesante formular el problema antes de seguir.<\/p>\n<p>En un an\u00e1lisis frecuentista la probabilidad es una funci\u00f3n de par\u00e1metros desconocidos que representan cantidades cient\u00edficas que interesan. En el caso de la mantequilla, uno de los par\u00e1metros de la probabilidad ser\u00e1 la concentraci\u00f3n de grasa de la mantequilla y otro la variabilidad de las mediciones de dicha concentraci\u00f3n de grasa debido a influencias incontrolables, como son las peque\u00f1as variaciones de temperatura en el laboratorio (recordemos que <a href=\"http:\/\/lssq-consulting.com\/datos-y-procesos\/\">en otro apunte<\/a> ya hablamos de <em>causas comunes<\/em> y <em>causas asignables<\/em>).\u00a0Interpretamos la probabilidad como la probabilidad de obtener los datos que se han observado (mediciones de la concentraci\u00f3n de grasa) dados ciertos valores espec\u00edficos de los par\u00e1metros, en este caso, la concentraci\u00f3n real de grasa y la variabilidad de la medici\u00f3n. Un frecuentista asocia a dicha probabilidad una estimaci\u00f3n y un intervalo: hay 51.6 gramos, m\u00e1s menos 1.4 gramos de grasa por cada 100 gramos de mantequilla. Estos corresponder\u00edan al valor certificado y al intervalo de cobertura.<\/p>\n<p>En un an\u00e1lisis bayesiano hay dos componentes principales:\u00a0el primero es la misma probabilidad que apareci\u00f3 en el an\u00e1lisis frecuentista. El analista de datos bayesiano interpreta la probabilidad como la probabilidad de los datos observados para valores de par\u00e1metros espec\u00edficos, al igual que el frecuentista, aunque puede interpretar la probabilidad de manera diferente.\u00a0El segundo ingrediente es la distribuci\u00f3n de probabilidad previa. En el ejemplo de la mantequilla, antes de realizar cualquier medici\u00f3n de la concentraci\u00f3n de grasa, la distribuci\u00f3n describir\u00eda la verdadera concentraci\u00f3n de grasa en la mantequilla. Esto es razonable porque los ingredientes que se encuentran en la mantequilla y sus cantidades relativas se conocen cuando se hace la mantequilla. Un bayesiano realiza afirmaciones como: &#8220;<em>La probabilidad de que la concentraci\u00f3n de grasa se encuentre entre 45 y 55 gramos por 100 gramos es del 99 por ciento<\/em>&#8220;. La probabilidad y la distribuci\u00f3n de probabilidad (previa) se combinan utilizando la regla de Bayes para producir la distribuci\u00f3n de probabilidad (posterior), lo que da la probabilidad de que el analista crea en valores de par\u00e1metros espec\u00edficos despu\u00e9s de observar los datos. Al resumir los resultados de un an\u00e1lisis bayesiano, es t\u00edpico proporcionar una mejor estimaci\u00f3n \u00fanica y una estimaci\u00f3n por intervalos, al igual que en el an\u00e1lisis frecuentista.<\/p>\n<p>\u00bfC\u00f3mo es posible que los bayesianos y los frecuentistas lleguen a las mismas conclusiones? Los frecuentistas no eligen una distribuci\u00f3n de probabilidad previa. pero resulta que, si los datos observados proporcionan informaci\u00f3n coherente con la informaci\u00f3n aportada por la distribuci\u00f3n de probabilidad previa, ambos enfoques arrojan resultados similares. Entonces, \u00bfpor qu\u00e9 los datos observados proporcionan informaci\u00f3n m\u00e1s s\u00f3lida que la distribuci\u00f3n previa? Recordemos que la distribuci\u00f3n de probabilidad previa es la probabilidad de encontrar ciertos valores de los par\u00e1metros espec\u00edficos ANTES de observar datos.<\/p>\n<p>\u00bfPor qu\u00e9, entonces, debemos tomarnos la molestia de elegir una funci\u00f3n de distribuci\u00f3n previa si esta es intrascendente? La respuesta, por supuesto, es que no siempre resulta intrascendente.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-1045\" src=\"http:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen7-668x1024.jpg\" alt=\"\" width=\"668\" height=\"1024\" srcset=\"https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen7-668x1024.jpg 668w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen7-196x300.jpg 196w, https:\/\/lssq-consulting.com\/wp-content\/uploads\/imagen7.jpg 726w\" sizes=\"auto, (max-width: 668px) 100vw, 668px\" \/><\/p>\n<p>Esto lo vemos en el anterior c\u00f3mic, cuyo autor es <a href=\"https:\/\/xkcd.com\/1132\/\">Randall Munroe<\/a>. Los datos observados son los de los detectores que responden &#8220;s\u00ed&#8221; a la pregunta de si el sol se ha convertido en una nova, lo que puede significar que la m\u00e1quina obtuvo dos seises y est\u00e1 mintiendo (con algo menos de un 3 por ciento de posibilidades) o que el sol, en efecto, ha explotado. Debido a que es poco probable que la m\u00e1quina mienta, el frecuentista concluye que el sol se ha vuelto nova. Sin embargo, el bayesiano, actuando sobre el conocimiento previo sobre la vida \u00fatil proyectada del sol y el hecho de que ambos estad\u00edsticos permanezcan en perfecto estado de salud, ha combinado probabilidades previas a la hip\u00f3tesis en competencia y decide no estar de acuerdo con el frecuentista. \u00a1Y, adem\u00e1s, est\u00e1 dispuesto a apostar por ello!\u00a0El bayesiano gana esta vez, \u00a1pero los frecuentistas volver\u00e1n!<\/p>\n<p>La caricatura de Randall es una exageraci\u00f3n divertida, por supuesto. Una prueba de hip\u00f3tesis frecuentista nunca se construye de esta manera. Sin embargo, hay muchos problemas reales para los cuales la distribuci\u00f3n de probabilidad previa puede tener un gran impacto positivo en comparaci\u00f3n con el impacto negativo que los estad\u00edsticos frecuentistas pueden temer. Pensemos en una regla y una cinta m\u00e9trica que se usan para medir la longitud de algo. La distribuci\u00f3n de probabilidad previa (ambos m\u00e9todos producen mediciones similares, se orientan a una misma cantidad en medici\u00f3n, han sido calibrados y son confiables, etc.) puede tener un importante efecto positivo.<\/p>\n<p>La aproximaci\u00f3n bayesiana hace que algunas cosas sean m\u00e1s claras. Por ejemplo, si un estudio muestra que 10 de cada 100 fumadores van a desarrollar c\u00e1ncer de pulm\u00f3n, una interpretaci\u00f3n cl\u00e1sica del dato puede llevarnos a pensar que un fumador tiene un 10% de probabilidad de enfermar. Y no es cierto. Lo que dice el estudio es que el dato (10 de cada 100 fumadores desarrollan c\u00e1ncer) puede considerarse como un buen punto de partida para hacer una predicci\u00f3n sobre las opciones de desarrollar c\u00e1ncer para un fumador, pero un bayesiano dejar\u00eda muy claro que se trata de un conocimiento incompleto y que, por tanto, no es de mucha utilidad a no ser que se disponga de m\u00e1s informaci\u00f3n para incrementar la certeza.<\/p>\n<p>Como contrapartida, el razonamiento bayesiano en ocasiones nos\u00a0lleva al absurdo. Un bayesiano cree que existe un an\u00e1lisis probabil\u00edstico para pr\u00e1cticamente cualquier cosa, alineando los factores que influyen y combinando el conocimiento previo de esos factores. Esta idea es empleada frecuentemente para asignar una probabilidad a la existencia de Dios, a que la Tierra est\u00e9 siendo sido visitada por alien\u00edgenas o a que los artistas incluyan mensajes secretos en sus pinturas.\u00a0Los frecuentistas no padecen este problema. Un frecuentista considera que las probabilidades s\u00f3lo tienen sentido en el \u00e1mbito de experimentos repetibles. Bajo este punto de visto, es absurdo asignar una probabilidad a la existencia de Dios, porque la existencia de un creador del universo no es un problema que podamos repetir y observar numerosas veces.\u00a0Los frecuentistas no creen que sea posible asignar una probabilidad a absolutamente cualquier cosa.\u00a0Entonces, \u00bfqui\u00e9n tiene raz\u00f3n?<\/p>\n<p>Como en tantos otros aspectos de la ciencia &#8211; y de la vida &#8211; no hay un \u00fanico enfoque universalmente v\u00e1lido. La visi\u00f3n frecuentista ha aportado un rigor y un sistema de trabajo a muchos \u00e1mbitos de la estad\u00edstica, empezando por el c\u00e1lculo del error muestral. La visi\u00f3n bayesiana ha mostrado ser una buena herramienta para hacer predicciones sobre sucesos complejos, tomando datos de m\u00faltiples fuentes de forma simult\u00e1nea.<\/p>\n<p>En cualquier caso, la polarizaci\u00f3n de las ideas no suele ser una buena consejera para tomar buenas decisiones. Nunca lo olvidemos.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La estad\u00edstica es una forma de tomar decisiones cuando enfrente se encuentra la incertidumbre: es decir, casi todo el tiempo. Y si hablamos de incertidumbre, tenemos que pensar en t\u00e9rminos de probabilidad. De hecho, el edificio de la estad\u00edstica descansa por completo en el concepto de probabilidad, y hay dos formas de interpretar esta idea:&hellip;<\/p>\n<p class=\"more-link\"><a href=\"https:\/\/lssq-consulting.com\/en\/bayesianos-y-frecuentistas\/\" class=\"themebutton2\">Read More<\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[67],"tags":[105,104,14],"class_list":["post-1044","post","type-post","status-publish","format-standard","hentry","category-six-sigma","tag-estadistica","tag-probabilidad","tag-six-sigma"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts\/1044","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/comments?post=1044"}],"version-history":[{"count":0,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/posts\/1044\/revisions"}],"wp:attachment":[{"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/media?parent=1044"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/categories?post=1044"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/lssq-consulting.com\/en\/wp-json\/wp\/v2\/tags?post=1044"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}