Se ha escrito mucho sobre la ley de los grandes números (zbch) (por ejemplo, en inglés, aquí y aquí , también [1]). En este texto intentaré hablar sobre lo que no es la ley de los grandes números, sobre la percepción errónea de esta ley y los posibles errores ocultos en las formulaciones matemáticas.
Comencemos con lo que es la ley de los grandes números. De manera informal, este es un teorema matemático de que "la probabilidad de desviaciones de la media muestral de la expectativa matemática es pequeña" y que "esta probabilidad tiende a cero a medida que la muestra crece". Bastante informalel teorema establece que con podemos estar razonablemente seguros de que la media de nuestra muestra está lo suficientemente cerca de la media "real" y, por tanto, la describe bien. Por supuesto, se asume la presencia del "bagaje" estadístico tradicional: nuestras observaciones de la muestra deben describir el mismo fenómeno, deben ser independientes y la idea de que existe una distribución "real" con una media "real" no debe causarnos dudas significativas.
Cuando formulamos la ley, decimos "media muestral", y todo lo que pueda escribirse matemáticamente como promedio cae bajo la ley. Por ejemplo, la proporción de eventos en la masa total se puede registrar como un promedio; solo necesitamos registrar la presencia de un evento como "1" y la ausencia como "0". Como resultado, el promedio será igual a la frecuencia y la frecuencia debe estar cerca del promedio teórico. Es por eso que esperamos que el porcentaje de caras esté cerca de la mitad cuando se lanza una moneda perfecta.
Considere ahora las trampas y los conceptos erróneos sobre esta ley.
Primero, el ZBCH no siempre es correcto. Este es solo un teorema matemático con "entradas": suposiciones. Si las suposiciones son incorrectas, entonces no es necesario implementar la ley. Por ejemplo, esto es así si las observaciones son dependientes, o si no hay certeza de que exista la media "real" y claro, o si el fenómeno en estudio cambia con el tiempo y no podemos decir que observamos la misma cantidad. En verdad, hasta cierto punto, el ZBCH también es cierto en estos casos, por ejemplo, para observaciones débilmente correlacionadas o incluso cuando el valor observado cambia con el tiempo. Sin embargo, para aplicar correctamente esto a la realidad inmediata, se necesita un matemático especialista bien capacitado.
En segundo lugar, parece ser cierto que la ZBR afirma que "la media de la muestra se acerca a la media verdadera". Sin embargo, tal afirmación queda incompleta: es necesario agregar “con un alto grado de probabilidad; y esta probabilidad es siempre menor al 100% ".
En tercer lugar, me gustaría formular la ZBP como “la media muestral converge con la media real con un crecimiento muestral ilimitado”. Sin embargo, esto no es cierto porque la media muestral no converge en absoluto, ya que es aleatoria y lo sigue siendo para cualquier tamaño de muestra. Por ejemplo, incluso si lanza una moneda simétrica un millón de veces, existe la posibilidad de que la proporción de caras esté lejos de la mitad o incluso de cero. En cierto sentido, siempre existe la posibilidad de obtener algo fuera de lo común. Sin embargo, debemos admitir que nuestra intuición todavía nos dice que la ZBP debería describir algún tipo de similitud, y este es realmente el caso. Sólo que no es la media la que "converge", sino la "probabilidad de desviación de la media muestral de su valor real" y converge a cero. Dado que esta idea es intuitivamente muy conveniente ("las posibilidades de ver algo inusual tienden a cero"),Los matemáticos han inventado para esto un tipo especial de convergencia: "convergencia en probabilidad".
En cuarto lugar, la ZBH no dice nada acerca de cuándo la media muestral puede considerarse lo suficientemente cercana a la teórica. La ley de los grandes números solo postula la existencia de un determinado fenómeno; no dice nada sobre cuándo se puede utilizar. Resulta que la ley de los grandes números no responde a la pregunta clave desde el punto de vista de la práctica: "¿Puedo usar ZBP para mi muestra de tamaño n?" Otros teoremas proporcionan respuestas a estas preguntas, por ejemplo, el teorema del límite central. Da una idea de hasta qué punto la media muestral puede desviarse de su valor real.
En conclusión, cabe señalar el papel central de ZBP en la estadística y la teoría de la probabilidad. La historia de esta ley comenzó cuando los científicos notaron que las frecuencias de algunos fenómenos recurrentes se estabilizan y dejan de cambiar significativamente, sujetas a repetidas repeticiones de experiencias u observaciones. Sorprendentemente, esta "estabilización de frecuencia" se observó para fenómenos completamente no relacionados, desde tiradas de dados hasta rendimientos agrícolas, lo que indica la posible existencia de una "ley de la naturaleza". Curiosamente, esta ley de la naturaleza resultó ser parte de las matemáticas, y no de la física, la química o la biología, como suele ser el caso de las leyes de la naturaleza.
[1] Ilustrando la ley de los números grandes (e intervalos de confianza) Jeffrey D Blume & Richard M Royall