La ecuación más triste en Data Science

imagen



¡Abastécete de pañuelos! Ahora te diré toda la verdad sobre estadísticas y ciencia de datos. Tendrás lágrimas en los ojos, te lo prometo.



CONCLUSIÓN = DATOS + SUPUESTOS. En otras palabras, las estadísticas no te dicen la verdad.



Mitos comunes



A menudo se escuchan los siguientes conceptos erróneos:



  • "Si puedo encontrar las ecuaciones correctas, puedo aprender algo que nadie sabe ahora".
  • "Si agrego matemáticas a mis datos, puedo reducir la incertidumbre".
  • "¡Las estadísticas pueden convertir los datos en verdad!"


Todo suena a cuentos de hadas, ¿no? Porque eso es lo que son.



Amarga verdad



No hay magia en el mundo que pueda ayudarte a crear algo de la nada. Olvídalo. Estadísticas sobre otro. Toma mi palabra como estadística. (Como beneficio adicional, este artículo le ahorrará un montón de tiempo persiguiendo este sueño imposible ).



Desafortunadamente, muchos charlatanes intentarán convencerlo de lo contrario. Usarán el truco estándar: "¡No sabes las ecuaciones con las que te bañé, así que admite mi ventaja y haz lo que te digo!"



No se deje engañar por las palabras de estos posers.



imagen Sobre el autor: Cassie Kozyrkov es una estadística y estadística sudafricana. Ella fundó Decision Intelligence en Google, donde es la científica principal.




No repitas el destino de Ícaro



Piense en las conclusiones estadísticas (en resumen, "estadísticas" ) como un salto de lo que sabemos (nuestros datos habituales) a lo que no sabemos (nuestro parámetro de la población).



En estadística, lo que sabes no es lo mismo que te gustaría saber.
Es posible que desee datos sobre el mañana, pero solo puede sacar conclusiones basadas en el día de ayer. (Tan molesto cuando no recordamos el futuro, ¿verdad?) Tal vez quieras saber qué piensan todos tus usuarios potenciales sobre tu producto, pero solo puedes entrevistar a cien. ¡Entonces tienes incertidumbre!



Esto no es magia, esto es especulación



¿Cómo puedes saltar de lo que sabes a lo que no sabes? Necesitas un puente para salvar este abismo. Y el nombre de este puente es especulación. Permítame recordarle la ecuación más dolorosa en la ciencia de datos: DATOS + SUPUESTOS = PREVISIÓN.



DATOS + SUPUESTOS = PRONÓSTICO.
(Si lo prefiere, puede reemplazar fácilmente la palabra "predicción" por "conclusiones" o "predicciones". Se trata de lo mismo: una declaración sobre algo que no sabe con certeza).



¿Qué es una suposición?



Si supiéramos todos los hechos (y estuviéramos seguros de que son hechos concretos), no necesitaríamos suposiciones (o estadísticas). Las suposiciones son piezas feas que usa para cerrar la brecha entre lo que sabe y lo que le gustaría saber. Estos son trucos que debe usar cuando necesita que los números converjan, pero no hay suficientes datos.



Las suposiciones son los parches feos que aplica en lugares donde no hay información.
¿Cómo lo diría sin rodeos? La suposición no es un hecho, es una tontería que se te ocurre porque no tienes suficiente información. Si a menudo menosprecia a las personas con sus intervalos súper precisos, recuerde que es demasiado imprudente decir que lo que se basa en suposiciones es cierto. Piense mejor en las estadísticas como una herramienta para tomar decisiones. Esta herramienta no es perfecta, pero aún mejor que nada (en ciertas situaciones).



La estadística es su intento de hacer lo que pueda en un mundo de incertidumbre.
Suposiciones - y en África, suposiciones. No se convierten en hechos con la onda de una varita mágica.



Hacer suposiciones es parte de tomar decisiones



Muéstrame cualquier decisión tomada sin especulación. Enumeraré fácilmente muchas suposiciones implícitas que haces en la vida real sin siquiera pensar.



Ejemplos: cuando lees un periódico, ¿asumes que todos los hechos están verificados? Cuando hizo planes para 2020, ¿asumió que no habría una pandemia global? Si analizó los datos, ¿asumió que los datos se registraron sin errores? ¿Has asumido que tu generador de números aleatorios está produciendo resultados aleatorios? (Por lo general, no son aleatorios). Cuando decide realizar una compra en Internet, ¿asume que se le cobrará la cantidad correcta? ¿Qué hay de tu última merienda? ¿Asumiste que no estaba envenenado? Cuando tomaste el medicamento, ¿sabías * acerca de sus efectos a largo plazo o ... anticipabas?



Te guste o no, las suposiciones son parte de la toma de decisiones.


Te guste o no, las suposiciones siempre son parte de la toma de decisiones. La interferencia en los datos del mundo real debe consistir en una pluralidad de supuestos registrados. Al mismo tiempo, los científicos de datos deben describir todos los ángulos que tendrán que recorrer.



Incluso si decide prescindir de las estadísticas, probablemente utilice suposiciones para decidir cómo proceder. Por su propia seguridad, debe ser consciente de en qué suposiciones se basan sus decisiones.



Cómo funciona la "magia" de las estadísticas



Existen muchas herramientas en las estadísticas que le permiten formular suposiciones y combinarlas con evidencia. Así nacen las decisiones inteligentes. (Vea mi introducción de 8 minutos a las estadísticas aquí).



Es absurdo esperar que un análisis que incluya incertidumbre y probabilidad sea una fuente de verdad con una "P" mayúscula.
Sí, así es como funciona la magia estadística. Eliges con qué supuestos vivir y luego los combinas con los datos. Sobre la base de esta unión impía, tomas decisiones inteligentes. Esas son todas las estadísticas.



imagen



Es por eso que el análisis, incluida la incertidumbre y la probabilidad, nunca puede convertirse en una fuente de verdad con una "P" mayúscula. No hay magia oscura secreta haciendo esto por ti.



¡Dos personas pueden llegar a conclusiones completamente diferentes basadas en los mismos datos! Es suficiente para ellos hacer diferentes suposiciones.
¡Por la misma razón, dos personas pueden llegar a conclusiones completamente diferentes basadas en los mismos datos! Es suficiente para ellos hacer diferentes suposiciones. Las estadísticas le brindan una herramienta que le permite tomar decisiones de manera más consciente, pero no existe una regla única para su uso. Esta es una herramienta de toma de decisiones personal.



Lo bien que haga su investigación depende de cuán buenas sean las suposiciones que haga.



¿Qué hay de la ciencia?



¿Qué sucede cuando un científico usa estadísticas para sacar conclusiones? Simplemente forma una opinión y decide compartirla con todo el mundo. Esto no está mal, los científicos tienen que sacar conclusiones de vez en cuando por voluntad, no por voluntad, este es su trabajo. Supongo que a veces estas conclusiones pueden ser atendidas.



Por voluntad no por voluntad, los científicos periódicamente tienen que sacar conclusiones basadas en estadísticas, este es su trabajo.
Me gusta escuchar los consejos de personas que tienen más información y experiencia que yo, pero nunca me permito confundir opiniones con hechos. Hay científicos que conocen bien la probabilidad y trabajan con ella. Sin embargo, también me reuní con científicos que cometieron tantos errores estadísticos que no pueden ser eliminados por el resto de mi vida. Las opiniones no pueden (y no deben) influir en las personas que no están listas para formular suposiciones por sí mismas. Estas opiniones se obtuvieron a través de una combinación de evidencia y suposiciones no verificadas. No pueden considerarse competentes.



Salir



Piense en las estadísticas como una ciencia que puede ayudarlo a tomar decisiones cuando no esté seguro de algo. Este es un marco que lo ayuda a tomar decisiones informadas con falta de información. No hay una única forma verdadera de usar las estadísticas.



No, ella no te da los hechos necesarios. Te da lo que necesitas para lidiar con la falta de hechos. El objetivo de las estadísticas es ayudarlo a hacer todo lo que esté a su alcance en un mundo de incertidumbre.



Solo necesitas hacer suposiciones.



Traducción: Diana Sheremieva



imagen



Descubra los detalles sobre cómo obtener una profesión demandada desde cero o subir de nivel en habilidades y salario tomando los cursos de SkillFactory en línea pagados:











All Articles