Muchos, probablemente, ya han visto la película "Caballeros de la Justicia", donde los científicos de datos, basados en un conjunto de hechos sobre el ataque terrorista, casi resolvieron el crimen, pero cometieron un error, cuya probabilidad era críticamente pequeña. Analicemos algunos aspectos del sesgo de datos que están plagados de decisiones peligrosas.
Razones de sesgo de datos
— , , , - (, , - ).
, - : , , , . , , , , (, , ), , .
. , - — , , - -, . , - , , - . , , , .
, , . , , , : - , .
, -, - .
: , , , : , … - . . :
, , , ;
;
, , ;
, , ..
, . , . , , , , , (, - «300» «400-700»), , , , , .
, , — - .
- — , .
, . , , , , , , , - , -5 . , - , , , , «», , .
, . , , — , .
,
? , .
, — . , . , «» : , ( - !) . : , . , , , . , , , , , - — , - . — , , .
, , . , - , - — , . : ; , ; , , , , , . «-» (, ), , .
, . :)
, " "