Cómo mejoro regularmente la precisión de mis modelos de entrenamiento del 80% al 90 +%

Anticipándonos al inicio del curso básico sobre aprendizaje automático , hemos preparado una traducción interesante para usted, y también le ofrecemos ver una lección de demostración gratuita sobre el tema: "Cómo comenzar a hacer del mundo un lugar mejor con PNL" .


Introducción

Si ha completado al menos algunos de sus propios proyectos de ciencia de datos, probablemente ya haya descubierto que la precisión del 80% no es tan mala. Pero para el mundo real, el 80% ya no es adecuado. De hecho, la mayoría de las empresas para las que he trabajado esperan una precisión mínima (o cualquier métrica que miren) de al menos el 90%.

Por lo tanto, hablaré sobre cinco cosas que puede hacer para mejorar significativamente la precisión. Le recomiendo que lea los cinco puntos, ya que hay muchos detalles que los principiantes pueden no conocer.

Al final de este artículo, debería haberse dado cuenta de que hay muchas más variables que influyen en el rendimiento de su modelo de aprendizaje automático de lo que imagina.

Dicho esto, aquí hay 5 cosas que puede hacer para mejorar sus modelos de aprendizaje automático.

1.

, , , , . , /, , .

, , , , , . 15 80 , 80 , .

, , « »?

, / :

  • : , , . , , ANOVA .

  • K- : K- , , , K- (.. ).

  • : , . , , .

2.

– . – , , . , Data Science – , . , , :

  • DateTime , , ..

  • (, 100–149, 150–199, 200–249 ..)

  • / . , «Iswomenor_child», True, , False .

3.

– , / . , , , .

, :

  • : , XGBoost, , «» . , , .

  • : – (PCA). .

4. Ensemble Learning

– . , . 

(Ensemble Learning) – , . , , - .

- , XGBoost, AdaBoost. , , :

. () . ? « , », .

, , , 0. 4 , 1. !

5.

, , , – . , , , , .

:

class sklearn.ensemble.RandomForestClassifier(n_estimators=100, *, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, bootstrap=True, oob_score=False, n_jobs=None, random_state=None, verbose=0, warm_start=False, class_weight=None, ccp_alpha=0.0, max_samples=None

, , minimpuritydecrease, , «», ! ;)

, 80% 90+%. . Data Science.


, , .

:




All Articles