5 enfoques de marcado de datos para proyectos de aprendizaje automático

Cuando rediseñamos nuestro curso de aprendizaje profundo a fines del año pasado para hacerlo más visual y orientado a casos de la práctica comercial real, incluimos un nuevo módulo sobre marcado de datos en la plataforma colectiva Yandex.Toloka. 

Pero dado que el crowdsourcing no es la única forma de marcar, hemos preparado para los nuevos estudiantes del curso una traducción de este artículo del blog de Lionbridge con una descripción general de los principales enfoques del marcado de datos. Esperamos que también te resulte útil.

La calidad de un proyecto de aprendizaje automático depende directamente de cómo aborde la solución de 3 tareas principales: recopilación de datos, su preprocesamiento y marcado.

El marcado suele ser un proceso complejo y que requiere mucho tiempo. Por ejemplo, los sistemas de reconocimiento de imágenes a menudo implican dibujar cuadros delimitadores alrededor de los objetos, mientras que los sistemas de recomendación de productos y los sistemas de análisis de sentimientos pueden requerir conocimiento del contexto cultural. No olvide también que una matriz de datos puede contener decenas o más de miles de muestras que necesitan marcado.

, , . , 5 . 

:

In-house: , . : . , , , -. 

: , . ., . , , . , ; , . , , . 

: – . - , . , , . , , . 

: , , . - (GAN). GAN ( ), . - . GAN . . , , , . 

« »: . , , . , , , . , , .  

 

In-house

 

 

,

 

,

 

 

 

. : , , , . . 

-------------

Deep Learning 6.0 Newprolab 9 .

- Deep Learning 7.0 - c 30 22 2021 .




All Articles