Niveles de madurez de los procesos de aprendizaje automático (procesos relacionados con el aprendizaje automático)

El aprendizaje automático está fuera de la zona de exageración. Y es difícil decir sin ambigüedades qué tan bueno o malo es, pero lo que está absolutamente claro: cada vez más personas se preguntan "¿dónde está el dinero?" Sobre los proyectos de ML. Y este artículo no será una excepción: se acabó la publicidad, tenemos que trabajar.





Si hablamos de construir cualquier proceso, entonces personalmente me gusta usar el término "nivel de madurez". Después de todo, si tiene una escala de calificación comprensible frente a sus ojos, siempre puede comprender dónde se encuentra, lo que le espera más adelante, puede decidir las prioridades y comenzar a ajustar lo que necesita aquí y ahora, y no saltar por encima de un par. de niveles y hacer una revolución, reinventar la rueda en el trato ... y puede que no sea útil más adelante. En general, un ejercicio útil desde todos los puntos de vista.





En teoría, puede tomar los niveles de madurez del proceso estándar descritos en CMMI, ISO / IEC 33001 o su descripción más práctica de TI de ITIL y cambiarlos a ML. Intenté varias veces hacer este ejercicio en la práctica, pero resultó ser una especie de caballo esférico en el vacío, que podía y daba una respuesta a la pregunta tal y como estaba, pero era difícil dibujar una Sendero comprensible. Por lo tanto, mirando a mi alrededor, decidí recordar y sistematizar mi difícil camino al trabajar en varios proyectos de ML, porque CMMI es bueno, pero para el trabajo real necesitas algo más específico y realista. En general, como resultado, nació una descripción de algunas de las etapas básicas de desarrollo del trabajo en proyectos de ML. Si se pueden llamar “niveles de madurez” o no es la segunda pregunta, pero las preguntas anteriores están respondidas y esto es lo más importante.





Entonces, vayamos a los detalles. Probablemente el único nivel en el que no se me ocurrió nada nuevo y lo tomé de ITIL es el nivel "0" o "ausente". Como dicen, si no hay un proceso, entonces no es de ninguna forma, ya sea sobre TI o sobre ML. Pero en serio, mis 5 niveles / pasos son los siguientes:





  • Nivel 1. "Entusiastas"





  • Nivel 2. "I + D"





  • Nivel 3. "Analízalo"





  • Nivel 4. "Especialidad"





  • Nivel 5 "Automatizarlo"





Nivel 1 "Entusiastas"

- ( ) . , ( ), , , , «Big Data» . Python ( R Matlab … ) -- - . .





— , . , .





2 «»

- , , , . , :





  • – -, .., .





  • – . - 80% , .





  • ML . — , . .





3 « »

, , , . :





  • . ( , ), . , .





  • , .. -. , . . , .





  • . , — , ?





4. «»

, ( , ..), - . , :





  • - PROD- DEV/TEST/PROD





  • , .. – , .





  • – - , - . Run the business/Change the business.





5 « »

, 4- . DataOps&MLops . DVC Feature Store . .





, :











1





2





3





4





5









.





.















.

























.





















100%









PC/ ( +GPU)





PC ( on-prem)





ML- .









PROD DEV/TEST .





.





PROD DEV/TEST .





.









1-2 (Data Scientists - DS)





3-5 :2-3 DS





1-2 DE (Data Engineers)





5-10 :





3-6 DS





2-4 DE











10+ .





«ML-ops».









25+









-





1-2





2-4





5+





10+





50+









( , ). , , . , , .





, , :





  • , ML? ?





  • ?





  • , ?





, ML - , — .





— ( ) . , ML — Python, R, Azure ML Studio, SPSS SAS, . 1- 5- . . . , ( ), , .





Pero, de hecho, este es un tema de discusión separado (u otro artículo, si hay inspiración): la elección del camino óptimo de un nivel a otro y de qué depende, cuándo y qué software se necesita, qué experiencia se necesita. y dónde está el lugar para la subcontratación y, por supuesto, pero cómo determinar el punto, cuándo detenerse.








All Articles