Desarrollo de ML - ¿In-house vs outsourcing?

Esta es una pregunta que es relevante para cualquier tipo de desarrollo y el aprendizaje automático (ML) no es una excepción. Pero al mismo tiempo, seguro, muchos se preguntarán: ¿por qué se necesita este artículo, en qué se diferencia tanto su ML del desarrollo estándar, según los artículos que ya se han escrito en un vagón? . 





Por un lado, la forma en que está, y hay muchos artículos para analizar y analizar. Por otro lado, hay una especificidad, y la puesta en escena del desarrollo de ML es algo diferente de la estándar y el trabajo no solo (y no tanto) va con el código, sino con los datos.





Pero vayamos todo paso a paso, repasemos las diferencias en pocas palabras y luego averiguaremos si existe un lugar para la subcontratación en el desarrollo de ML y qué es.





En lugar de una introducción, algunas palabras sobre las diferencias.

De hecho, la principal especificidad del desarrollo de ML es que no es el código el que gobierna, sino los datos. Por supuesto, también hay una especificidad de que no escribimos algoritmos de aprendizaje automático, sino que solo usamos (entrenamos), pero esto, nuevamente, se trata principalmente de datos. Y, ¿qué tenemos? Así es, los datos son principalmente un activo estratégico de una empresa. Y, en general, ML no es más que el proceso de monetización de este activo tan estratégico. ¿Y cuántos están dispuestos a dar la monetización de su activo "al margen"? 





Me vino a la mente una analogía divertida ... hay una frase famosa: "Los datos son el petróleo del siglo XXI". Entonces, si continuamos con esta analogía, ML es una refinería de petróleo. Y, por supuesto, puede encontrar productores de petróleo que venden petróleo crudo, pero la mayoría aún refina y vende el producto ya refinado.





Además, por supuesto, no olvide que los datos en muchas empresas son información que contiene secretos comerciales / personales / médicos (subraye o elimine la información necesaria) y esto también impone una serie de restricciones o al menos requiere una mayor atención.





, “ , , !”. . , , ML - . , .





1 -

, ML , ? , , , - . , , - - . , , . , "" ( ).





“ ?” - .  , . . , , ( ), . .





- ML . - - PoC (Proof of Concept). ( CRISP-DM):





  • 0 - . . - .





  • 1 - . , . - , , , .. , .





  • 2 - . . , . .





  • 3 - . - . ML, “ ”.





  • 4 - . :





    • ML





    • .





- ML DSaaS (DataScience as a Service), . - - . … .





,   -  , ML . - ( ). - , .





2 - -

. ML , ? - . , “ ” , . ( ), . , ML - . . , . -, , , , , :









  • ( )









  • , -













ML , . , - - .





, , , . . - - . , :





, :





  • - , ?





  • - - ,





  • - - , , ( )





  • - - , , , . 





, . :





  • - . ?





  • ( ) , .





  • - - - . ?





  • - //





  • , ,





/ , “ ” “”, “ .. ”, . - ML , “ ”, " " “ ” ( , , ..) .





, - :





  1. - , . ML - , “ ”.





  2. - , . ML - . .





  3. , :





    1. ML,





    2. - PoC , -





    3. -








All Articles