¿De dónde proviene la aplicación ML en Rusia a nivel estatal?

Prefacio



¡Hola!



La pregunta del título no es retórica, estoy realmente interesado. Si de repente alguien sabe la respuesta, escriba en los comentarios, tal vez traté de ir por el lado equivocado.



También aclaro que no tengo ningún objetivo de quejarme de alguien, por eso, en las respuestas de los ministerios, quité todos los sellos con los nombres y firmas de los funcionarios responsables. Me interesa comprender cómo funciona este sistema.



¿Cómo comenzó todo?



Todo empezó con el hecho de que a finales de 2019 me di cuenta de que en mi anterior área de actividad profesional había alcanzado un cierto pico y un mayor desarrollo en esta área para mí:



  1. no interesado
  2. es posible, pero se corresponde plenamente con el principio de Pareto en el que tendría que hacer un gran esfuerzo por el bien de las perspectivas ilusorias, e incluso no tan deseable como me pareció al comienzo del viaje.


Gracias a una importante reunión con amigos, me di cuenta de que un deseo de larga data, ahogado por varias razones, es “ir a TI”, es decir, en ML y específicamente puedo tener éxito. No describiré cómo estudié, pero fue realmente intenso, productivo y lo más importante, emocionante, tanto que tuve que obligarme a descansar. Al final, fui a por todas. Dejó su antiguo trabajo y dedicó casi todo el tiempo libre a estudiar.



Con el tiempo, comencé a pensar en encontrar un trabajo en un nuevo negocio favorito, pero luego comenzó la historia con Covid. Además, no es ningún secreto que el aprendizaje automático se ha convertido recientemente en un tema muy de moda y, como resultado, ha aparecido en el mercado laboral un número significativo de postulantes para los puestos de juniors / aprendices en el campo de DS. En conjunto, estos 2 factores, para mí personalmente, significaron que incluso con buenos resultados en varias competencias para el empleador, yo era solo uno de los muchos recién llegados al campo, al igual que yo, y tenía pocas posibilidades de llegar a la etapa de entrevista.



Después de pensarlo bien y darme cuenta de que la única forma en que puedo distinguirme favorablemente del resto es la presencia de buenos proyectos, comencé a buscar un tema para el primer proyecto. Cuando recién comencé a estudiar ML estaba repleto de ideas, pero cuando elegí el tema del proyecto, estas ideas se volvieron menos, ya que habiendo profundizado un poco en los detalles, comencé a pensar un poco diferente - “sí, esta es una buena idea, pero un CV abierto no lo es Adecuado por su formación preliminar y para enseñar la mía propia no tendré suficientes recursos y datos, solo si no toma una red GAN y genera imágenes con su ayuda. Y luego hay restricciones en las solicitudes para la versión gratuita de la API, y para descargar un conjunto de datos normal, necesita mucho tiempo o dinero ", etc.



Decidiendo ir desde el otro extremo, regresé a Kaggle, abrí los conjuntos de datos, los clasifiqué por "picor" y luego me di cuenta. ¡Covid está en el patio! ¿Qué podría ser mejor? ¡Hacer no solo un proyecto, sino un proyecto sobre un tema de moda! Entonces probablemente se darán cuenta de mí y me arrancarán con las manos. Eso pensé entonces. Sí, schazz.



De cara al futuro, no puedo evitar señalar que, a pesar de todas mis pequeñas pero ventajas, mis respuestas a xx fueron abiertamente ignoradas o rechazadas cortésmente, incluso para aquellas vacantes para las que me recomendó un empleado interno de la empresa. En solo un mes de buscar trabajo, hubo alrededor de 70 respuestas de mi parte, y parece que 3 entrevistas después de las cuales yo mismo tomé una decisión negativa. No sé exactamente cuál fue el caso en cada caso individual, pero sospecho que el problema está en la edad (30+), falta de educación / experiencia especializada y proyectos torcidos.



Pero específicamente, esta historia de búsqueda de trabajo con un buen final: mi gerente actual me encontró en xx, pasé rápidamente por las etapas de entrevistas y ahora estoy haciendo análisis, incluido el uso de ML, y realmente me gusta. Además, ¡también me pagan por ello! Probablemente no le diré esto a la cara de mi líder debido a mi cierta introversión, pero muchas gracias si de repente lees esto)



Bueno, está bien, me dejé llevar demasiado en la dirección de las letras. Cerca



A negociar



Habiendo obtenido todo en el mismo conjunto de datos de caggle (https://www.kaggle.com/parthachakraborty/pneumonia-chest-x-ray), escribí una pequeña red secuencial con una precisión de aproximadamente el 85%. Al final, tomé un conjunto de datos con neumonía en su conjunto, y no con neumonía causada por covid, porque no encontré conjuntos con una cantidad significativa de fotos de COVID-19, pero en ese momento sabía poco sobre los métodos de aumento.



Afortunadamente, recordé que tengo un amigo, un radiólogo, con la ayuda de quien aprendí algunos detalles sobre las diferencias en el diagnóstico de neumonía por tomografías computarizadas y métodos de rayos X. También le envié las imágenes clasificadas por el modelo, que tomé de la inmensidad de la telaraña a pedido de "radiografías de los pulmones infectados de neumonía". Los resultados son un poco peores de lo que esperaba. Entonces, en varias fotos que la red percibió como neumonía bacteriana, en realidad había tuberculosis, que simplemente no estaba en la muestra de entrenamiento, pero por lo demás el porcentaje de errores correspondía a model.score (X_valid, y_valid).



Estaba eufórico. Aún así, estaba haciendo ciencia de datos real, y no haciendo la presentación número 70 en un intento de entrar en el 1% superior, prediciendo precios en Melbourne. No me sorprendería saber que los agentes inmobiliarios locales tienen contratiempos cuando intentan evaluar una casa. Lo siento, no pude resistir.



En general, me sentí inspirado, envié una nueva docena de respuestas y ... de nuevo nada.



Cuando se me ocurrió esta idea, no puedo decir que me guiara exclusivamente por buenas intenciones como paz-paz, salvar a los pobres y otros. No, mi objetivo era encontrar trabajo lo más rápido posible, y para ello necesitaba destacar de manera positiva entre la multitud del mismo “Quiero estar en ML”.



Pero al mismo tiempo, atravesando la crisis de la adolescencia “¿por qué estamos aquí?” Y siendo ateo, decidí por mí mismo mi credo: que quiero hacer del mundo un lugar mejor, porque el resto, a mi entender, no tiene valor real a gran escala. ¿Idealista e ingenuo? Sí, esto es cierto y lo que hice y por qué estoy escribiendo esta publicación se deriva de estas cualidades mías.



Decidí escribir a la recepción del presidente de la Federación de Rusia una propuesta de aproximadamente el siguiente carácter (no he conservado el texto exacto, ya que está escrito de forma especial en el sitio web de la recepción): “Yo, tal y cual, en el marco de la designación por parte del presidente de la Federación de Rusia de áreas clave desarrollo del estado, es decir, en el marco de la aplicación del LA en diversas esferas del estado, propongo lo siguiente: organizar la recolección y almacenamiento de imágenes de rayos X, y hacer que este almacenamiento sea accesible para su procesamiento por métodos de ML y la posibilidad de retroalimentación ". Luego describí brevemente mi modelo, indiqué que incluso yo, con mi pequeño bagaje de conocimientos, pude hacer un modelo recomendatorio que podría funcionar en conjunto con un radiólogo y ser útil. Y en Rusia hay un número significativo de entusiastas de DC con un alto nivel de conocimientos / habilidades que pueden hacer mucho no solo en el campo de la medicina,pero también en otras áreas donde, en principio, se puede aplicar ML.



Lamentablemente, no recuerdo el texto exacto de la apelación, ya que fue en marzo o abril, pero el significado general es exactamente el mismo.



Desarrollando este tema, ahora agregaría que, en principio, es necesario recolectar y agregar la mayor cantidad posible de datos abiertos y desplegarlos al análogo de Kaggle donde también sería posible establecer tareas, discutir sus soluciones y encontrar las mejores. Rosstat ya está haciendo algo similar con respecto a la publicación de datos, incluso logré analizar algo, pero este tema debe desarrollarse más.



Se registró el mensaje, sobre el cual llegó una carta aparte, pero aún me sorprendió bastante cuando vi que llegó la respuesta. La primera respuesta fue del Ministerio de Salud. Fue breve y lacónico.







La esencia de la respuesta, como yo la veo, es "ok, gracias, no".



Pensé que este era el final de la historia, pero otra respuesta vino del Ministerio de Industria y Comercio. La respuesta es muy detallada y detallada, pero tuve la sensación de que o se les dio información distorsionada o simplemente me entendieron mal.



















No solicité ninguna ayuda financiera para la implementación de este proyecto, además, no escribí una palabra de que quisiera participar en él (aunque, naturalmente, no me negaría). Bueno, respondieron, bien, y gracias por eso.



Me habría olvidado de esta historia sin peligro si no me hubiera encontrado con noticias como esta o esta (muy reciente) o especialmente esta . Después de leerlo, me reí un poco, porque esto es exactamente sobre lo que escribí.



Salir



Bueno, salió el mensaje.



Estas son las preguntas clave que quería hacer.



¿Quién está involucrado en la implementación de ML en los "procesos de negocio" del estado? ¿Quién dirige a estas personas?



¿Está centralizado o cada ministerio tiene sus propios científicos de datos? ¿Están incluso en el aparato estatal?



Vi el texto de la estrategia nacional para el desarrollo de la inteligencia artificial para el período hasta 2030, pero todavía me quedan decenas de preguntas, ¿a quién puedo hacerles? Para obtener una respuesta razonable, por supuesto.



Teniendo en cuenta las respuestas que recibí, tengo algunas dudas de que esta estrategia no es solo una declaración de intenciones, sino un plan real, y que todo este emprendimiento no resultará en la financiación de varios proyectos de exhibición "propios", a los que luego se hará referencia, señalando el éxito de la estrategia.



En general, ¿alguno de los que leen esta publicación está implementando algún programa de esta estrategia?



¡Gracias a todos por tomarse n minutos de su tiempo!



All Articles