🎅🏿 🚭 😆 Una selección de artículos sobre aprendizaje automático: casos, guías e investigación

Seguimos recopilando materiales para usted del área de AA. Como siempre, damos preferencia a los proyectos que contienen enlaces a repositorios que no están vacíos o proporcionan API de alto nivel.

Iris

MediaPipe, una empresa especializada en soluciones de aprendizaje automático de código abierto para el reconocimiento de objetos en el espacio, como FaceMesh y Handpose, sobre la base de la cual armamos una demostración , presentó una nueva herramienta Iris . Como sugiere el nombre, este modelo de aprendizaje automático reconoce el iris, la pupila y el contorno de los ojos mediante una simple cámara RGB en tiempo real. Con un error de menos del 10%, también determina la distancia entre el sujeto y la cámara sin sensores de profundidad. Desafortunadamente, hasta ahora el algoritmo no puede determinar en qué dirección está mirando una persona, al igual que no es capaz de identificar a una persona, pero en combinación con Pose Animator, te permite crear más personajes animados "en vivo", por lo que estamos esperando una tendencia para las máscaras de dibujos animados.

FMKit

No solo Mediapipe está tratando de resolver el problema de los costosos equipos periféricos utilizando algoritmos de aprendizaje automático: investigadores de la Universidad de Arizona han desarrollado una forma de interactuar con entornos de realidad virtual o realidad aumentada sin controladores especiales.

Su algoritmo reconoce palabras escritas en el aire con tu dedo. Era imposible prescindir de los dispositivos de entrada, los desarrolladores utilizan el sensor de captura de movimiento Leap Motion. GitHub con código fuente y conjuntos de datos de FMKit. Investigadores de

estilo y semántica

de la Escuela Técnica Superior Suiza de Zúrich han desarrollado una red neuronal abiertaque le permite manipular la imagen generada con atributos de alto nivel y descripciones de texto. En la entrada del modelo, puede dar una máscara de objetos con sus clases. La red neuronal creará una imagen de estructura similar. Puede editar el contenido de la imagen mediante consultas de texto. El modelo funciona en dos etapas. En el primero, se crea el fondo de la imagen, en el segundo, el generador sintetiza el primer plano de la imagen teniendo en cuenta el fondo creado. Esto resuelve el problema de los artefactos que aparecen en segundo plano al eliminar o mover imágenes del primer plano.

Reactor semántico

Si está creando una aplicación basada en el lenguaje, como un chatbot de servicio al cliente o un juego de misiones, es posible que le interese esta herramienta. Semantic Reactor es un complemento de Google Sheets que le permite ejecutar modelos de comprensión del lenguaje natural en sus propios datos. Este juego de navegador muestra de lo que es capaz la herramienta. Afortunadamente, también admite un modelo multilingüe entrenado en 16 pares, incluido el ruso.

Fawkes

El aprendizaje automático plantea muchas controversias éticas que se pueden resolver ... el mismo aprendizaje automático. Investigadores de la Universidad de Chicago han desarrollado un algoritmo que hace que los cambios a nivel de píxel sean invisibles para el ojo humano en las fotografías, de modo que se vuelvan inutilizables para otros modelos. A este proceso lo llaman enmascaramiento de imágenes. Llamaron al instrumento en honor a Guy Fawkes, quien es conocido por todos gracias a la máscara anónima. Los creadores afirman que las fotos disfrazadas se pueden publicar en las redes sociales, y si se utilizan para entrenar modelos de reconocimiento facial, el enmascaramiento no permitirá que el modelo te reconozca en la imagen debido a la distorsión. Como dicen, cuña cuña.

Ver y rociar

Un caso de estudio de aprendizaje automático en la industria agrícola. El fabricante de equipos agrícolas más grande del mundo, John Deere, ha recurrido al aprendizaje automático y la tecnología de visión por computadora para controlar mejor las malezas. La red neuronal identifica las malas hierbas de las imágenes y luego las rocía instantáneamente con herbicidas. Esto ahorra recursos sin dañar el cultivo. El marco de PyTorch se utilizó para entrenar todos los modelos. La primera dificultad que enfrentaron los creadores fue la preparación y el etiquetado de conjuntos de datos, debido a la similitud externa de las malezas con otros cultivos. La implementación de modelos en dispositivos también fue difícil, ya que el robot debe tomar decisiones rápidamente y moverse por el campo.

Economista de IA

El desarrollo de la política económica y la evaluación de su eficacia no van a la par con los cambios en el mundo circundante, como, por ejemplo, se nota en el contexto de una pandemia mundial. Además, los modelos económicos requieren muchos supuestos, lo que limita su capacidad para describir completamente las condiciones económicas actuales: por ejemplo, pueden estudiar los impuestos sobre la renta de forma aislada, pero excluyen los impuestos al consumo.

Salesforce propone algoritmos de aprendizaje automático para resolver estos problemas y ha publicado un marco que utiliza el aprendizaje por refuerzo y el modelado económico para diseñar y evaluar rápidamente nuevas políticas económicas basadas en datos.

Escanear

No es difícil buscar incluso en una gran base de datos de artículos mediante consultas que requieren una coincidencia exacta del título o del autor, ya que dichos parámetros se indexan fácilmente. En el caso de consultas más abstractas, ya no puede confiar en métricas de similitud, como la cantidad de palabras comunes entre dos frases. Por ejemplo, la consulta "ciencia ficción" se trata más de "futuro" que de "ciencia", aunque la segunda consulta tiene una palabra que coincide con la consulta.

Los modelos de aprendizaje automático se han destacado en la comprensión del lenguaje y pueden transformar las entradas en incrustaciones, representaciones vectoriales de palabras entrenadas para combinar entradas similares en grupos. Google introdujo una herramienta de búsqueda de similitudes de código abierto para dichos vectores.

Volver a renderizar personas a partir de una imagen

Volver a renderizar una persona basándose en una sola imagen es una tarea complicada. Los algoritmos modernos a menudo crean artefactos como distorsiones poco realistas de partes del cuerpo y ropa.

Este estudio demuestra un nuevo algoritmo que permite a las personas ponerse ropa nueva a través de la reproducción de texturas. Presenta la postura y la forma del cuerpo en una cuadrícula paramétrica que puede reconstruirse a partir de una sola imagen y modificarse fácilmente. En lugar de mapas de colores UV, los creadores sugieren usar mapas de atributos para codificar la apariencia. Hasta el momento, la calidad es débil y no hay fuentes, pero ya puedes imaginar cómo pronto se aplicará esta tecnología en el Ecommerce.

Bono: en mayo dijimossobre el algoritmo que determina la profundidad de los fotogramas en el video, pero luego fue posible evaluar solo la demostración del video, ahora el código fuente del proyecto está disponible .

Eso es todo, gracias por tu atención!

Una selección de artículos sobre aprendizaje automático: casos, guías e investigación - agosto de 2020

More articles: