Introducción
En el mundo moderno, la tarea de la segmentación, al final resultó que, se resuelve una o dos veces, aunque pensé que era algo complicado y sorprendente. Todo lo que se necesita es leer un par de artículos, instalar ciertas bibliotecas y marcar los datos, todo sobre todo toma un par de horas de tiempo, excepto para crear una muestra de prueba.
Marcado de datos
Este paso en la implementación de la segmentación de cuadros de flujo de video es uno de los más laboriosos en términos de trabajo humano.
Para hacer esto, necesita usar programas especiales para marcar los cuadros de la transmisión de video. Simplemente abrimos el archivo de video requerido con este programa y marcamos los cuadros, habiendo creado previamente clases en las que segmentaremos las imágenes. En mi ejemplo introductorio, los marcos se dividen en las siguientes clases (Automóvil, Carretera, Paso de peatones, Césped, Edificios, Personas, Acera, Marcas viales).
De hecho, posiciones como carreteras, edificios, céspedes, aceras, etc. es posible no reconocerlo, ya que la cámara en este caso es rígidamente fija y por lo tanto estas áreas siempre estarán en el mismo lugar.
Entrenamiento de una red neuronal para la segmentación de imágenes
( , ).
.
, . 4 (, , ... , , , ) 60 DeepLab v3+ ( ResNet-18). . 2.
, , , . .
, (. 3 4), .
, (. 5 6).
, , (. 7 9). (. 8).
3%, 54%. , . , , , . .
, . ( ), , .
- , . ( , ), . ., . , . , , . , , , , , , .
PD: ¿Alguien sabe qué software se puede usar para grabar una transmisión de video de una transmisión de YouTube de la manera más simple posible?) Las cámaras simplemente escriben datos en un búfer circular (las últimas 12 horas) en forma de transmisión de YouTube, formando así una videovigilancia, donde cada residente de la casa puede ver las últimas 12 horas.