😕 👶🏿 👋🏾 Estabilizar el video de una cámara en movimiento o cómo traducir todo a un sistema de coordenadas fijo 👰🏼 🧑🏽‍🤝‍🧑🏽 👩🏾‍🍳

Las capacidades de visión por computadora (CV) ahora están remodelando completamente el panorama del mercado de soluciones de seguridad pública. Si bien ya no es fácil sorprender a nadie con los sistemas tradicionales de videovigilancia, y resulta extraño no encontrarlo en ningún lugar público, el uso de la IA en este ámbito sigue siendo una novedad.

Estamos investigando la aplicación de CV a diversas tareas comerciales de seguridad pública. En esta publicación ofrecemos una opción para traducir el video de una cámara en movimiento a un sistema de coordenadas fijas para un análisis más detallado.

Todo el proyecto está en GitHub .

Digamos que tenemos algún tipo de video y queremos construir un sistema de coordenadas fijo para él con el fin de evaluar la ubicación de los objetos entre sí.

¿Por qué es necesario? Muy a menudo en las tareas de vigilancia pública, el video que necesita ser analizado se filma con una cámara en movimiento. Debido a esto, surgen varios problemas al determinar la posición de los objetos entre sí:

No está claro qué causó el cambio en las coordenadas del objeto: la cámara o el objeto mismo se está moviendo;
Al cambiar de escena debido a la rotación de la cámara, diferentes objetos pueden obtener las mismas coordenadas, incluso si los objetos fueran estáticos.

imagen

Figura 1: objetos idénticos tienen diferentes coordenadas debido al movimiento de la cámara

Para construir un sistema de coordenadas fijo, debe:

Determine el origen de las coordenadas;
Compare dos fotogramas consecutivos entre sí;
, , (, , ..).

imagen

2 —

:

.
: , . . . SIFT, SURF ORB. , . , , , .

3 — matching visualization

imagen

a, e — x y ;
b, d — ( a e );
c, f — ;
g, h — .

, , . (x,y) (x',y') :

imagen

:

t \cdot (x^{'}, y^{'}, 1) = H \cdot (x, y, 1) (1)

$t\cdot(x',y',1)=H\cdot(x,y,1)(1)$

:

k- .

N — (f₁,..., f_N). . matching points , f_k f_k-1.

— ;

(X_k, Y_k)=((x¹_k, y¹_k),…, (xⁿ_k, yⁿ_k)) – n matching points;

(X'_k, Y'_k) =((x'¹_k, y'¹_k),…, (x'ⁿ_k, y'ⁿ_k)) – n matching points ;

(X''_k, Y''_k) =((x''¹_k, y''¹_k),…, (x''ⁿ_k, y''ⁿ_k)) – k — n matching points , f_k-1.

H_k – , f_k-1 f_k.

, .

(X_k, Y_k) (X'_k, Y'_k). f₁ f_k , .. . H_k.

, (H₁,…, H_k-1). H_k (X_k-1, Y_k-1) (X_k, Y_k), , .

imagen

3 — ,

, . a :

x¹_k= x¹_k-1 — a, , a : x'¹_k = x¹_k — a, 3. , , .

?

(H₁,…, H_k-1). , 1 k-1 mathcing points f_k-1 . (1), , — .

H_{s u p} = H_{1} \cdot (H_{2} \cdot (H_{3} . . .)) (2)

$H_{sup}=H_1\cdot(H_2\cdot(H_3...))(2)$

, , , f_k-1 f_k, : (X_k-1, Y_k-1) (X_k, Y_k) ( (2)), (X'_k-1, Y'_k-1) (X''_k, Y''_k) H_k. , , (x¹_k, y¹_k) (x'¹_k, y'¹_k).

t (x^{'}, y^{'}, 1) = H_{s u p} \cdot (x, y, 1) (3)

$t(x',y',1)=H_{sup} \cdot(x,y,1) (3)$

: , ( , , .. ), - , . .

:

"" matching points ((x¹_k, y¹_k),… ,(x'ⁿ_k, y'ⁿ_k)),
H, k- k-1 .
((x'¹_k, y'¹_k),… ,(x'ⁿ_k, y'ⁿ_k))
:
- , ;
- . , ;
- - ( LENGTH_ACCOUNTED_POINTS len(matching points)), , , , .

, . .

"" , . , , , , . T , . , motion video segmentation.

.

GitHub , .

evenvizion_component.py
evenvizion_visualization.py
compare_evenvizion_with_original_video.py

evenvizion_component.py

, evenvizion_component.py. , json , f_k-1 f_k. , json , . , , .

- , json --path_to_original_coordinate recalculated_coordinates.json , .

json :

{"frame_no": [{"x1": x coordinate, "y1": y coordinate}, ...], ...}

evenvizion_component.py , 3 ( matching and heatmap --show_matches --visualize_fixed_coordinate_system ).

evenvizion_visualization.py compare_evenvizion_with_original_video.py .

README.

, .

:

matching points — matching visualization:

imagen

5 — matching visualization

.

, , (heatmap visualization):

imagen

6 — heatmap visualization

20 , , . , . : r=sqrt(x²+y²), heatmap_constant , : 0 — , 1 — .

7 — fixed_coordinate_system_visualization

json , , fixed_coordinate_system_visualization ( 7).

evenvizion_visualization.py compare_evenvizion_with_original_video.py , ( ). 8 9 .

imagen

8 — visualize_camera_stabilization

imagen

9 — original_video_with_EvenVizion

Known issues

N/a . matching points , , 90 , . video motion segmentation, , , static points motion points. — .

. 4 matching points, , 4 , =None. : none_H_processing True, : H_k=H_k-1. False, H — , . .

. . . :

. , , (, ).
findHomography() opencv. .

Así, obtenemos un componente que nos permite estimar la posición real de los objetos entre sí, para trasladar las coordenadas del objeto a un sistema estacionario en relación con el marco. Porque En esta solución, lo principal es evaluar la transformación de los aviones usando puntos clave, luego, como se muestra arriba, el problema se puede resolver incluso en malas condiciones de disparo (movimiento brusco de la cámara, condiciones climáticas difíciles, disparos de noche, etc.).

Estabilizar el video de una cámara en movimiento o cómo traducir todo a un sistema de coordenadas fijo

:

:

:

Known issues

More articles: