Cuanto es el horario

Los datos básicos de los experimentos computacionales sobre la reorganización de la forma paralela escalonada (LPF) de gráficos de información de algoritmos (TGA) se dan en la publicación anterior . El propósito de la presente publicación es mostrar los resultados finales de la investigación sobre el desarrollo de cronogramas para la ejecución de programas paralelos en términos de la complejidad computacional de la propia transformación y la calidad de los cronogramas resultantes. Este trabajo es el resultado de un ciclo de investigación bien definido en el área bajo consideración.





Como se mencionó anteriormente, la complejidad computacional (BT) en este caso se calculará en unidades de movimiento de los operadores de un nivel a otro en el proceso de reorganización del YAPF. Este enfoque está cerca del método clásico para determinar el BT de las operaciones de ordenación (clasificación) de matrices numéricas; la desventaja es que no tiene en cuenta la complejidad de los procedimientos para determinar los elementos para la permutación.





Porque en el modelo aceptado, el YAPF realmente determina el orden de ejecución de los operadores de un programa paralelo (los operadores se ejecutan en grupos de niveles uno por uno), en aras de acortar, a veces usaremos la abreviatura "YAPF" como sinónimo del concepto de plan (cronograma) para ejecutar un programa paralelo. Por razones obvias, los estudios se llevaron a cabo con datos de un volumen relativamente pequeño bajo el supuesto de que la exactitud de los resultados obtenidos se conserva cuando se procesan datos de mayor tamaño. Los estudios descritos en esta publicación tienen como objetivo demostrar las capacidades de las herramientas disponibles para resolver las tareas asignadas. Si lo desea, es posible investigar un algoritmo arbitrario describiéndolo y depurándolo en el módulo Data-Flow con la posterior importación en el formato de un gráfico de información en el módulo SPF @ home para su posterior procesamiento.





Seguimos considerando la obtención de la máxima densidad de código (de hecho, la carga máxima de las computadoras individuales disponibles del sistema de cómputo paralelo) como el objetivo principal de las transformaciones LPF . Por cierto, es precisamente con estos conceptos que se conecta la conocida declaración malvada-irónica sobre el número excesivo de instrucciones NOP en los "paquetes" de una palabra máquina extralarga en las computadoras con arquitectura VLIW (incluso si hay secciones de código completamente secuencial, los espacios en una palabra extralarga formalmente deben ser llenados con algún tipo de operación - "ficticia") ...





, (   ), Lua . ( ).





  ( ),   ( - ). , .   





    . ,   , .2 SPF@home (http://vbakanov.ru/spf@home/content/install_spf.exe). – , {k,l} ( ) ik,jk il,jl, i,j – ( , ; ).





(, ) , – .





( ) (, ) –   “1-01_bulldozer” vs “1-02_bulldozer”, - “WidthByWidtn” vs “Dichotomy”. , …





1.

  () . ( ). ( ). .. , .





– “1-01_bulldozer” “1-02_bulldozer”.





. 1-3; ( ):





  • a), b) ) – , (CV ),  ( ) ;





  • (), () - () – , “1-01_bulldozer”   “1-02_bulldozer” c.





 1.         
       2,3,5,7,10-  ( 
   )
1. 2,3,5,7,10- ( )
 2.         
        5,10,15,20- 
 (    )
2. 5,10,15,20- ( )
 3.         
       ()   
2,3,4,5,7,10-  (     )  
()
3. () 2,3,4,5,7,10- ( ) ()

. 1-3 , . ., . 1a) 1,7 ( “1-01_bulldozer”) 3 ( “1-02_bulldozer”) 10- .





(. 1b) 0,3 ( ) “1-02_bulldozer” , , .





(. 1c) “1-02_bulldozer” ( 3,7 10) “1-01_bulldozer”.





, .





  “1-02_bulldozer” (. 2).





() 10 (. 3) . (. 3a), CV (. 3b), “1-02_bulldozer” (. 3c).





 , , (   ) . .. , ( ).





2.

VLIW- ( “”, “” ). .





  W ( W=W0 W=1, W0 – , ). – “Dichotomy” “WidthByWidtn”:





  • “Dichotomy”. – c W c    . W, ,   W. , “” ( ).





  • “WidthByWidtn”. N>W   , :





  ,  .





. 4,5  -     () ; “WidthByWidtn” “Dichotomy” . ,   “” .





 4.   ()     (), 
;        
 5  10-  – . a)  b)
4. () (), ; 5 10- – . a) b)
 5.   ()     (), 
;         ()   5  10-  – 
. a)  b)
5. () (), ; () 5 10- – . a) b)

. 4 5, ( , ,  !). , .





“ -” “WidthByWidtn” , “Dichotomy”; . “WidthByWidtn” , N./W. , N. – , W. – .





 6.      - a)    CV - b)           10-    (  –     )
6. - a) CV - b) 10- ( – )
Figura 7. El número de movimientos de operadores entre niveles - a) y el coeficiente de variación CV - b) con una disminución en el ancho del LF para el algoritmo para resolver el sistema de ecuaciones algebraicas lineales de décimo orden por el directo (no iterativo) método gaussiano (la abscisa es el ancho del LF después de la reforma)
7. - a) CV - b) 10- () ( – )

, . 6 7, ( , – ).   . 6 7,   “WidthByWidtn” ( 3-4 ) ( ) “Dichotomy” ( ). , () “WidthByWidtn” “Dichotomy” ( ).





.. () . .





, ( ) .





  ( ) .






:





  • (https://habr.com/ru/post/530078/, 26.11.2021)





  •   (https://habr.com/ru/post/534722/, 24.12.2021)





  • (https://habr.com/ru/post/535926/, 03.01.2021)





  • Streaming de dinámica informática ( https://habr.com/ru/post/540122/ , 01/02/2021)





  • Simultaneidad y densidad de código ( https://habr.com/ru/post/545498/ , 05/03/2021)





  • Cuánto es el horario ( https://habr.com/ru/post/551688/ , 10.04.2021) - actual








All Articles