Configuración rentable de ejecutores de Apache Spark

¡Hola, Habr! Anticipándonos al inicio del curso "Ecosistema Hadoop, Spark, Hive", hemos preparado para usted una traducción de un útil artículo. También le ofrecemos ver una grabación gratuita de una lección de demostración sobre el tema: "Spark 3.0: ¿Qué hay de nuevo?" ...


(executor) - , (.. ) (node) . , EC2 . r5.4xlarge, , AWS EC2, 16 .

(job), (Cluster Manager). 16 . , Spark , 15 .

, , , , (core) Spark . (X * Y = 15), , , 15 Spark :

Posibles configuraciones de ejecutor

.

, , - 15 . , , , , , (64 +), . .

, — 15 , . , , , . , . .

10% 384 MB ( , ). big data , Qubole, , . , «Environments» Spark spark.executor.memoryOverhead.

Spark , . , , , . , , .

, . Spark , 5 — . , , , . , . , .

--executor-cores 5

— , . , , . , — . , EC2 , , , . r5.4xlarge AWS , 128 .

128 , . , YARN , .

, 112 .

, 112 , . , 3. .

( Qubole), . (112/3) = 37–2,3 = 34,7 = 34.

Spark , . (112/3) = 37 / 1,1 = 33,6 = 33.

Qubole.

--executor-memory 34G

, Spark . . , Spark Spark. , , , . , , 2, . , , , — , .

, , EC2, . , , .

, , . , , , , .

. , , 5.

, , , . , - , 15 , , , . 3, .

. . , 3, 16- , , 14 . !

, , , 3 , .

--num-executors (3x - 1)

4 , .

data- . AWS , . , .

--driver-memory 34G

, , , . 2 , (3x - 2), .

. , , 500 Spark, , . . , , .

--driver-cores 5

?

, , 16 128 , .

--driver-memory 34G --executor-memory 34G --num-executors (3x - 1) --executor-cores 5

:

— , .

, . . , , , .

, , Expedia Group ™, . , , , .

, , . ? ? , , ? - ? 4: « Apache Spark ».


" Hadoop, Spark, Hive" . "Spark 3.0: ?".

:




All Articles