Este verano, Ampere presentó el procesador ARM Altra Max de 128 núcleos. Y en la primavera, también anunció el primer procesador Ampere Altra de 80 núcleos de la industria. En aquel entonces, se informó que estaba diseñado para ejecutarse en hardware de servidor, no en dispositivos de consumo.
Recientemente se supo que la compañía envió plataformas Mount Jade de dos sockets a varios observadores. Los partidarios de ARM pueden estar felices: los resultados de la prueba son positivos. En una serie de pruebas, los chips no se quedan atrás de sus homólogos x86-64, y de alguna manera incluso los superan.
¿Qué es Ampere Altra?
Los chips de esta línea tienen hasta 80 núcleos con arquitectura ARM v8.2 + (con algunas mejoras de los conjuntos v8.3 y 8.4), interconectados por el bus de malla Arm CoreLink CMN-600. Además, también hay un sistema de caché avanzado. Estos son 64 + 64 KB L2, 1 MB L2 y hasta 32 MB en total L3. El subsistema de memoria tiene 8 canales DDR4-3200 (72 bits, 2DPC, hasta 4 TB en total).
Dado que el chip está posicionado para adaptarse a aplicaciones de servidor, incluyendo análisis de big data, redes neuronales, bases de datos, informática de borde, etc., implementa soporte de hardware tanto para FP16 (números de precisión media) como para INT8 ( representación entera de un solo byte). Además, los desarrolladores han proporcionado hash AES y SHA-256 acelerado por hardware.
Los periféricos están conectados a través de PCIe 4.0 en 128 carriles. En la versión de dos zócalos, se asignan 32 líneas a cada lado para la comunicación con la CPU. El resultado son 192 líneas usando CCIX. Según los expertos, Ampere ahora está siguiendo el camino de AMD: el precio de los chips depende solo de la cantidad de núcleos y su frecuencia. Pero la funcionalidad de los modelos junior y senior es la misma.
La peculiaridad de Altra es la ausencia de subprocesos múltiples, lo que el propio fabricante llama una ventaja. El hecho es que el abandono de SMT hizo posible reducir el nivel de consumo de energía; este es un indicador que es muy importante para el mercado de sistemas de servidores de alta densidad. Otra razón mencionada es una mayor seguridad.
Otra característica del procesador es que siempre opera a la frecuencia máxima, reduciéndola solo en algunos casos. Al mismo tiempo, el paquete térmico se mantiene al nivel más alto posible.
Y ahora, sobre las pruebas
Pruebe muestras de procesadores que llegaron a los revisores: dos modelos más antiguos de procesadores Altra Q80-33 de 80 núcleos, que operan a una frecuencia de 3.3 GHz. Por cierto, la versión de doble procesador se creó en asociación con el desarrollador y proveedor de plataformas OCR, Wiwynn.
El procesador se instala mediante un marco con bisagras, que se fija con cinco tornillos. Las dimensiones del procesador son sorprendentes: 77 × 66,8 mm. En cuanto a los radiadores, su área de contacto es pequeña, aproximadamente el 25% del área total de la cubierta del difusor de calor del procesador. El cristal en sí es monolítico, se produce utilizando tecnología de 7 nm. Los radiadores están equipados con un mecanismo especial de disipación de calor: una cámara de evaporación, gracias a la cual un TDP de 250 W no es un problema.
En cuanto a los análogos en el mundo x86-64, son AMD EPYC 7742 (64 núcleos, SMT2, 225 Watt, $ 6950) e Intel Xeon Platinum 8280 (28 núcleos, SMT2, 205 Watt, $ 10009). Al mismo tiempo, el costo del chip de Ampere es de solo $ 4050 ("solo", en comparación con el costo de los competidores). Quizás el precio sea el factor principal para llamar la atención sobre el chip de los clientes corporativos al principio.
Los resultados de las pruebas, como se mencionó anteriormente, son impresionantes. No, los nuevos chips no destrozaron a los competidores, en algunos lugares los resultados fueron similares, en otros mejores, en algún lugar un poco peores. En general, todo está a un nivel excelente.
La desventaja de estos chips es la alta latencia, tanto dentro del mismo conector como en el interprocesador. Este, según los expertos de AnandTech, es el lado débil de los nuevos procesadores. Pero el problema no es fatal.
En cuanto a las pruebas de ancho de banda de memoria, los resultados del Altra Q80-33 son muy buenos. En esta prueba, el Xeon pierde, que tiene solo seis canales, en contraposición a los ocho de AMD y Ampere.
En las pruebas SPECint2017 y SPECfp2017, el nuevo chip funcionó muy bien, no peor que el Xeon Platinum 8280 y cercano al AMD EPYC 7742. Los resultados fueron bajos solo en un caso, en las pruebas para cálculos de punto flotante.
Pero en otra prueba, otro procesador ARM, AWS Graviton2, funcionó bien. El no muy buen resultado de la prueba del chip de Ampere, posiblemente debido a que el mismo Xeon puede overclockear hasta 4 GHz, teniendo dos núcleos activos.
El nuevo chip mostró excelentes resultados en pruebas de subprocesos múltiples, superando al Xeon. Altra Q80-33 puede considerarse el campeón absoluto en la clase de sistemas de doble procesador.
La situación es peor con los resultados de las pruebas de Java, pero aquí el problema es la falta de SMT y software sin formato. Además, la falta de subprocesos múltiples es un problema.
El nuevo procesador también funcionó bien en las pruebas de compilación. En LLVM Suite, los resultados del Altra Q80-33 son similares a los del EPYC 7742. Al mismo tiempo, a ARM le va bien con la eficiencia energética. El nuevo chip estaba a la par con AMD en pruebas de compresión, MariaDB, nginx y scripts de servidor de archivos.
Casi todos los revisores que probaron los procesadores respondieron bien al nuevo producto. Logró mantener un bajo nivel de consumo de energía con una demostración de alto rendimiento; según este indicador, el procesador era aproximadamente igual a AMD EPYC 7742. Hay, por supuesto, ciertos inconvenientes, pero no son fatales.
Los revisores han publicado mucha información sobre las pruebas, por lo que si necesita más datos sobre las pruebas que se están realizando, los resultados y las opiniones de los expertos, vale la pena consultar AnandTech , ServeTheHome y Phoronix .