banner
Hogar / Noticias / Intel Xeon 'Sapphire Rapids' frente a AMD Ryzen Threadripper Pro
Noticias

Intel Xeon 'Sapphire Rapids' frente a AMD Ryzen Threadripper Pro

Nov 27, 2023Nov 27, 2023

Hace diez años, hubiera sido impensable que hoy Intel se estuviera poniendo al día con AMD en los procesadores para estaciones de trabajo. Pero el éxito abrumador de AMD Ryzen Threadripper Pro, junto con el fracaso de Intel en lanzar un verdadero procesador de clase de estación de trabajo desde 2019, nos ha llevado a esta situación precisa. Intel necesita desesperadamente que sus nuevos procesadores Xeon 'Sapphire Rapids', específicamente los Intel Xeon W-2400 y W-3400, sean un éxito.

El gigante de los chips ciertamente tiene mucho trabajo aquí. Con Threadripper Pro, AMD entregó el santo grial de los procesadores para estaciones de trabajo, combinando una gran cantidad de núcleos (hasta 64) con altas frecuencias turbo y un alto ancho de banda de memoria para brindar un rendimiento impresionante dondequiera que lo lleven sus flujos de trabajo: CAD de un solo subproceso, subprocesos múltiples. renderizado o simulación intensiva en memoria, Threadripper Pro puede manejar prácticamente cualquier cosa que le arrojes.

No es sorprendente que Intel haya seguido un camino similar para sus nuevos procesadores para estaciones de trabajo 'Sapphire Rapids': hasta 56 núcleos, hasta 4,8 GHz turbo y memoria DDR5 de 8 canales. También sigue a AMD en términos de arquitectura. Al igual que Threadripper Pro, los procesadores 'Sapphire Rapids' cuentan con un diseño de 'chiplet' donde varios chips más pequeños se empaquetan juntos como uno solo. Esto contrasta con los diseños monolíticos tradicionales, donde todos los núcleos están en un solo chip, lo que lo hace más propenso a defectos de fabricación y, por lo tanto, a menores rendimientos y mayores costos.

Intel tiene una gama de productos centrada en estaciones de trabajo mucho más amplia que AMD, con un total de quince modelos en sus series Intel Xeon W-2400 y W-3400 (consulte los gráficos a continuación). Por el contrario, solo hay seis modelos "Zen 3" Ryzen Threadripper Pro 5000 WX-Series, con 12, 16, 24, 32 o 64 núcleos. Todos tienen memoria DDR4 3200 de 8 canales.

Intel diferencia sus familias de procesadores Xeon W-2400 y Xeon W-3400 de dos formas principales: por número de núcleos y por canales de memoria.

La serie Xeon W-2400 se clasifica como un procesador de estación de trabajo "convencional" con ocho modelos que van desde 6 a 24 núcleos y memoria DDR5 4800 de 4 canales.

Mientras tanto, la serie Intel Xeon W-3400 es para 'expertos' con siete modelos que van desde 12 a 56 núcleos y memoria DDR5 4400/4800 de 8 canales.

Los nuevos procesadores están compuestos en su totalidad por núcleos 'Golden Cove'; no tienen la arquitectura híbrida Performance Core (P-Core) / Efficiency Core (E-core) iniciada por los procesadores Intel Core de 12.ª y 13.ª generación.

'Golden Cove' no es la última arquitectura de CPU de Intel. Formó la base para los P-Cores en Intel Core de 12.ª generación.

Más allá de los núcleos, existen otras diferencias significativas entre las dos familias de procesadores. En comparación con Intel Xeon W-2400, Intel Xeon W-3400 tiene más capacidad de memoria (4 TB frente a 2 TB), más carriles PCIe (112 frente a 64) (por lo que puede admitir más GPU adicionales), más Intel Smart Caché (L3) y una potencia base máxima más alta (350 W frente a 225 W).

Por primera vez en los procesadores Xeon, ciertos modelos (aquellos con el sufijo X) están desbloqueados para que el procesador pueda ser overclockeado. Una variedad de características de ajuste están disponibles a través de Intel Extreme Tuning Utility (Intel XTU).

Si bien es muy poco probable que los principales fabricantes de equipos originales sigan alguna vez la ruta del overclocking, este nivel de control podría dejar las puertas abiertas para que los fabricantes de estaciones de trabajo especializadas se diferencien exprimiendo más rendimiento de la plataforma. Sin embargo, este podría ser uno para el futuro. Actualmente, no hay enfriadores de agua todo en uno (AIO) listos para usar que conozcamos para los procesadores que consumen mucha energía, aunque la firma británica Armari ha desarrollado una solución de enfriamiento líquido personalizada para su estación de trabajo en rack Intel Xeon W-3400 (ver recuadro al final del artículo).

Entre la serie Intel Xeon W-2400, los procesadores que se destacan son el Xeon w7-2495X y el w7-2475X, que combinan una gran cantidad de núcleos con las frecuencias de refuerzo más altas. Los modelos de gama baja pueden ser adecuados para ciertos análisis de elementos finitos (FEA) u otras herramientas de simulación que se benefician de un mayor ancho de banda de memoria pero que no necesariamente pueden aprovechar una gran cantidad de núcleos. También pueden proporcionar una plataforma para flujos de trabajo de varias GPU, como el renderizado de GPU.

Hay un patrón similar con la serie Intel Xeon W-3400, con los modelos de gama alta que presentan la mayor cantidad de núcleos y las frecuencias de impulso más altas. La gama se completa con el Intel Xeon w9-3495X de 56 núcleos con una frecuencia base de 1,9 GHz y un Turbo Boost Max 3.0 de 4,80 GHz.

Las CPU de gama baja de la familia, como Intel Xeon w5-3425, podrían ofrecer beneficios potenciales similares para la simulación de ingeniería, además de soporte para aún más GPU. Puede ver las especificaciones completas en las tablas de arriba.

Mientras tanto, Xeon W-2400 y Xeon W-3400 son compatibles con las últimas tecnologías, incluidas PCIe Gen 5, memoria DDR5 4400/4800 (que ofrece más ancho de banda de memoria que DDR4 3200 de Threadripper Pro) e Intel WiFi 6E.

Si bien la mayoría de las estaciones de trabajo se enfocan en las series Intel Xeon W-2400 y Xeon W-3400 de un solo zócalo y alto número de núcleos, 'Sapphire Rapids' no significa el final para las estaciones de trabajo con dos procesadores.

Los procesadores escalables Intel Xeon de cuarta generación, que están diseñados principalmente para servidores, ya se han abierto paso en las estaciones de trabajo de HP y Lenovo. El modelo de gama alta, el Intel Xeon Platinum 8490H, ofrece 60 núcleos por procesador, lo que le da la friolera de 120 núcleos en una estación de trabajo de doble zócalo. Sin embargo, entre los principales fabricantes de equipos originales, solo verá este chip en la ThinkStation PX de Lenovo (lea nuestra reseña) y, a $17,000 por procesador, el mercado es algo limitado. El HP Z8 G5 también viene con procesadores escalables Intel Xeon de cuarta generación, pero solo aquellos modelos con hasta 32 núcleos.

Para nuestras pruebas, nos enfocamos en los procesadores para estaciones de trabajo de gama alta de Intel y AMD: Intel Xeon w9-3495X de 56 núcleos y AMD Ryzen Threadripper Pro 5995WX de 64 núcleos. También probamos el Intel Xeon Platinum 8490H de doble socket y 60 núcleos.

Encontrará detalles de nuestras máquinas de prueba a continuación. Sin embargo, debe tenerse en cuenta que ambas estaciones de trabajo de Lenovo eran unidades de preproducción, por lo que pueden ser ligeramente diferentes a las máquinas de envío final. El rendimiento, por ejemplo, puede aumentar con las actualizaciones del BIOS, por lo que los resultados de nuestras pruebas no deben tratarse como un evangelio.

Lenovo ThinkStation P7

Lenovo ThinkStation PX

Escaneo 3XS GWP-ME A1128T

Para decirlo sin rodeos, los procesadores 'Sapphire Rapids' de Intel consumen mucha energía. Tanto los procesadores Intel Xeon w9-3495X como Intel Xeon Platinum 8490H tienen una potencia base de 350W. Pero esto es sólo parte de la historia.

Al renderizar en Cinebench, por ejemplo, observamos 530 W en el zócalo con la ThinkStation P7 y 1000 W en el zócalo con la ThinkStation PX. Incluso al renderizar con un solo núcleo, la ThinkStation P7 de Lenovo consumió 305 W sustanciales.

Eso no quiere decir que el Threadripper Pro 5995WX sea mucho mejor. Con un TDP predeterminado de 280 W, la estación de trabajo Scan 3XS GWP-ME A1128T aún consumía 474 W en el zócalo al renderizar en Cinebench con los 64 núcleos.

Finalmente, es importante tener en cuenta que todas nuestras pruebas se realizaron con el plan de energía de Windows de "rendimiento máximo" y el consumo de energía puede ser diferente con futuras actualizaciones de BIOS.

Probamos las tres estaciones de trabajo con una gama de aplicaciones del mundo real utilizadas en AEC y desarrollo de productos. También comparamos las cifras de rendimiento de los procesadores de 'consumidor' de Intel y AMD, incluidos Intel Core de 12.ª generación (Core i9-12900K), Intel Core de 13.ª generación (Core i9-13900K) y AMD Ryzen 7000 Series 'Zen 4' (AMD Ryzen 7950X ), aunque no teníamos datos para todos nuestros puntos de referencia.

Diseño asistido por ordenador

CAD no es un flujo de trabajo objetivo clave para Intel 'Sapphire Rapids' o AMD Ryzen Threadripper Pro. De hecho, los arquitectos, ingenieros y diseñadores que solo usan herramientas de diseño básicas como Solidworks, Inventor y Revit, seguramente estarán mejor atendidos por los procesadores Intel Core de 12.ª o 13.ª generación o AMD Ryzen 7000 (lea nuestro artículo de comparación).

Las familias de CPU de nivel de entrada de Intel y AMD generalmente tienen menos núcleos y menos ancho de banda de memoria, pero velocidades de reloj más altas e Instrucciones por reloj (IPC) más altas, que son importantes para estas aplicaciones en gran parte de un solo subproceso.

Pero en estos días, CAD es a menudo solo una de las muchas herramientas utilizadas por arquitectos, ingenieros y diseñadores, algunos de los cuales se benefician de tener más núcleos o un mayor ancho de banda de memoria. Por lo tanto, es importante entender cómo funciona 'Sapphire Rapids' en CAD.

Usamos Solidworks 2022 como nuestro criterio, una aplicación CAD mecánica que es en gran parte de un solo subproceso o de subprocesos ligeros, por lo que solo usa unos pocos núcleos de CPU.

Como era de esperar, Intel Core i9-12900K, Intel Core i9-13900K y AMD Ryzen 7950X tenían una clara ventaja. Con menos núcleos, frecuencias turbo más altas y (aparte del Core i9-12900K) mejor IPC, los procesadores de estaciones de trabajo de gama alta de Intel y AMD simplemente no pueden seguir el ritmo.

El Xeon w9-3495X mostró una pequeña pero significativa ventaja sobre el Threadripper Pro 5995WX en las pruebas de reconstrucción, conversión y simulación. Pero el Xeon w9-3495X no tenía las cosas a su manera, quedando rezagado en las pruebas de propiedades de masa y operaciones booleanas.

Para tener una idea del rendimiento puro de un solo subproceso, aunque a través de una prueba de renderización sintética, también utilizamos el punto de referencia Cinebench ST. Aquí, el Xeon w9-3495X tenía una clara ventaja del 22 % sobre el Threadripper Pro 5995WX. Curiosamente, a pesar de su frecuencia turbo significativamente más baja, el Intel Xeon Platinum 8490H no estaba tan lejos del procesador AMD.

modelado de la realidad

El modelado de la realidad se está volviendo mucho más frecuente en el sector AEC. Agisoft Metashape 1.73 es una herramienta de fotogrametría que genera una malla a partir de múltiples fotos de alta resolución. Tiene varios subprocesos, pero utiliza varios núcleos de CPU a trompicones. También utiliza algo de procesamiento de GPU, pero en mucha menor medida.

Probamos utilizando un punto de referencia del fabricante estadounidense especializado en estaciones de trabajo Puget Systems. El Threadripper Pro 5995WX casi superó al Xeon w9-3495X en la prueba del modelo Rock más pequeño, pero fue un 13 % más rápido en la prueba del mapa escolar más grande. Curiosamente, el Xeon Platinum 8490H estaba muy por debajo del ritmo. Nos preguntamos si el software distribuye la carga entre ambas CPU pero no está optimizado para esto. Es difícil explicar esto solo por la frecuencia más baja.

El software de procesamiento de nubes de puntos, Leica Cyclone Register 360, asigna subprocesos según la cantidad de memoria del sistema. En una máquina con 64 GB se ejecutará en cinco subprocesos y en una con 128 GB o más se ejecutará en seis.

El Threadripper Pro 5995WX fue un 10 % más rápido que el Xeon w9-3495X al registrar nuestro conjunto de datos de 99 GB. Ambas CPU se quedaron atrás de los procesadores de consumo de AMD e Intel. A pesar de que esas máquinas de prueba solo tenían 64 GB de memoria, por lo que solo funcionaban con 5 subprocesos, sus frecuencias más altas y el IPC les dieron la delantera.

Representación

El renderizado de trazado de rayos es altamente escalable. En términos generales, duplique la cantidad de núcleos de CPU a la mitad del tiempo de procesamiento (si se mantienen las frecuencias).

El Threadripper Pro 5995WX superó significativamente al Xeon w9-3495X en KeyShot y V-Ray, dos de las herramientas más populares para la visualización de diseños, y en Cinebench 23, el punto de referencia de Cinema4D. El Threadripper Pro 5995WX fue un 35 % más rápido en Keyshot, un 27 % más rápido en V-Ray y un 20 % más rápido en Cinebench. Esta es una ventaja considerable.

Pero la ventaja que tiene el procesador para estaciones de trabajo de gama alta de AMD sobre el Xeon w9-3495X no se debe solo a que tiene 8 núcleos más. La eficiencia energética relativa de ambos procesadores y, por lo tanto, las frecuencias de todos los núcleos que pueden mantener, tiene un gran impacto en el rendimiento.

En Cinebench, por ejemplo, el Threadripper Pro 5995WX mantuvo 3,05 GHz en todos los 64 núcleos, mientras que el Xeon w9-3495X bajó a 2,54 GHz. La relación entre potencia, frecuencia e hilos del Xeon w9-3495X se puede ver con más detalle en los gráficos a continuación.

Mientras tanto, el Intel Xeon Platinum 8490H dual superó considerablemente a ambos procesadores de un solo zócalo. Pero con 120 núcleos y 240 subprocesos para jugar, esto fue una pequeña sorpresa.

Simulación de ingeniería

La simulación de ingeniería incluye análisis de elementos finitos (FEA) y dinámica de fluidos computacional (CFD). FEA puede ayudar a predecir cómo reacciona un producto a las fuerzas o temperaturas del mundo real. CFD se puede utilizar para optimizar la aerodinámica en automóviles o predecir el impacto del viento en los edificios. Ambos tipos de software son extremadamente exigentes computacionalmente.

Hay muchos tipos diferentes de 'solucionadores' utilizados en FEA y CFD y cada uno se comporta de manera diferente, al igual que diferentes conjuntos de datos.

En general, CFD escala muy bien y los estudios deberían resolverse mucho más rápido con más núcleos de CPU. Es importante destacar que CFD también puede beneficiarse enormemente del ancho de banda de la memoria, ya que cada núcleo de CPU puede recibir datos más rápido. Esta es un área en la que 'Sapphire Rapids' puede superar a Threadripper Pro. Ambos tienen memoria de 8 canales, pero 'Sapphire Rapids' usa DDR5 de 4800 MHz más rápido, mientras que Threadripper Pro usa DDR4 de 3200 MHz.

Para nuestras pruebas, utilizamos tres cargas de trabajo seleccionadas del banco de pruebas SPECworkstation 3.1. Esto incluye dos puntos de referencia CFD (Rodinia, que representa el flujo comprimible, y WPCcfd, que modela la combustión y la turbulencia) y un punto de referencia FEA (CalculiX, que modela la temperatura interna de la turbina de un motor a reacción).

En Rodinia, el Xeon w9-3495X superó al Threadripper Pro 5995WX en un 101 %. En WPCcfd, la ventaja fue menor pero, con un 13 %, sigue siendo significativa. El rendimiento de ambos procesadores se vio eclipsado por el Intel Xeon Platinum 8490H dual.

A ambos procesadores Intel les fue mucho peor en la prueba Calculix (FEA), donde el Threadripper Pro 5995WX tomó una ventaja sustancial.

Además de los núcleos, el ancho de banda de la memoria es uno de los principales diferenciadores entre los procesadores para estaciones de trabajo y sus homólogos de consumo.

Esto se rige en gran medida por la cantidad de canales de memoria que admite cada procesador, pero también por el tipo de memoria.

Los canales de memoria actúan como vías entre la memoria del sistema y la CPU. Cuantos más canales tenga una CPU, más rápido se pueden entregar los datos.

Intel Core de 13.ª generación y AMD Ryzen 7000 Series tienen dos canales de memoria, mientras que Intel Xeon W-2400 Series tiene cuatro, e Intel Xeon W-3400 Series, 4.th Generation Intel Xeon Scalable y Threadripper Pro 5000 Series tienen ocho. Para obtener el ancho de banda de memoria completo, todos los canales de memoria deben llenarse con módulos de memoria, como fue el caso con todas nuestras máquinas de prueba.

Como se mencionó anteriormente, los Xeon de 'Sapphire Rapids' tienen una ventaja sobre la serie AMD Ryzen Threadripper 5000, ya que admiten una memoria más rápida: DDR5 de 4800 MHz en comparación con DDR4 de 3200 MHz.

Un rápido recorrido por el benchmark de SiSoft Sandra muestra el ancho de banda de memoria comparativo que uno puede esperar. El Threadripper Pro 5995WX registró 139,27 GB/seg, mientras que el Intel Xeon w9-3495X obtuvo 184,64 GB/seg y el Intel Xeon Platinum 8490H dual subió a 325,6 GB/seg. Estas cifras ayudan a explicar por qué a Sapphire Rapids le va tan bien en nuestras pruebas comparativas de CFD con uso intensivo de memoria.

Para ver cómo el ancho de banda de la memoria afecta el rendimiento en diferentes flujos de trabajo, probamos el Xeon w9-3495X con una variedad de configuraciones de memoria diferentes, desde 1 canal con un solo DIMM de 32 GB hasta 8 canales con 8 x 32 GB módulos DIMM. Curiosamente, incluso con 6 canales, el Xeon w9-3495X superó al Threadripper Pro 5995WX en ancho de banda de memoria, entregando 141,21 GB/seg en SiSoft Sandra.

Como la mayoría de nuestros puntos de referencia se ajustan a 32 GB de memoria, el hecho de que hayamos reducido la capacidad debería tener un impacto mínimo en los resultados, aunque no se puede ignorar por completo. La excepción es nuestra prueba Leica Cyclone Register 360, que ajusta la cantidad de núcleos utilizados en relación con la memoria del sistema. Esta es la razón por la que el rendimiento cae masivamente con 32 GB.

Como puede ver en los gráficos a continuación, el ancho de banda de la memoria en el punto de referencia WPCcfd tiene un impacto masivo en el rendimiento. Curiosamente, incluso con 6 canales llenos, el Intel Xeon w9-3495X supera al AMD Ryzen Threadripper Pro 5995WX.

Otro flujo de trabajo enormemente influenciado por el ancho de banda de la memoria es la recompilación de sombreadores en Unreal Engine 4.26, que utiliza todos los núcleos disponibles. Sin embargo, donde Threadripper Pro 5995WX pierde en GB/seg, lo compensa en núcleos y frecuencia de todos los núcleos, ya que aún logró vencer al Xeon w9-3495X en nuestro punto de referencia automotriz.

El rendimiento en CAD (Solidworks), representación de trazado de rayos (V-Ray) y modelado de realidad (Leica Cyclone Register 360 y Agisoft MetaShape Professional 1.73) parece no verse afectado prácticamente por el ancho de banda de la memoria. Hay un par de advertencias en Solidworks. En la prueba de simulación, el rendimiento bajó un poco al pasar de 4 canales a 1 canal. En las operaciones booleanas, la memoria de 1 canal en realidad brindó resultados marginalmente mejores.

No se puede subestimar la importancia para Intel de que los Xeon W-2400 y Xeon W-3400 de 'Sapphire Rapids' sean un éxito. Durante los últimos años, AMD ha tenido poca competencia en los flujos de trabajo que se benefician de muchos núcleos o un alto ancho de banda de memoria. Intel sin duda habrá sentido el impacto de Threadripper Pro.

Sin embargo, según nuestras pruebas, Sapphire Rapids no va a ser el asesino de Threadripper Pro 5000 WX-Series que pensamos que podría ser, al menos en el sector AEC más amplio.

En el renderizado de trazado de rayos, el Threadripper Pro 5995X de 64 núcleos todavía tiene una ventaja considerable sobre el Xeon w9-3495X de 56 núcleos. Y si bien es posible que Intel gane en ciertos puntos de precio, simplemente porque tiene tantos modelos diferentes en sus familias Xeon W-2400 y W-3400, ciertamente no esperamos que los especialistas en visualización se muden a 'Sapphire Rapids' en masa. Además, a medida que avanza en el rango, se enfrentará a más competencia de Intel Core de 13.ª generación.

Pero 'Sapphire Rapids' tiene algunas grandes ventajas. En los flujos de trabajo de un solo subproceso, parece tener una ventaja sobre Threadripper Pro, lo que podría marcar una diferencia real en algunas aplicaciones CAD/BIM. Un mejor rendimiento de subproceso único también debería aumentar las velocidades de fotogramas 3D en aplicaciones con CPU limitada.

El mayor beneficio potencial para 'Sapphire Rapids' proviene de la simulación de ingeniería, específicamente CFD. Nuestras pruebas muestran que 'Sapphire Rapids' puede ofrecer un aumento de rendimiento masivo, en gran parte gracias a su ancho de banda de memoria superior. Si bien los solucionadores y los conjuntos de datos varían, los usuarios serios de herramientas de Ansys, Altair y otros deberían explorar lo que los procesadores escalables Xeon W-3400 e Intel Xeon de cuarta generación pueden hacer por ellos. Las simulaciones extremadamente complejas pueden tardar horas, incluso días, en ejecutarse. Reducir este tiempo a la mitad podría brindar beneficios monumentales a un proyecto.

Todo esto es emocionante, pero uno no puede evitar mantener un ojo en el futuro. Se espera que AMD lance su CPU Threadripper Pro 'Zen 4' de próxima generación a finales de este año. Y, si los rumores de 96 núcleos y memoria de 12 canales (DDR5) se hacen realidad, cualquier ventaja que Intel pueda tener podría ser de corta duración.

Desplácese hacia abajo para leer y suscríbase aquí

Presentando

Lenovo ThinkStation P7 Lenovo ThinkStation PX Scan 3XS GWP-ME A1128T Diseño asistido por computadora Modelado de realidad Representación Simulación de ingeniería Características
Enviar Consulta
Enviar