La rivalidad AMD Ryzen Threadripper vs. Intel SkylakeX marcará una época y subraya la vuelta a la competición en el mercado sobremesa de gama alta HEDT (high-end desktop).
Aquí analizaré ambos procesadores en detalle y expondré sus puntos débiles y fortalezas.
Threadripper incluso inaugura una nueva categoría, el SHED (super high-end desktop). Como experto en arquitectura de procesadores nunca en los últimos 10 años he asistido a un momento tan crucial en la historia de los semiconductores.
Los ya universales 14 nm
Para empezar quiero señalar que, por primera vez, AMD no se encuentra en desventaja en el proceso de fabricación. Recordemos que siempre ha estado rezagado uno o dos nodos por detrás de Intel (por ejemplo 65 o 45 nm vs. 32 nm de Intel).
En 2017 ambos fabricantes de procesadores x86 (Intel y AMD) manufacturan sus CPUs en el nodo de 14 nm.
AMD contrata la manufactura de sus procesadores a Global Foundries (con licencia Samsung en 14 nm) mientras que Intel fabrica sus propios chips en sus mega fabs.
¿Porqué 2017 es diferente?
Es simple: La irrupción en el mercado de los cores AMD Zen ha destruido por completo el ecosistema AMD / Intel.
Primero fueron los procesadores Ryzen 5 y Ryzen 7 de hasta 8 cores, 16 threads y 2 * 8 MB de L3 a precios imbatibles, ahora llega el monstruoso Threadripper con sus 16 cores, los Ryzen 3 de 4 cores y en breve las APU con GPU integrada y cores Zen.
Intel ha atacado duramente la arquitectura Ryzen, argumenta despectivamente que una procesador Ryzen Threadripper no es más que dos Ryzen pegados y un procesador Server AMD EPYC ‘four Ryzen desktop dies glues together’.
Veremos qué hay de cierto en estas afirmaciones y el porqué de este agrio tono en las declaraciones del omniportente gigante x86.
Pero para entender el presente tenemos que hacer un necesario paréntesis…
Un poco de historia, diez años atrás.
Corría el ya lejano año 2007 y AMD fue literalmente barrida del mapa por Intel… con una excelente CPU que no era más que dos procesadores Core 2 Duo ‘pegados’…
AMD presentó su flamante (y caro de producir) Phenom quad core de 65 nm, con 2 MB de L3 unificada y controladora de memoria integrada dual DDR2 (en un inicio, luego pasaría a la DDR3).
Recuerdo los tests de aquellos primeros procesadores Phenom.
A los pocos minutos quedó patente su pésima escalada en frecuencia (poco más de 2.6 GHz con voltajes elevados) y lo ineficiente del diseño asíncrono de su uncore por el que pasaban todos los datos de las 2 controladoras de memoria.
Los 4 cores K10 que integraba Barcelona eran AMD K8 Athlon 64 evolucionados, no estaban tan lejos de los Inel Conroe del primer Core 2 Duo 65 nm. El problema radicaba en la integración.
La caché L3 de AMD Phenom era de solo 2 MB para 4 cores, con diseño exclusivo Victim Cache y con una latencia tan elevada que la hacía prácticamente inútil. En su día hice numerosos análisis y propuse múltiples mejoras en su diseño e implementación.
A Intel entonces sí le gustaba ‘pegar’ procesadores…
Intel, en cambio, diseño unos totalmente convencionales procesadores Core 2 Quad constituidos por 2 dies separados Conroe de 65 nm, cada una con su L2 independiente de 4 MB (2 * 4 MB) y con un arcaico bus FSB para comunicar con el resto de la máquina.
AMD invirtió ingentes recursos en diseñar el complejo procesador Barcelona 65 nm como un todo, un quad core nativo. Intel por su parte se limitó a integrar dos excelentes CPUs Conroe 65 nm y montarlas en un chip con una sola conexión FSB con la placa base.
Como podemos ver, fabricar un chip demasiado grande y querer integrar todo en un solo die trae problemas inesperados. Y por supuesto, un coste de manufactura muy superior a dos más chips de menor superficie.
Moraleja: Es mejor integrar varios chips menores y dotarlos con una interconexión eficaz para lograr un producto competitivo y económico que forzar la máquina y crear un procesador en los límites absolutos del diseño.
Parece que AMD aprendió la lección, aunque no en aquellos tiempos gobernados por un estúpido management.
El procesador AMD Ryzen Threadripper
AMD Ryzen Threadripper llega a finales de Agosto. Integra 2 dies (dos chips discretos) Ryzen (8 cores y 2 L3 de 8 MB) para un total de 16 cores, 32 threads, 32 MB L3 y 4 canales DDR4 todo ello interconectado por el Infinity Fabric.
La caché L3 se compone de 4 bancos con gestión totalmente independiente de 8 MB y 16 vías. Cada banco de 8 MB de L3 actúa como Victim Cache de las 4 cachés L2 de 512 KB de los 4 cores integrados en ese CCX. Volveré a este tema más adelante.
Infinity Fabric
El Infinity Fabric es lo que posibilita que un procesador Threadripper o un EPYC puedan mantener la capacidad de procesamiento de su masivo número cores y threads.
El Infinity Fabric que ha AMD diseñado para toda la familia de CPUs con arquitectura Zen es altamente escalable y cada uno de sus links es configurable como Infinity Fabric, PCIex o SATA dando una gran versatilidad, eso sí a costa de muchos pines y placas base complejas.
Skylake-X, un Intel Xeon Skylake renombrado
Intel lleva ya tantos años aplastando a AMD con sus carísimas y excelentes plataformas HEDT de alta gama que a muchos les cuesta recordar los tiempos de aquellos primeros AMD Athlon FX.
Procesadores de 1 solo core con controladora de memoria integrada dual channel DDR que sumía en el ridículo a los últimos Intel Pentium 4.
Primero Intel nos sorprendió con 6 cores y 12 threads con el Intel Core i7 990X de 45 nm, con los años pasamos a 8 y finalmente a 10 cores en la anterior generación Broadwell-E 14 nm. No había competencia posible.
Pero en 2017 se ha acabado la fiesta.
Con Ryzen Threadripper, AMD pone en la mesa 16 cores y 32 threads con 4 canales DDR4. Intel queda en cuadro… ¿Cual es su mejor opción?
Intel era conocedor de los planes de AMD y tenía que plantear una respuesta organizada…
No podía diseñar una nueva familia de CPUs de sobremesa basada en los soberbios cores Skylake o Kaby Lake con un número elevado de cores y lo más importante:
Con un subsistema L3 optimizado para cargas Gaming y escritorio. Pero habría necesitado mucho más tiempo.
Intel jugó su única carta, renombrar sus dos gamas inferiores de chips Xeon para Servidores como Skylake-X:
- Los procesadores Skylake-X de hasta 10 cores utilizarán el diseño Xeon LCC (Low core count).
- Los procesadores Skylake-X de 12 a 18 cores utilizarán el diseño Xeon HCC (High core count).
Skylake-X constituye su nueva plataforma HEDT (high-end desktop) heredera de Broadwell-E hasta los 10 cores y se extiende a un nuevo mercado abierto por Threadripper:
El nuevo segmento SHED (super high-end desktop) al que pertenece Threadripper y Skylake-X llegará hasta los 18 cores y un precio por CPU Intel de hasta 2000 € (!!).
La caché L3 de Intel Skylake-X
Intel, ya hace años, tomó la decisión de cambiar el diseño L3 de sus CPUs Xeon para servidores y ha llegado en el peor momento.
El diseño L3 hasta Skylake-X es favorable a cargas de trabajo de escritorio y gaming pero empieza a escalar mal por encima de los 16 cores aproximadamente.
El diseño actual de la caché L3 hasta los Broadwell-E:
- Organización L3 inclusiva (incluye totalmente el contenido de TODAS las cachés L2 de los cores)
- Tamaño de 2.5 MB por core (25 MB para 10 cores, aumenta la tasa de aciertos).
- Alta asociatividad de 20 vías (aumenta la tasa de aciertos).
- Físicamente la L3 se encuentra distribuida en bancos de 2.5 MB junto a cada core.
- Frecuencia hasta 3 GHz.
- Comunicación mediante Ring Buses bidireccionales (muy baja latencia).
El nuevo diseño de caché L3 en Skylake-X:
- Organización L3 exclusiva (NO incluye contenido de las cachés L2 de los cores).
- Tamaño de 1.375 MB por core (13.75 MB para 10 cores, menor tasa de aciertos).
- Baja asociatividad de solo 11 vías (baja tasa de aciertos).
- Frecuencia hasta 2.4 GHz.
- Comunicación mediante Mesh, los cores, cachés L3, controladoras DDR4, PCIex, etc. están sobre un retículo 2D con conexión en cada punto (mayor latencia).
Intel Skylake-X. La influencia de la arquitectura L3
Para un número elevado de cores (> 16) y con cargas de trabajo Server el nuevo diseño Mesh tiene mucho sentido y es superior al anterior doble Ring Bus.
Mesh escala mejor con el número de cores y hace óptima distribución y balanceo del ancho de banda disponible entre: cores – caché L3 – controladoras DDR4 – PCIex – USB – SATA – etc.
Pero para cargas de trabajo Gaming o de escritorio es más eficiente la antigua caché L3 inclusiva con arquitectura Ring Bus y mayor capacidad y tasa de acierto que favorece la compartición de datos entre cores.
Como vemos, Intel ha tenido que dar una solución rápida a un problema con el que hace un año no contaba: competencia en gama alta.
Memorias ECC en Skylake-X (No…)
Contrariamente a AMD Threadripper, Skylake-X no soporta memoria ECC DDR4. Es un gran hándicap pensando en estaciones de trabajo de alta gama.
Continuará en la segunda parte.
Os dejo algunos artículos con análisis de los procesadores Ryzen y la arquitectura AMD Zen:
AMD Ryzen 7 – 8 cores 16 threads y 4 GHz
AMD Zen / Ryzen 14 nm – Historia
AMD Zen / Ryzen Cache
NVMe vs AHCI: Almacenamiento
AMD Ryzen, chipsets y placas base
AMD Ryzen. Últimos detalles
Hasta aquí, otro de mis artículos en informaticapremium sobre lo último en hardware, sistemas, almacenamiento, redes, programación, diseño web, recuperación de datos y actualidad del mundo de la técnica y la informática. Nos vemos en breve.
Carlos Yus Valero.
Te felicito por tu blog el cual sigo hace años, ya estaba echando de menos los analisis a Ryzen y su arquitectura, al parecer Lisa Su está haciendo un excelente trabajo como CEO de AMD.
Lo mejor de todo es que los usuarios ganamos con esta competencia.
Estaré atento a tu blog como siempre.
Saludos!
Cristian, ciertamente AMD está en el buen camino.
El monopolio en altas prestaciones que ha impuesto Intel durante los últimos 11 años (desde la aparición de los procesadores Core 2 Duo) ha llevado al mercado a un estancamiento en precios y prestaciones. Solo hay que recordar que desde 2006 tenemos procesadores de 4 cores en sobremesa y las gamas mainstream de Intel por fin plantean 6 cores desde la generación 8, lo que llegará en Q3 2017 o Q1 2018 también en 14 nm. Es decir, 11 años sin aumentar el número de cores por CPU.
Con Ryzen, AMD lo ha revolucionado todo. Ha obligado a Intel a reducir en 800$ el precio de su CPU de 10 cores (de 1800$ a 1000$ en una sola generación) y a una carrera por SKUs de hasta 18 cores. Sin duda Ryzen y Threadripper es el golpe de efecto que el progreso de la informática de consumo necesitaba.
Tanto Intel como AMD van a entrar en una dinámica de mejores precios y muy superiores prestaciones por generación de CPUs. Para el usuario final y para la evolución de las arquitecturas es una gran noticia.
Un saludo.
Blog|informaticapremium – Carlos Yus Valero.
Excelente articulo Carlos !! Ya tengo en casa un 1600X. Una maravilla.
Gaston.
Si tienes un Ryzen 5 1600X y estás satisfecho imagina un Threadripper:
16 cores en lugar de 6… Brutal!
Eso sí serán sobre unos 1000 €. Aunque podría considerarse económico pensando que un Skylake-X de 18 cores serán 2000 €…
Un saludo.
Blog|informaticapremium – Carlos Yus Valero.