miércoles, 29 de julio de 2015

AMD Zen SMT y los 14 nm – ProfessionalSAT

AMD tiene unos ambiciosos planes para 2016. Por fin abandona la arquitectura Bulldozer y además dejará de lado los 28 nm…

El problema de lanzar AMD Zen el año próximo es doble: Nueva micro arquitectura y nuevo proceso de fabricación en el mismo producto equivale extremas dificultades para llevarlo al mercado a la frecuencia objetivo.

El nodo GloFo 14 nm FinFET y AMD

Intel lleva ya dos exitosas generaciones fabricando en 22 nm (Ivy Bridge y Haswell) y hace unos meses ha empezado a lanzar su 5ª generación Core en 14 nm (Broadwell), eso sí, con 6 meses de retraso y problemas para escalar en frecuencia.

GloFo_SamsungLa asociación entre Samsung y Global Foundries para el nodo de 14 nm.

AMD, por el contrario y en pleno 2015, sigue en los 32 nm con los AMD FX de 8 INT cores y los 28 nm en toda su gama de APUs con GPU integrada.

Los 14 nm no serán tarea fácil para AMD debido al gran salto desde los 28 nm, recordemos que AMD y casi todo el resto de la industria (excepto Intel) se han saltado el nodo de los 20 – 22 nm.

Depende de múltiples factores, pero a priori la licencia del proceso de 14 nm de Samsung por parte de Global Foundries es una excelente noticia para AMD ya que desarrollar un producto en 14 nm ya lleva más de 3 años de media.

14nmLos 14 nm conllevan más de 3 años de desarrollo de producto.

El SMT en AMD Zen

La escalabilidad del SMT por thread y por core depende de la carga de trabajo: lo más común es implementar un diseño con 2 threads por core físico. Zen tendrá 3 pipelines de enteros por core (como los antiguos cores Athlon y Athlon 64 o Phenom) contrariamente a los 2 de Bulldozer y sus derivativas.

Zen, al igual que los Pentium 4 y los Core i3, Core i5 y Core i7 que integran SMT, se decantan por este diseño SMT de dos vías. Para cargas de trabajo de usuario es el valor óptimo en rendimiento IPC y en IPC por watt.

SMT aumenta las prestaciones, hablando generalmente, en entornos de ejecución que no saturan los recursos de procesamiento del core, sobretodo en los siguientes escenarios: Branch mispredictions, cache misses, accesos directos a DRAM, escrituras a RAM…

Pasar de 2 threads por core a un número superior, digamos 4, normalmente no aporta mejoras en IPC. De echo en cargas típicas es claramente más lento y aumenta la disipación térmica y la complejidad del diseño.

El incremento IPC puede llegar al 50% en casos favorables (compresión de datos con determinados algoritmos, algunos casos de multitarea…) Nada desdeñable.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

Etiquetas de Technorati: ,,,,,,,

lunes, 27 de julio de 2015

La arquitectura AMD Zen – Actualizado - ProfessionalSAT

AMD quiere lanzar en 2016 su nueva micro arquitectura Zen en el proceso de manufactura FinFET de 14 nm. Como siempre en AMD, la fabricación con alta probabilidad será confiada a Global Foundries.

amd_client_platform_roadmap 640

La teoría es que en Octubre de 2016 llegará Zen 8 cores, será un AMD FX de alta gama sin GPU. En 2017 llegarán las APUs con cores Zen Y GPU.

AMD 2016 Zen

Se ha hecho eterno pero AMD, al fin, rompe con la línea de cores Bulldozer 32 nm y sus sucesivas derivativas Piledriver 32 nm, Steamroller 28 nm y Excavator 28 nm.

Todos ellos basadas en una micro arquitectura interna poco paralela y de alta frecuencia con algunos puntos débiles muy obvios:

Solamente 2 ALUs por INT core.

1 FPU compartida para 2 cores de enteros (INT cores).

Subsistema de caché lento y de alta latencia con tamaños L1 y L2 poco lógicos.

Elevada disipación térmica.

Baja eficiencia IPC.

Zen 14 nm pretende volver a la senda de diseños alto IPC (instrucciones procesadas por ciclo) y para ello ensanchará el core pasando de 2 a 3 ALUs, un diseño reminiscente de sus anteriores y exitosos cores Athlon, Athlon XP, Athlon 64 y Phenom X4 y X6.

AMD Zen core

2016 AMD Zen 8 core 14 nm SMT 16 threads

El plan inicial de AMD es ofrecer en 2016 una CPU FX dotada de 8 cores Zen sin GPU integrada que procesará 16 threads simultáneos, dos por core.

image

La FPU contendrá 3 pipelines, igual que la de la serie Bulldozer, pero en este caso doblarán su ancho a 256 bit. Habrá el doble de unidades FPU, por cada core. Potencialmente esto significa en pico 4 veces más potencia FPU al lado de un FX8350 por core.

AMD Zen quad core

Ni la caché L2 y ni la FPU serán compartidas como en Bulldozer con otros INT cores lo que las hará más eficientes por thread.

El tamaño L2 regresa a unos más racionales 512KB por core para un total de 4 MB L2 para el chip completo octa core. Al ser la L2 única para cada core reducirá mucho su latencia y aumentará notablemente la tasa de aciertos. Debemos recordar que cada L2 servirá a dos threads debido al SMT.

El tamaño L3 será presumiblemente de 8 MB y mejorará notablemente su latencia respecto a Bulldozer, sobretodo debido a ahorrar muchos ciclos en el L2 miss.

AMD Zen IPC

AMD anuncia un incremento de un 40% en IPC respecto a la actual microarquitectura Excavator 28nm, sería un logro excelente que avivaría la añorada competencia con el gigante de los microprocesadores, Intel.

Por último mencionar la inclusión en el core Zen SMT (2 threads/core), una primicia en AMD, al estilo del Hyper Threading de Intel. Veremos como gestiona AMD la gran complejidad de implementar y validar SMT en uno de sus cores.

Zen soportará desde un inicio RAM DDR4 en socket AM4 y habrán APUs basadas en cores Zen, de hecho, AMD pretende, en un futuro próximo eliminar su línea de cores CAT de bajo consumo y hacer homogéneas todas sus plataformas bajo una microarquitectura común: Zen 14 nm.

Con Zen, todo apunta a una exitosa arquitectura, si es así AMD saldrá de sus problemas financieros y podrá centrarse en su core business, el diseño de procesadores X86 de alto rendimiento y dejarse de experimentos de rentabilidad imposible en el ultracompetitivo mercado de cores ARM.

Conclusiones preliminares

Verdaderamente la serie Bulldozer no ha sido adecuada al momento que atravesaba la industria de semiconductores, me refiero específicamente a los nodos de 32 nm y 28 nm donde AMD se ha visto bloqueada hasta el día de hoy (y estamos casi en Agosto de 2015).

En este punto, la densidad de transistores por mm2 llegaba ya a un punto en el que había que vigilar la disipación térmica por core y por unidad de superficie con mucha más atención que en el nodo de 45 nm, en cambio AMD apostó al contrario.

Bulldozer 32nmAMD Bulldozer 4 módulos 32 nm.

Diseñó Bulldozer para frecuencias sobre los 5 GHz, fue un gran fallo estratégico. (Ya en esa época lo apunté en muchos artículos). Apostaron por un diseño que era imposible hacer competitivo con las alternativas Intel...

Zen, parece que será la alternativa razonable. Buscar alto IPC no resulta sencillo pero tiene mucho más sentido que hacer cores poco eficientes en consumo y en IPC y esperar que a base de frecuencias absurdamente elevadas puedas alcanzar a los cores de la competencia, una competencia, Intel, que quizás tenga 100 veces más presupuesto de i+d y de ingenieros dedicados.

Otro asunto destacable es el uso de memoria HBM en CPUs. Lo más probable es utilizarla en APUs, estoy convencido de que será cuestión de un año o año y medio.

AMD-Carrizo-APU-Stacked-Memory 640AMD, memoria HBM RAM en APUs.

Otra cuestión es su uso en CPUs de alta gama. no lo veo probable, pues es mejor aumentar el número de cores que integrar HBM por tema de superficie.

Tengo esperanzas con AMD Zen, cosa que no pude decir de Bulldozer. Esperemos que sí llegue al mercado en 2016, AMD lo necesita y también la sana competencia.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

domingo, 16 de febrero de 2014

AMD Steamroller core. AMD Kaveri. Parte 2 – ProfessionalSAT

Os dejo aquí un enlace a la segunda parte en LowLevelHardware  de una serie en la que analizo la nueva iteración de la micro arquitectura Bulldozer, Steamroller, y las consecuencias que traerá consigo para AMD y el mercado de micro procesadores en general.

Kaveri28nmAMD Kaveri 28nm.

AMD Steamroller core. AMD Kaveri. Parte 2 – LowLevelHardware

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

Etiquetas de Technorati: ,,,,,,,,

domingo, 9 de febrero de 2014

AMD Steamroller. Introducción – ProfessionalSAT

Os dejo aquí un enlace al primer artículo en LowLevelHardware  de una serie en la que analizo la nueva iteración de la micro arquitectura Bulldozer y las consecuencias que traerá consigo para AMD y el mercado de micro procesadores en general.

AMD Steamroller. Introducción – LowLevelHardware

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

Etiquetas de Technorati: ,,,