viernes 11 de febrero de 2011

Intel Sandy Bridge: Análisis de situación – ProfessionalSAT

Los nuevos procesadores Sandy Bridge están marcados desde hace escasos días por la desaparición de una plataforma estable sobre la que desplegar sus increíbles prestaciones fruto de una nueva evolución de la microarquitectura de procesadores X86 de Intel.

Actualización 13 febrero: Intel ha anunciado que mañana día 14 enviará los primeros chips B3 (corregidos) a sus partners: Intel Series 6 chipsets stepping B3 – ProfessionalSAT

Echa un vistazo a mi nuevo artículo sobre microarquitectura del procesador Sandy Bridge en LowLevelHardware: Intel Core i7 2600 K. Análisis cachés L0i 6 KB y L3 unificada 8 MB – LowLevelHardware

DSCF1075Chipset Intel P67 con el radiador retirado.

El bug en los chipsets de la Serie 6 va a costar a Intel al menos 1000 millones de dólares en gastos inmediatos, más el obligatorio desarrollo a marchas forzadas de un segundo stepping comercial posterior al defectuoso B2 y su puesta en el mercado en el tiempo mínimo imprescindible.

DSCF1070Asus P8P67 con el chipset descubierto.

Debo decir que Intel ha hecho lo que debía hacer después de conocerse la noticia aunque en mi opinión abogo por unos tests masivos de sistemas reales y con entornos software reales replicando utilizaciones típicas de usuarios finales aunque con cargas de trabajo más extremas, léase repetitivas.

Por ejemplo tests con trazas repetitivas continuas de acceso a disco en modos secuenciales y aleatorios utilizando por ejemplo el excelente Intel I/O Meter.

Sin duda con prueba similares a las apuntadas, en un periodo de tiempo razonable y con un número de sistemas reducido se puede validar con confiabilidad esta parte de la plataforma.

DSCF1071Perspectiva de la Asus P8P67 con el chipset P67 en primer plano.

Quizás se ha dado por echo que no podían haber errores en algo tan probado en generaciones anteriores de los chipset Intel como las controladoras SATA2 de 300 MB/s… un gran error.

Intel debe replantearse ahora su estrategia comercial, Sandy Bridge sigue siendo el mejor procesador actual en cualquier métrica, prestaciones absolutas o prestaciones per watt, pero necesita un nuevo lanzamiento comercial que borre la mancha que ha supuesto este fallo de diseño y el consiguiente retraso en 3 o 4 meses de su comercialización efectiva, un cuatrimestre completo.

Qué nos depara 2011

En Abril o principios de mayo estarán disponibles los chipsets corregidos de la serie 6, las gamas H67 y P67 junto con sus derivativas. Algo después surgirá el Z68, el representante de la alta gama para Sandy Bridge en socket LGA 1155.

IntelZ68El futuro Z68.

No sé si Intel decidirá mover ficha en el apartado económico y abaratar algo los procesadores o los chipsets para atraer clientes alarmados por el error en el stepping B2 del chipset. No sería nada descabellado.

Para finales de año y si no cambian los planes se esperan los procesadores hexa y octal core nativos (un solo die) sin GPU integrada y con hasta cuatro canales de 64 bit DDR3 con el nuevo socket LGA 2011. Será sin duda un procesador excepcional en todos los aspectos.

IvyBridge22nmIvy Bridge es el próximo Tick en la cadencia de Intel.

Igualmente, para finales de año espero Engineering Samples de Intel Ivi Bridge 22 nm, el sustituto de Sandy Bridge. Con un incremento en número de cores, algunas mejoras microarquitecturales menores y un aumento de caché L3.

AMD en 2011

El retraso de Sandy Bridge da un respiro a su rival, AMD, que está inmerso en la producción de dos nuevos diseños: Llano y Bulldozer, ambos fabricados en 32 nm SOI por Global Foundries.

AMD_Llano_coreDie de uno de los cores de Llano 32 nm.

Llano es una derivativa de los cores AMD K10.5 de los AMD Phenom II de 45 nm trasladada a 32 nm con bastantes mejoras en su microarquitectura e incluirá una GPU integrada de un diseño e implementación similar a la actual AMD 5650, aunque creo que el bloque UVD derivara de las Radeon 6000.

AMD_K10.6_32nmUno de los cores de 32 nm de llano junto con su L2 de 1 MB.

Lo más probable es que integre unos 400 SPs, que serán de la clásica arquitectura Vec5 de AMD / ATI. Estará dotado de dos canales DDR3 y espero una gran mejora en el terreno de la gestión de acceso a RAM, pues le va a hacer falta, sobretodo en frecuencia y load balancing.

Para un análisis más a fondo de Llano, os recomiendo mi artículo de LowLevelHardware de Julio de 2010.

Bulldozer_manipulado630Fotografía manipulada del die de AMD Orochi, el primer chip de arquitectura Bulldozer.

Sobre Bulldozer, largo y tendido he escrito sobre él en varios de mis Blogs, incluso he especulado extensamente sobre sus prestaciones:

La microarquitectura de AMD Bulldozer. Actualizado - LowLevelHardware
Intel Core i7 SMT vs. AMD Bulldozer CMT – LowLevelHardware

Cluster_multithreadingEl concepto original de CMT.

Algunos datos extra sobre AMD Bulldozer. Actualizado – ProfessionalSAT
Bulldoxer_4module_8int_cores_L3shared_630AMD octal core Zambezi 32 nm SOI.
AMD Bulldozer. Prestaciones estimadas – LowLevelHardware

slide3[1]Prestaciones estimadas en Abril de 2009 por AMD para Interlagos.

Microarquitectura AMD Bulldozer 2011. Actualizado – LowLevelHardware

Bulldozer_serverAMD Bulldozer, la próxima microarquitectura.

Previo AMD Bulldozer. Actualizado – LowLevelHardware

GloFo32nmEl proceso de 32 nm va a traer muchas novedades al portafolio de CPUs de AMD.

Novedades y expectativas 2010. Actualizado – LowLevelHardware

AMD_CPU_roadmap_2010Roadmap de AMD para 2011.

AMD Bulldozer – ProfessionalSAT

Modulo2Uno de los módulos de AMD Orochi, el primer integrante de la familia Bulldozer.

Conclusiones

2011 va a ser un año muy interesante pues van a legar al mercado varias microarquitecturas nuevas. En el caso de AMD, desde 2003 no nos sorprendía con un diseño de core radicalmente nuevo (desde el Athlon 64).

Ahora mismo estoy trabajando en el análisis microarquitectural de los cores de ejecución de Sandy Bridge y en su diseño de caches de datos e instrucciones.

Sobretodo me estoy centrando en la medición de latencia y anchos de banda por ciclo y en la misteriosa caché de microinstrucciones de la que ya he desentrañado algunos de sus secretos más llamativos.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

miércoles 2 de febrero de 2011

Cougar Point Intel 6 Series Chipset SATA2 bug. Actualizado – ProfessionalSAT

No debo negar mi absoluta sorpresa (ni los propios OEM lo han sabido hasta hace pocos días) al conocer el error de diseño en la circuitería de la controladora SATA2 integrada en todos los nuevos chipsets de la serie 6 de Intel (H67, P67 y sus derivados) destinados a albergar los nuevos procesadores Sandy Bridge (los stepping comerciales B2 son los afectados por el bug, no los previos A stepping que van de maravilla…)

DSCF1063Intel P67 chipset.

Efectivamente este hecho deja a Intel sin ninguna plataforma sobre la que montar sus nuevos procesadores.

Si somos poseedores de una de estas nuevas CPUs debemos intentar devolverla o reservarla hasta que, a finales de Abril o principios de Mayo, Intel tenga disponible una nueva revisión de silicio del chipset (la B3 o C) sobre la que la podamos montar.

Consideraciones personales a parte, debo resaltar que me parece extraño que un fallo de funcionamiento tan grave haya pasado desapercibido a los bien dimensionados y entrenados sistemas de validación en Intel Corp.

Esquema del chipset P67 Cougar Point.

Como antes he comentado son todas las placas base a la venta las afectadas por el bug y esto ha forzado a Intel y a todos sus partners (OEMs y fabricantes de placas base) a realizar un recall masivo de todos estos componentes.

A nadie se le escapa que todos estos acontecimientos son un balón de oxígeno inesperado para AMD, que está pasando ciertas dificultades en llevar a producción masiva sus dos nuevos diseños de 32 nm fabricados en Global Foundries, Llano y su nueva microarquitectura Bulldozer.

Todos recordamos el desafortunado TLB bug que lastró gravemente a AMD y retrasó la salida al mercado de los procesadores Phenom de 65 nm (core Barcelona) y que, por otra parte, le costó ingentes cantidades de dinero.

La explicación de Intel

Intel define el fallo como una degradación progresiva y continua de la tasa de errores de transmisión en las líneas SATA2 integradas en los chipsets de la serie 6.

imagehttp://www.intel.com/support/chipsets/sb/CS-032263.htm

Inicialmente esto se puede notar en un progresivo deterioro del rendimiento de las operaciones del sistema de archivos sobre los dispositivos conectados en los cuatro puertos SATA2 nativos de la placa base debido a una tasa de errores de bit elevada que inicialmente se soluciona mediante correcciones ECC.

Posteriormente llegará a una degradación tal que sea necesario retransmitir los datos, desde el disco a la controladora o viceversa al hallarse corrupción en los datos, con la consiguiente reducción de rendimiento en tiempos de acceso y en transferencia.

En un último estadio podemos llegar a perder una unidad de disco (su letra) en Windows durante el normal uso de nuestro PC dando lugar a errores de escritura demorada y finalmente incluso a la no detección del dispositivo durante las rutinas de arranque de la placa base (POST).

Debo agregar que en mi experiencia personal, cuando se dan frecuentes retransmisiones de datos (retries) debidas a errores de transmisión (corrupción de datos) se acorta claramente la vida del disco duro por trabajar fuera de especificación (no han sido diseñados para tal caso excepcional).

La explicación técnica oficial

Se trata de un mal diseño en una de las máscaras que se utilizan en las últimas etapas de litografía del wafer de silicio con tecnología de 65 nm. Posteriormente tras el corte de los chips formarán cada uno de ellos un chipset de la serie 6.

Es un típico caso de electromigración. Según Intel, han localizado un transistor perteneciente al árbol de distribución de reloj (clock tree) de la controladora SATA2 que tiene un espesor de gate demasiado bajo provocando un leakage excesivo. Sencillamente, se fugan electrones a través del transistor y conforme utilizamos la controladora SATA2 se deterioran sus características eléctricas más y más…

P67

Conclusiones y algunas consideraciones

No existe solución milagrosa para el problema (ni parches en BIOS ni nada), así que la única opción ha sido retirar todos los chipsets afectados del mercado e intentar, lo más rápido posible, fabricar un sustituto sin fallos. Esto será un hecho seguramente a finales de Abril o principios de mayo, hasta entonces no hay Sandy Bridge…

En resumen, a día de hoy no existe plataforma para los nuevos procesadores Sandy bridge, con lo que quedan dos opciones: los excelentes Core i7 de la serie 900 o los magníficos AMD Phenom II X6 de seis cores nativos.

Por suerte algunos afortunados gozan de early samples de chipsets P67 stepping A libres del error que funcionan a la perfección y con absoluta estabilidad… lo que yo me pregunto es como en un stepping posterior ha aparecido este fallo “de la nada”.

Como moraleja de la historia quizás deberíamos todos reflexionar acerca, valga la redundancia, de la calidad de los controles de calidad que se aplican en la actualidad en todos los ámbitos.

Fritz_2600K_NominalResultados como este desafortunadamente tendrán que esperar a Abril o Mayo…

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

Bibliografía complementaria:

Datasheet: http://www.intel.com/Assets/PDF/datasheet/324645.pdf

Themal Design guide: http://www.intel.com/Assets/PDF/designguide/324647.pdf

Specification update: http://www.intel.com/Assets/PDF/specupdate/324646.pdf

Políticas de los fabricantes de placas base:

ASUS: http://event.asus.com/2011/SandyBridge/notice/

GigaByte: http://gigabytedaily.blogspot.com/2011/02/intel-6-series-chipset-issues-q.html

ASRock: http://www.asrock.com/news/events/201102ex/index.html