jueves, 2 de febrero de 2017

Cougar Point Intel 6 Series Chipset SATA2 bug. Actualizado – ProfessionalSAT

No debo negar mi absoluta sorpresa (ni los propios OEM lo han sabido hasta hace pocos días) al conocer el error de diseño en la circuitería de la controladora SATA2 integrada en todos los nuevos chipsets de la serie 6 de Intel (H67, P67 y sus derivados) destinados a albergar los nuevos procesadores Sandy Bridge (los stepping comerciales B2 son los afectados por el bug, no los previos A stepping que van de maravilla…)

DSCF1063Intel P67 chipset.

Efectivamente este hecho deja a Intel sin ninguna plataforma sobre la que montar sus nuevos procesadores.

Si somos poseedores de una de estas nuevas CPUs debemos intentar devolverla o reservarla hasta que, a finales de Abril o principios de Mayo, Intel tenga disponible una nueva revisión de silicio del chipset (la B3 o C) sobre la que la podamos montar.

Consideraciones personales a parte, debo resaltar que me parece extraño que un fallo de funcionamiento tan grave haya pasado desapercibido a los bien dimensionados y entrenados sistemas de validación en Intel Corp.

Esquema del chipset P67 Cougar Point.

Como antes he comentado son todas las placas base a la venta las afectadas por el bug y esto ha forzado a Intel y a todos sus partners (OEMs y fabricantes de placas base) a realizar un recall masivo de todos estos componentes.

A nadie se le escapa que todos estos acontecimientos son un balón de oxígeno inesperado para AMD, que está pasando ciertas dificultades en llevar a producción masiva sus dos nuevos diseños de 32 nm fabricados en Global Foundries, Llano y su nueva microarquitectura Bulldozer.

Todos recordamos el desafortunado TLB bug que lastró gravemente a AMD y retrasó la salida al mercado de los procesadores Phenom de 65 nm (core Barcelona) y que, por otra parte, le costó ingentes cantidades de dinero.

La explicación de Intel

Intel define el fallo como una degradación progresiva y continua de la tasa de errores de transmisión en las líneas SATA2 integradas en los chipsets de la serie 6.

imagehttp://www.intel.com/support/chipsets/sb/CS-032263.htm

Inicialmente esto se puede notar en un progresivo deterioro del rendimiento de las operaciones del sistema de archivos sobre los dispositivos conectados en los cuatro puertos SATA2 nativos de la placa base debido a una tasa de errores de bit elevada que inicialmente se soluciona mediante correcciones ECC.

Posteriormente llegará a una degradación tal que sea necesario retransmitir los datos, desde el disco a la controladora o viceversa al hallarse corrupción en los datos, con la consiguiente reducción de rendimiento en tiempos de acceso y en transferencia.

En un último estadio podemos llegar a perder una unidad de disco (su letra) en Windows durante el normal uso de nuestro PC dando lugar a errores de escritura demorada y finalmente incluso a la no detección del dispositivo durante las rutinas de arranque de la placa base (POST).

Debo agregar que en mi experiencia personal, cuando se dan frecuentes retransmisiones de datos (retries) debidas a errores de transmisión (corrupción de datos) se acorta claramente la vida del disco duro por trabajar fuera de especificación (no han sido diseñados para tal caso excepcional).

La explicación técnica oficial

Se trata de un mal diseño en una de las máscaras que se utilizan en las últimas etapas de litografía del wafer de silicio con tecnología de 65 nm. Posteriormente tras el corte de los chips formarán cada uno de ellos un chipset de la serie 6.

Es un típico caso de electromigración. Según Intel, han localizado un transistor perteneciente al árbol de distribución de reloj (clock tree) de la controladora SATA2 que tiene un espesor de gate demasiado bajo provocando un leakage excesivo. Sencillamente, se fugan electrones a través del transistor y conforme utilizamos la controladora SATA2 se deterioran sus características eléctricas más y más…

P67

Conclusiones y algunas consideraciones

No existe solución milagrosa para el problema (ni parches en BIOS ni nada), así que la única opción ha sido retirar todos los chipsets afectados del mercado e intentar, lo más rápido posible, fabricar un sustituto sin fallos. Esto será un hecho seguramente a finales de Abril o principios de mayo, hasta entonces no hay Sandy Bridge…

En resumen, a día de hoy no existe plataforma para los nuevos procesadores Sandy bridge, con lo que quedan dos opciones: los excelentes Core i7 de la serie 900 o los magníficos AMD Phenom II X6 de seis cores nativos.

Por suerte algunos afortunados gozan de early samples de chipsets P67 stepping A libres del error que funcionan a la perfección y con absoluta estabilidad… lo que yo me pregunto es como en un stepping posterior ha aparecido este fallo “de la nada”.

Como moraleja de la historia quizás deberíamos todos reflexionar acerca, valga la redundancia, de la calidad de los controles de calidad que se aplican en la actualidad en todos los ámbitos.

Fritz_2600K_NominalResultados como este desafortunadamente tendrán que esperar a Abril o Mayo…

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

Bibliografía complementaria:

Datasheet: http://www.intel.com/Assets/PDF/datasheet/324645.pdf

Themal Design guide: http://www.intel.com/Assets/PDF/designguide/324647.pdf

Specification update: http://www.intel.com/Assets/PDF/specupdate/324646.pdf

Políticas de los fabricantes de placas base:

ASUS: http://event.asus.com/2011/SandyBridge/notice/

GigaByte: http://gigabytedaily.blogspot.com/2011/02/intel-6-series-chipset-issues-q.html

ASRock: http://www.asrock.com/news/events/201102ex/index.html

Carlos Yus Valero – informaticapremium      informaticapremium-logo-150px