jueves, 30 de septiembre de 2010

Recopilatorio: Sistemas de Altas Prestaciones - ProfessionalSAT

Como mis lectores más asiduos saben, una de mis principales ocupaciones consiste en el diseño, montaje y validación de Sistemas de Altas Prestaciones.

Son actualmente, hasta que haya disponible alguna arquitectura superior, equipos basados en procesadores Intel Core i7 (normalmente 920 / 930 / 950 / 960) configurados fuera de especificación.

Ci7_Nov2008 Desde Noviembre de 2008 migré todos mis sistemas a la arquitectura Nehalem.

Todos ellos son versiones para socket LGA 1366 con triple channel DDR3 por dos importantes razones:

  • Mayor margen y flexibilidad en frecuencia fuera de especificación..
  • Mayor capacidad de memoria al haber disponibles seis slots físicos para DDR3 en placa.

Las frecuencias a las que quedan configuradas estas máquinas con procesadores (todas ellas) basados en stepping D0 son las siguientes:

  • En cores desde los 3.6 GHz hasta los 4.2 GHz en función del nivel de exigencia del cliente y de la calidad de los componentes. El incremento máximo es de un 58 %.
  • En Uncore (caché L3 de 8 MB, controladoras de memoria) de los 3.2 a los 3.6 GHz desde los 2.13 GHz nominales con mejoras en frecuencia de hasta un 69%.

PIC03259Algunos de estos sistemas recurren a soluciones “imaginativas”.

Estos incrementos de frecuencia tan radicales aseguran unas velocidades de calculo inalcanzables para sistemas “de serie” y además, y ahí reside el “secreto” de mi trabajo, con absoluta estabilidad para un funcionamiento continuo y sin interrupción alguna.

P95_BlendPrime95 Blend, T máxima  82ºC, excelente a 4.2 GHz por aire.

Pensad que el grueso de estos sistemas (sobre un 55%) van destinados a cálculo intensivo. Se trata de cálculos en coma flotante compilados específicamente para la máquina con los últimos compiladores de Intel Fortran para arquitectura Nehalem.

Sinus8X8 threads de cálculo intensivo e ininterrumpido.

Son procesos de cálculo que se lanzan afinitizados por thread (ocho por CPU en Core i7 con HT activado) y tardan aproximadamente unos 20 días en finalizar. Por supuesto es inadmisible cualquier fallo de precisión en el cálculo o problema con el sistema.

Por este motivo, después de las fases de diseño y montaje de la máquina en cuestión (lo que me lleva de 5 a 10 días) procedo con las dos semanas de validación ininterrumpida.

PIC03858 Validación de un sistema con cuatro monitores.

Son pruebas y tests de stress destinados a explorar el límite de cada componente y a asegurar (dentro de los razonable) una ausencia de fallos posterior. El proceso me lleva sobre unas dos semanas ( a veces tres) y normalmente proceso varias máquinas en paralelo.

Mi filosofía de trabajo es sencilla: calidad extrema, perfeccionamiento continuo y máxima atención al detalle.

Entre los tests incluyo:

  • Tests single threaded de memoria en 64 bit.
  • Test multithreaded (8 hilos) de memoria 64 bit en entorno Windows 7 X64.
  • Tests de cálculo matemático en coma flotante X87.
  • Tests de cálculo matemático vectorizado SSE SIMD.
  • Tests gráficos DX9, DX10 y DX11.
  • Tests de stress de los VRM de la SVGA.
  • Tests de stress de la fuente de alimentación (variando rápidamente la carga máxima en distintas fases de la misma) con consumos pico en cada fase (12 V, 5 V, etc.)
  • Tests de temperatura máxima en cores y en cada uno de los sensores.

Durante estos días, en dos ocasiones desmonto en radiador de CPU y compruebo la huella de interfaz térmica sobre el heat spreader del procesador.

DSCF0258 Huella de pasta térmica de un Core i7 LGA1366.

Para más información de parte del software utilizado en la validación de estas máquinas recomiendo mi Blog SATSoftware.

PIC03737 reparado para empezar con los tests de memoria preliminares.

Es crítico conseguir los voltajes mínimos estables 100% en cada área (cores, uncore, QPI, DDR3, PPL, …). Solamente esta parte del proceso lleva fácilmente 3 o 4 días. Con ello se consiguen consumos y temperaturas mínimas en funcionamiento a la frecuencia objetivo, siempre con una estabilidad garantizada en cualquier escenario.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.