lunes, 11 de mayo de 2009

Sistemas de altas Prestaciones. Metodología de validación – ProfessionalSAT

Esta última semana he estado centrado en el montaje y ahora mismo en la fase de validación final, ya realizando los controles de temperaturas con ejecuciones de tests superiores a las 24h en carga 100%.

LOAD_3800_P95Blend_1h Gracias a la excelente ventilación en 1h en Prime95 Blend 8 threads no llega a 60ºC.

La primera prueba que ejecuto en un sistema nuevo es Memtest86+ durante al menos 24h en condiciones reales de funcionamiento, es decir con la torre cerrada y todos los componentes conectados.

PIC02475Memtest86+ en ejecución.

PIC02564 Otro sistema que tengo en pruebas pasando Memtest86+, ya lleva 21h.

PIC02568 A las 24h pasadas he concluido el test y he empezado con Prime95.

Si el resultado es satisfactorio procedo a la instalación desde cero del sistema operativo, en este caso un Windows Vista 64 y sus correspondientes drivers. Es en este punto cuando copio un extenso conjunto de tests y pruebas portables e instalo dos o tres que no existen en versión portable.

La primera prueba ya en el escritorio de Windows siempre es Memtest for Windows, ejecuto una instancia por núcleo / core del procesador asignando la afinidad manualmente en el administrador de tareas.

8X_Memtest Vista64 ejecutando ocho instancias de Memtest Memory Diagnostic.

Como vemos, no queda memoria libre y el uso de los ocho procesadores lógicos es plano del 100%, consiguiendo así carga máxima. Esta prueba es recomendable que dure al menos unas 12 horas.

Ahora llega el turno de los tests de procesador, tests de cálculo puro. El primero y más importante es Prime95.

LOAD_3800_P95Blend_3h10 Prime95 SFFT tras 3h y 10 minutos. Temperatura máxima 64ºC.

Prime95 es un excelente programa para poner a prueba la estabilidad de un sistema y más si opera fuera de especificación. Tiene tres modos de funcionamiento, que como explique en un artículo de SATSoftware son los siguientes:

  • Small FFTs. Fast Fourier Transformations (FFTs) de pequeño tamaño, de 8 a 64 KB. Máximo stress de las unidades de coma flotante, los datos caben en caché L2 y prácticamente no testea memoria. Este modo prueba únicamente el procesador y en menor medida la caché L2 y poco más. Uso de memoria cero. Es el mejor test de cálculo puro.
  • In-place large FFTs. FFTs de 128 a 1024 KB, en CPUs actuales (Core2Duo, Core2Quad, AMD Phenom.) los datos caben también en L2 o en su caso L3. Testea algo de memoria principal, uso de memoria 8 MB. Según los desarrolladores del software aquí se produce la mayor disipación térmica. Según mis pruebas no siempre es así.
  • Blend. Prueba concienzudamente la memoria puesto que utiliza FFTs de 8 a 4096 KB. En equipos con 2 GB utiliza unos 1750 MB de RAM. El modo de mayor disipación térmica en Athlon 64 X2 altos de gama (6000+ y 6400+).

Personalmente ejecuto sobre 24h cada test, ya que más de una vez me ha fallado a las 10 o 15h… Hay que ser estricto. Y recordar que es necesario activar la opción round off checking.

Cuando estos han concluido empiezo con las pruebas de carga combinada. Normalmente utilizo combinaciones de Prime95 con RTHDRIBL y Unigine Tropics a la vez que ejecuto desfragmentaciones de disco o escaneos del antivirus.

P95_64_Blend_RTHDRIBL Prime95 SFFT + RTHDRIBL. Carga máxima en procesadores y tarjeta gráfica.

En la captura, se ven todas las ventanas, pero la forma correcta de generar carga máxima es maximizar la ventana de RTHDRIBL. Como vemos la temperatura del core más caliente son 60ºC y la del núcleo de la ATI HD4890 58ºC con 63ºC en las controladoras de memoria GDDR5, unos excelentes resultados.

RTHDRIBL, como explico en un artículo que le dediqué, es un test de DirectX 9.0C. Como sabéis la HD4890 de este sistema es una gráfica adherida a la especificación DirectX 10.1, para probar esta característica utilizo Unigine Tropics.

Prime95SFFT UnigineTropics Carga combinada en DirectX 10.1

Como en el caso anterior hay que maximizar Unigine Tropics para obtener la carga máxima.

En estas pruebas de carga combinada máxima es importante que Prime95 esté configurado en el modo SFFT (así se ejecuta con código de las cachés L1), pues de otro modo la carga (medida como IPC) sería muy inferior debido a cache trashing en L2 y L3 y con ello también las temperaturas.

En resumen, no es tarea sencilla el asegurar la estabilidad de un sistema de esta características. Es necesario mucho tiempo, muchas horas de trabajo y dedicación y sobretodo un espíritu de investigación y mejora constante para descubrir el nuevo hardware y los nuevos métodos de validación y stress.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.