martes, 26 de mayo de 2009

Sistemas de altas prestaciones. Core i7 920 stepping D0. Parte II – ProfessionalSAT

En este artículo voy a detallar algunos de los resultados experimentales de este sistema que estoy validando desde hace aproximadamente una semana, y del que ya hace unos días escribí un primer esbozo y en LowLevelHardware mostré pruebas preliminares en Memtest86+ 2.11 referentes a su escalada de velocidad variando la frecuencia del Uncore.

Este es el séptimo equipo Core i7 para este magnífico cliente en 2009 y va destinado a tareas críticas en las que no puede sufrir ningún error de cálculo y además su utilización será ininterrumpida durante toda su vida útil.

cpuid_FULL 3.8 GHz cores, 3.624 GHz Uncore, 1448 DDR3 7-7-7-21 1T.

De hecho, este cliente, fue uno de mis profesores en mi etapa universitaria… pero bueno, esto más bien son batallitas... Vayamos a lo importante.

Se trata de un Core i7 stepping D0 en una placa base Asus P6T con 3 GB de DDR3 1333 en triple channel. Debido al uso muy concreto al que va destinado (cálculo numérico en simulaciones matemáticas de dinámica de fluidos en condiciones de microgravedad) no necesita de más memoria.

Ocho de estos cálculos concurrentes (uno para cada CPU lógica) consumen exactamente 1 GB de RAM.

cpuid_IDLE En reposo 2172 MHz.

WinRAR 32 bit:

WRAR WinRAR eight threaded en WinXP Pro SP3.

Más de 5000 KB/s, concretamente 5315 KB/s, un resultado verdaderamente excepcional e inalcanzable para ningún otro procesador no basados en arquitectura Nehalem.

Fritz Chess Benchmark:

Fritz 14036 Knodos/s.

Fritz es un test de velocidad de enteros, no de coma flotante. A los que les guste el ajedrez y sepan de computación y algoritmos sabrán que es una prueba intensiva del mecanismo de branch prediction, con una implementación sobresaliente en Core i7.

wPrime 2.00

wPrime 32M en 6.874 s y 1024M en 210.749 s.

Este es un test eminentemente de las unidades de coma flotante y el cálculo de 1024 millones de decimales también es intensivo de memoria y caché L3.

Temperatura máxima absoluta:

P95InPlace_45h30 Pico absoluto de 74 ºC.

Para buscar el pico máximo absoluto de temperatura de procesador y tras muchas pruebas he comprobado experimentalmente que el mejor test es Prime95 en modo InPlace y con Round off Checking activado.

Este modo, de entre los tres posibles en Prime95, produce el máximo estrés, consumo y temperatura en los procesadores Core i7 con su arquitectura actual Nehalem de 45 nm.

Como vemos, tras más de 45 horas de test continuo con la torre cerrada y sin aire acondicionado el máximo fueron 74 ºC en el núcleo más caliente y 69 ºC en el de menor temperatura.

Carga concurrente RT HDR IBL y Prime 95

RTHDRIBL_P95 En este modo la temperatura máxima decrece hasta los 69 ºC.

Estas pruebas de carga combinada las ejecuto para ver la respuesta de la fuente de alimentación y medir las temperaturas internas de los distintos componentes en carga máxima.

Ancho de banda y latencia de memoria y cachés:

cachemem Captura en Everest de las prestaciones del subsistema de memoria.

Memoria RAM:

  • Lectura: 19140 MB/s
  • Escritura: 20182 MB/s
  • Copia: 18589 MB/s
  • Latencia: 30.4 ns

El término resultados excepcionales resulta escaso para números de tal calibre, sobretodo teniendo en cuenta que se trata de los módulos de memoria DDR3 más económico, los Kingston DDR3 1333 latencia 9.

Sistemas de Altas Prestaciones: GA X58-UD5. Actualizado – ProfessionalSAT

Estoy validando un sistema basado en un Core i7 920 y una excelente placa base Gigabyte GA X58-DS5 con un triple channel de 6 GB DDR3 1333.

PIC02780 Core i7 920 en Gigabyte GA X58 UD5.

Para empezar he procedido a tomar medidas de ancho de banda de memoria tras haber optimizado estrictamente todos los parámetros de la BIOS.

PIC02782 Detalle del chipset X58.

Los timings de memoria en todos los casos son 7-7-7-21 1T @ 1.64 V. Los módulos son unos simples Kingston de 2 GB DDR3 1333 9-9-9-24 2T @ 1.50 V.

Sistema con frecuencias nominales:

1Cores 2.666 GHz, Uncore 2.666 GHz, DDR3 1333.

Valores de referencia: 14667 MB/s en memoria principal y 28408 MB/s en caché L3. Obtenido con todos los componentes a frecuencias y voltajes nominales. Memoria DDR3 1333 9-9-9-24 1T @ 1.5 V.

PIC02774

Ajustes fuera de especificación:

Aumento BCLK hasta los 175 MHz y ajusto los timings de la DDR3 a 7-7-7-21 1T @ 1.64V.

Cores 3.5 GHz y DDR3 1400 MHz, voy variando la frecuencia del Uncore aumentando su multiplicador de uno en uno.

3Cores 3.5 GHz, Uncore 2.8 GHz, DDR3 1400.

4 Cores 3.5 GHz, Uncore 3.15 GHz, DDR3 1400.

5 Cores 3.5 GHz, Uncore 3.325 GHz, DDR3 1400.

Aquí tenemos el incremento de ancho de banda, de 15556 MB/s a 17157 MB/s (un 10.3 %). Cores X20, Uncore X19.

6Cores 3.5 GHz, Uncore 3.5 GHz, DDR3 1400.

Al llegar a la sincronía entre cores y uncore no apreciamos variación alguna. Seguimos aumentando el multiplicador del Uncore.

7 Cores 3.5 GHz, Uncore 3.675 GHz, DDR3 1400.

Sin variaciones relevantes.

Aumento el BCLK a 181 MHz para frecuencias de core y Uncore de 2620 MHz:

8Cores 3.620 GHz, Uncore 3.620 GHz, DDR3 1448.

Sin Turbo Mode: cores 2.62 GHz, uncore 2.62 GHz. En Windows y con Turbo Mode X21 obtenemos 3.8 GHz en los núcleos.

Intel Core i7 síncrono a 4.0 GHz:

9 Core i7 4 GHz: BCLK 200, Cores 4.0 GHz, Uncore 4.0 GHz, DDR3 1600 9-9-9-24 1T.

Únicamente se aprecia un aumento de velocidad en las cachés L1, L2 y en la L3 de 8 MB hasta los 42106 MB/s. Ésta última, como sabemos, se rige por la frecuencia del Uncore, en este caso 4 GHz.

PIC02781 Asus Triton 88.

De todos modos, nos encontramos en una zona de diminishing returns. Apenas hay diferencia de ancho de banda de memoria entre la configuración síncrona a 3.62 GHz y a 4 GHz. Esto indica una adición de latencia por parte en la CPU o la placa base (por parte de la BIOS) que detecta el BCLK elevado (a parte del aumento de timings a 9-9-9-24 1T).

PIC02783 Las memorias utilizadas: 6 GB DDR3 1333 CAS9 Kingston.

… sin duda, unos interesantes resultados que requieren análisis.

lunes, 25 de mayo de 2009

Dos Core i7. Stepping D0 y C0/C1 – ProfessionalSAT

Esta mañana he estado testeando dos sistemas, de uno de ellos ya os he hablado en un artículo de LowLevelHardware, se trata de un Core i7 D0 configurado a 3.8 GHz (X21 Turbo Mode) con el Uncore a 3.620 GHz (X20) y QPI a 6.5 GHz (multiplicador nominal).

PIC02758

El nuevo procesador stepping D0 es totalmente diferente de cara a la configuración fuera de especificación. Con mucho mayor rango de frecuencia y a voltajes más moderados. Una verdadera delicia.

PIC02754 Dos Intel Core i7: a la izquierda el D0 a 3.8, a la derecha el C0/C1 a 2.66.

El otro equipo, un C0/C1, está configurado nominalmente a 2.66 GHz con el Uncore a 2133 GHz con 6 GB de DDR3 1066 y QPI @ 4.8 GHz. Está pasando Prime 95 Blend en Windows Vista 64 para asegurar la estabilidad de la memoria después de haber pasado correctamente Memtest86+ 2.11.

PIC02759 Ventiladores cambiados en el refrigerador Noctua.

El cliente quería un “toque luminoso” y me vi obligado a cambiar los ventiladores originales por estos más coloristas:

PIC02757

En próximos artículos presentaré resultados experimentales y capturas del Sistema de Altas Prestaciones que estoy validando estos días, basado en el stepping D0, y que me llevará aproximadamente una semana más de trabajo dado el uso extremadamente exigente y continuo al que se verá sometido durante toda su vida útil, estimada en un año.

domingo, 24 de mayo de 2009

Sistemas de Altas Prestaciones. Embalado interior – ProfessionalSAT

En este artículo describo mis esfuerzos para garantizar que esta máquina llegará en perfectas condiciones a su destino ya que tiene por delante más de 500 km.

PIC02729 Sistema antes de empezar el proceso.

PIC02730 Las bahías de discos duros, arriba el VelociRaptor, debajo el Caviar Black.

PIC02731Sujeción de la ATI HD 4890 contra la fuente de alimentación Corsair.

PIC02733 Asus Triton 88 asegurado por su derecha.

PIC02732  El Triton 88 sujeto por los cuatro lados.

Debo asegurarme de que durante el transporte no hay flexiones excesivas que puedan dañar ningún elemento, hay que prestar especial atención a:

  • La tarjeta gráfica con el slot PCIEx.
  • El refrigerador Asus Triton 88 que podría dañar la placa base por su peso.

PIC02734 Otra perspectiva.

PIC02735 Amortiguación añadida para hacer presión contra la tapa lateral.

De este modo ya he hecho lo que está en mi mano, esperemos que “los señores transportistas” cumplan su función con delicadeza.

PIC02736 Ya con la tapa lateral montada.

PIC02737 Todo amortiguado y bien sujeto.

PIC02741 Otra perspectiva.

PIC02739Vista desde el ventilador de salida superior.

PIC02740 Listo para meter en el embalaje.

PIC02742 Ya dentro del embalaje.

PIC02743 Cerrada la primera caja…

PIC02744 … y la segunda.

PIC02750 En este segundo paquete va la documentación, drivers, facturas, cableado, manuales…

PIC02751 

Espero que lleguen intactos a su destino…

sábado, 23 de mayo de 2009

Sistemas de altas prestaciones. Embalado I – ProfessionalSAT

Este próximo lunes procedo al envío por correo asegurado de los dos paquetes que componen el último Sistema de Altas Prestaciones que he diseñado. Como siempre pongo un especial cuidado en el embalado del equipo y de todos los componentes para que lleguen en perfectas condiciones, pues todos sabemos que a veces los paquetes sufren más de lo necesario…

PIC02686 Con esta pieza hago la base del embalaje.

En la parte inferior añado cuatro o cinco capas de cartón a modo de amortiguación y sobre todo ello encajo la caja original.

PIC02683Ya ajustada en su posición.

En primer lugar superpongo una nueva caja de cartón reforzado sobre la caja original de la torre de modo que el cliente pueda luego desechar el embalaje adicional. Así protejo el embalaje original y además amortiguo los golpes al sistema.

PIC02691 El doble recubrimiento.

PIC02690 El embalaje exterior ya terminado con las etiquetas correspondientes.

PIC02688 Los embalajes originales reforzados con cinta y con amortiguación añadida.

PIC02692 Esta pieza es para asegurar los discos duros durante el transporte.

PIC02694Pieza de plástico transparente para asegurar posteriormente todos los componentes interiores.

PIC02693 Sobre ella, de gran dureza, irán apoyados los embalajes interiores de la torre.

En el siguiente artículo detallaré el embalaje interior de la torre, el más importante en el caso de equipos montados que tienen por delante cientos de kilómetros.

No hay que dejar nada al azar, y además de contratar una buena compañía de transporte y asegurar el envío mi tarea consiste en hacer todo lo posible para que llegue en perfectas condiciones.