martes 26 de mayo de 2009

Sistemas de altas prestaciones. Core i7 920 stepping D0. Parte II – ProfessionalSAT

En este artículo voy a detallar algunos de los resultados experimentales de este sistema que estoy validando desde hace aproximadamente una semana, y del que ya hace unos días escribí un primer esbozo y en LowLevelHardware mostré pruebas preliminares en Memtest86+ 2.11 referentes a su escalada de velocidad variando la frecuencia del Uncore.

Este es el séptimo equipo Core i7 para este magnífico cliente en 2009 y va destinado a tareas críticas en las que no puede sufrir ningún error de cálculo y además su utilización será ininterrumpida durante toda su vida útil.

cpuid_FULL 3.8 GHz cores, 3.624 GHz Uncore, 1448 DDR3 7-7-7-21 1T.

De hecho, este cliente, fue uno de mis profesores en mi etapa universitaria… pero bueno, esto más bien son batallitas... Vayamos a lo importante.

Se trata de un Core i7 stepping D0 en una placa base Asus P6T con 3 GB de DDR3 1333 en triple channel. Debido al uso muy concreto al que va destinado (cálculo numérico en simulaciones matemáticas de dinámica de fluidos en condiciones de microgravedad) no necesita de más memoria.

Ocho de estos cálculos concurrentes (uno para cada CPU lógica) consumen exactamente 1 GB de RAM.

cpuid_IDLE En reposo 2172 MHz.

WinRAR 32 bit:

WRAR WinRAR eight threaded en WinXP Pro SP3.

Más de 5000 KB/s, concretamente 5315 KB/s, un resultado verdaderamente excepcional e inalcanzable para ningún otro procesador no basados en arquitectura Nehalem.

Fritz Chess Benchmark:

Fritz 14036 Knodos/s.

Fritz es un test de velocidad de enteros, no de coma flotante. A los que les guste el ajedrez y sepan de computación y algoritmos sabrán que es una prueba intensiva del mecanismo de branch prediction, con una implementación sobresaliente en Core i7.

wPrime 2.00

wPrime 32M en 6.874 s y 1024M en 210.749 s.

Este es un test eminentemente de las unidades de coma flotante y el cálculo de 1024 millones de decimales también es intensivo de memoria y caché L3.

Temperatura máxima absoluta:

P95InPlace_45h30 Pico absoluto de 74 ºC.

Para buscar el pico máximo absoluto de temperatura de procesador y tras muchas pruebas he comprobado experimentalmente que el mejor test es Prime95 en modo InPlace y con Round off Checking activado.

Este modo, de entre los tres posibles en Prime95, produce el máximo estrés, consumo y temperatura en los procesadores Core i7 con su arquitectura actual Nehalem de 45 nm.

Como vemos, tras más de 45 horas de test continuo con la torre cerrada y sin aire acondicionado el máximo fueron 74 ºC en el núcleo más caliente y 69 ºC en el de menor temperatura.

Carga concurrente RT HDR IBL y Prime 95

RTHDRIBL_P95 En este modo la temperatura máxima decrece hasta los 69 ºC.

Estas pruebas de carga combinada las ejecuto para ver la respuesta de la fuente de alimentación y medir las temperaturas internas de los distintos componentes en carga máxima.

Ancho de banda y latencia de memoria y cachés:

cachemem Captura en Everest de las prestaciones del subsistema de memoria.

Memoria RAM:

  • Lectura: 19140 MB/s
  • Escritura: 20182 MB/s
  • Copia: 18589 MB/s
  • Latencia: 30.4 ns

El término resultados excepcionales resulta escaso para números de tal calibre, sobretodo teniendo en cuenta que se trata de los módulos de memoria DDR3 más económico, los Kingston DDR3 1333 latencia 9.

Sistemas de Altas Prestaciones: GA X58-UD5. Actualizado – ProfessionalSAT

Estoy validando un sistema basado en un Core i7 920 y una excelente placa base Gigabyte GA X58-DS5 con un triple channel de 6 GB DDR3 1333.

PIC02780 Core i7 920 en Gigabyte GA X58 UD5.

Para empezar he procedido a tomar medidas de ancho de banda de memoria tras haber optimizado estrictamente todos los parámetros de la BIOS.

PIC02782 Detalle del chipset X58.

Los timings de memoria en todos los casos son 7-7-7-21 1T @ 1.64 V. Los módulos son unos simples Kingston de 2 GB DDR3 1333 9-9-9-24 2T @ 1.50 V.

Sistema con frecuencias nominales:

1Cores 2.666 GHz, Uncore 2.666 GHz, DDR3 1333.

Valores de referencia: 14667 MB/s en memoria principal y 28408 MB/s en caché L3. Obtenido con todos los componentes a frecuencias y voltajes nominales. Memoria DDR3 1333 9-9-9-24 1T @ 1.5 V.

PIC02774

Ajustes fuera de especificación:

Aumento BCLK hasta los 175 MHz y ajusto los timings de la DDR3 a 7-7-7-21 1T @ 1.64V.

Cores 3.5 GHz y DDR3 1400 MHz, voy variando la frecuencia del Uncore aumentando su multiplicador de uno en uno.

3Cores 3.5 GHz, Uncore 2.8 GHz, DDR3 1400.

4 Cores 3.5 GHz, Uncore 3.15 GHz, DDR3 1400.

5 Cores 3.5 GHz, Uncore 3.325 GHz, DDR3 1400.

Aquí tenemos el incremento de ancho de banda, de 15556 MB/s a 17157 MB/s (un 10.3 %). Cores X20, Uncore X19.

6Cores 3.5 GHz, Uncore 3.5 GHz, DDR3 1400.

Al llegar a la sincronía entre cores y uncore no apreciamos variación alguna. Seguimos aumentando el multiplicador del Uncore.

7 Cores 3.5 GHz, Uncore 3.675 GHz, DDR3 1400.

Sin variaciones relevantes.

Aumento el BCLK a 181 MHz para frecuencias de core y Uncore de 2620 MHz:

8Cores 3.620 GHz, Uncore 3.620 GHz, DDR3 1448.

Sin Turbo Mode: cores 2.62 GHz, uncore 2.62 GHz. En Windows y con Turbo Mode X21 obtenemos 3.8 GHz en los núcleos.

Intel Core i7 síncrono a 4.0 GHz:

9 Core i7 4 GHz: BCLK 200, Cores 4.0 GHz, Uncore 4.0 GHz, DDR3 1600 9-9-9-24 1T.

Únicamente se aprecia un aumento de velocidad en las cachés L1, L2 y en la L3 de 8 MB hasta los 42106 MB/s. Ésta última, como sabemos, se rige por la frecuencia del Uncore, en este caso 4 GHz.

PIC02781 Asus Triton 88.

De todos modos, nos encontramos en una zona de diminishing returns. Apenas hay diferencia de ancho de banda de memoria entre la configuración síncrona a 3.62 GHz y a 4 GHz. Esto indica una adición de latencia por parte en la CPU o la placa base (por parte de la BIOS) que detecta el BCLK elevado (a parte del aumento de timings a 9-9-9-24 1T).

PIC02783 Las memorias utilizadas: 6 GB DDR3 1333 CAS9 Kingston.

… sin duda, unos interesantes resultados que requieren análisis.

lunes 25 de mayo de 2009

Dos Core i7. Stepping D0 y C0/C1 – ProfessionalSAT

Esta mañana he estado testeando dos sistemas, de uno de ellos ya os he hablado en un artículo de LowLevelHardware, se trata de un Core i7 D0 configurado a 3.8 GHz (X21 Turbo Mode) con el Uncore a 3.620 GHz (X20) y QPI a 6.5 GHz (multiplicador nominal).

PIC02758

El nuevo procesador stepping D0 es totalmente diferente de cara a la configuración fuera de especificación. Con mucho mayor rango de frecuencia y a voltajes más moderados. Una verdadera delicia.

PIC02754 Dos Intel Core i7: a la izquierda el D0 a 3.8, a la derecha el C0/C1 a 2.66.

El otro equipo, un C0/C1, está configurado nominalmente a 2.66 GHz con el Uncore a 2133 GHz con 6 GB de DDR3 1066 y QPI @ 4.8 GHz. Está pasando Prime 95 Blend en Windows Vista 64 para asegurar la estabilidad de la memoria después de haber pasado correctamente Memtest86+ 2.11.

PIC02759 Ventiladores cambiados en el refrigerador Noctua.

El cliente quería un “toque luminoso” y me vi obligado a cambiar los ventiladores originales por estos más coloristas:

PIC02757

En próximos artículos presentaré resultados experimentales y capturas del Sistema de Altas Prestaciones que estoy validando estos días, basado en el stepping D0, y que me llevará aproximadamente una semana más de trabajo dado el uso extremadamente exigente y continuo al que se verá sometido durante toda su vida útil, estimada en un año.

domingo 24 de mayo de 2009

Sistemas de Altas Prestaciones. Embalado interior – ProfessionalSAT

En este artículo describo mis esfuerzos para garantizar que esta máquina llegará en perfectas condiciones a su destino ya que tiene por delante más de 500 km.

PIC02729 Sistema antes de empezar el proceso.

PIC02730 Las bahías de discos duros, arriba el VelociRaptor, debajo el Caviar Black.

PIC02731Sujeción de la ATI HD 4890 contra la fuente de alimentación Corsair.

PIC02733 Asus Triton 88 asegurado por su derecha.

PIC02732  El Triton 88 sujeto por los cuatro lados.

Debo asegurarme de que durante el transporte no hay flexiones excesivas que puedan dañar ningún elemento, hay que prestar especial atención a:

  • La tarjeta gráfica con el slot PCIEx.
  • El refrigerador Asus Triton 88 que podría dañar la placa base por su peso.

PIC02734 Otra perspectiva.

PIC02735 Amortiguación añadida para hacer presión contra la tapa lateral.

De este modo ya he hecho lo que está en mi mano, esperemos que “los señores transportistas” cumplan su función con delicadeza.

PIC02736 Ya con la tapa lateral montada.

PIC02737 Todo amortiguado y bien sujeto.

PIC02741 Otra perspectiva.

PIC02739Vista desde el ventilador de salida superior.

PIC02740 Listo para meter en el embalaje.

PIC02742 Ya dentro del embalaje.

PIC02743 Cerrada la primera caja…

PIC02744 … y la segunda.

PIC02750 En este segundo paquete va la documentación, drivers, facturas, cableado, manuales…

PIC02751 

Espero que lleguen intactos a su destino…

sábado 23 de mayo de 2009

Sistemas de altas prestaciones. Embalado I – ProfessionalSAT

Este próximo lunes procedo al envío por correo asegurado de los dos paquetes que componen el último Sistema de Altas Prestaciones que he diseñado. Como siempre pongo un especial cuidado en el embalado del equipo y de todos los componentes para que lleguen en perfectas condiciones, pues todos sabemos que a veces los paquetes sufren más de lo necesario…

PIC02686 Con esta pieza hago la base del embalaje.

En la parte inferior añado cuatro o cinco capas de cartón a modo de amortiguación y sobre todo ello encajo la caja original.

PIC02683Ya ajustada en su posición.

En primer lugar superpongo una nueva caja de cartón reforzado sobre la caja original de la torre de modo que el cliente pueda luego desechar el embalaje adicional. Así protejo el embalaje original y además amortiguo los golpes al sistema.

PIC02691 El doble recubrimiento.

PIC02690 El embalaje exterior ya terminado con las etiquetas correspondientes.

PIC02688 Los embalajes originales reforzados con cinta y con amortiguación añadida.

PIC02692 Esta pieza es para asegurar los discos duros durante el transporte.

PIC02694Pieza de plástico transparente para asegurar posteriormente todos los componentes interiores.

PIC02693 Sobre ella, de gran dureza, irán apoyados los embalajes interiores de la torre.

En el siguiente artículo detallaré el embalaje interior de la torre, el más importante en el caso de equipos montados que tienen por delante cientos de kilómetros.

No hay que dejar nada al azar, y además de contratar una buena compañía de transporte y asegurar el envío mi tarea consiste en hacer todo lo posible para que llegue en perfectas condiciones.

jueves 21 de mayo de 2009

Sistemas de altas prestaciones. Core i7 920 stepping D0 – ProfessionalSAT

Hoy empiezo las pruebas preliminares de un sistema basado en el nuevo stepping del procesador Intel Core i7 920, ya hice un pequeño comentario sobre esta nueva revisión del núcleo Nehalem en LowLevelHardware.

Para un análisis de las prestaciones y capacidad de incremento de frecuencia de este procesador remito a un artículo de hoy mismo en LowLevelHardware en el que analizo la influencia del reloj del uncore en el ancho de banda de memoria y la velocidad de la caché L3 de 8 MB.

PIC02616 Los preciados procesadores  Core i7 stepping D0.

Como he señalado en varias ocasiones, estas máquinas van destinadas a un tipo de cliente muy exigente y con un perfil de usuario muy concreto:

“Serán máquinas destinadas a cálculo continuo y paralelo sin interrupciones en simulaciones numéricas. Lo que requiere total exactitud y precisión en los resultados, además de la máxima velocidad (cada cálculo son unas dos semanas y media) y no se puede permitir el más mínimo error.”

Hay que tener en cuenta que estos sistemas tratan con datos importantes y sus resultados tienen que tener garantía de validez.

PIC02617 En LowLevelHardware enseñé a distinguir el D0 del anterior stepping C0/C1.

Una característica sobresaliente de esta nueva revisión es su mayor potencial de frecuencia no solo en núcleos sino también en el uncore, es decir, las controladoras de memoria y caché L3 de 8 MB unificada.

PIC02627 i7 920 D0 ya en la placa base.

Como Asus y muchos otros fabricantes acostumbran a hacer, en esta placa base (una P6T) han cubierto parte del disipador del chipset X58 con una lámina de aluminio. He procedido a eliminarla y le he buscado una mejor ubicación.

PIC02634 El radiador del North Bridge de la P6T.

En este caso es un simple disipador de aluminio azul con un heat pipe que discurre hasta los reguladores de voltaje, pero dado su diseño, y en combinación con el ventilador elegido (un Asus Triton 88) es muy eficiente y mantiene al X58 a buenas temperaturas incluso en overclock.

PIC02631 Pese a su pequeño tamaño goza de una buena área de disipación.

PIC02633 Otra vista.

PIC02636 Vista general de la placa base.

PIC02635 Radiador del South Bridge ICH10.

PIC02643 El radiador del chipset X58 refrigerado por el caudal proveniente del Triton 88.

La temperatura de este radiador son unos meros 45ºC gracias al “chorro de aire” que incide directamente sobre él proveniente del ventilador del Asus Triton 88. Temperaturas medidas con sensor IR.

PIC02639 Pasando los primeros tests de memoria.

PIC02641 Tras unas 24h procederé a la instalación de sistema y empezaré las pruebas en Windows.

Es un placer diseñar sistemas de este calibre y más cuando son para clientes que saben apreciar la calidad y un trabajo bien hecho.

miércoles 20 de mayo de 2009

Consumo sistema Core i7 fuera de especificación – ProfessionalSAT

Estos días estoy ultimando la validación de un Sistema de Altas Prestaciones sobre el que ya he escrito varios artículos.

PIC02485

Entre las pruebas finales incluyo medidas reales de consumo en varios escenarios. La medida es en el enchufe a 220V, es decir, teniendo en cuenta las pérdidas en la fuente de alimentación. Este es el consumo total y real del sistema.

Recordemos la configuración de esta máquina:

  • Torre Cooler Master HAF RC 932 KKN1 GP
  • Placa base Asus P6T DeLuxe V2
  • Host Clock 175 MHz
  • Procesador Intel Core i7 920 @ 3.675 GHz 1.30 V
  • Uncore / caché L3 @ 2.8 GHz 1.25 V
  • Refrigerador de procesador Asus Triton 88 regulado
  • Pasta térmica Artic Cooling MX2
  • Memoria: 3 módulos de 2 GB DDR3 @ 1400 7-7-7-21-1T 1.62 V para un total de 6 GB
  • Tarjeta Gráfica ATI Radeon HD4890 1GB GDDR5
  • Sistema operativo Windows Vista 64 Home Basic
  • Disco duro 1: WD 1500HLFS 150 GB VelociRaptor 10000 rpm
  • Disco duro 2: WD 1001FALS 1 TB Caviar Black 7200 rpm
  • Lector BluRay grabador DVD Pioneer
  • Lector multitarjetas
  • Fuente Corsair TX 750W
  • Consumos medidos:

    Image1

    Fuente OFF: interruptor de la fuente de alimentación en OFF.

    Fuente ON: interruptor de la fuente de alimentación en ON.

    BIOS: sistema en la BIOS sin actividad.

    Idle Vista64: en el escritorio de Vista64 en reposo.

    RT HDR IBL: test de DirecX9.0C para la ATI HD4890.

    FurMark Stress: Test de DirectX10.1 para la ATI HD 4890. Máximo stress gráfico.

    Perfect Disk: consumo desfragmentando el VelociRaptor 150GB.

    P95 SFFT, P95 InPlace, P95 Blend: Tests de Prime95.

    P95 SFFT, P95 InPlace, P95 Blend + FurMark: tests de carga combinada máxima.

    imageCore i7 a 3675 MHz con 6 GB y ATI HD4890.

    Como vemos, este equipo, ya en el escritorio de Vista64 consume unos respetables 171W debido a su diseño fuera de especificación y al consumo ya en reposo de la ATI HD 4890 que ronda los 65 – 90 W.

    En cuanto lanzamos un cálculo intensivo como Prime95 saltamos a unos 285W (114W más) siendo este un test puro de procesador. Al ejecutar P95 Blend utilizamos más la memoria RAM por los tamaños de FFTs y llegamos a los 295 W. Y en caso de P95 InPlace obtenemos el consumo máximo del procesador con 301W con una intensísima actividad de la caché L3.

    RT HDR IBL no es capaz de apurar la capacidad de la ATI HD 4890, ya que es un test de DirectX9.0C. Aunque es cierto que lo ejecuté por defecto y podía haber endurecido algo sus requerimientos.

    FurMark en cambio, al ser DirectX10.1 y por haber utilizado el modo de máximo stress llegó a los 273 W de consumo con un aire de salida de la SVGA realmente caliente. La temperatura máxima de la GPU fueron 64ºC, un excelente resultado que habla positivamente de la ventilación del sistema.

    Y llegamos a los modos de stress combinado de Prime95 en sus diferentes modos y Furmark con pico en los 426W.

    lunes 18 de mayo de 2009

    Disipadores con heat pipes direct touch – ProfessionalSAT

    Hace unos días apareció un cliente con problemas de temperatura en su sistema y de modo excepcional no era por exceso de suciedad o mal mantenimiento.

    Nunca me han gustado, por razones objetivas, los disipadores de procesador con contacto directo entre los heat pipes de cobre y el heat spreader del procesador.

    PIC02574 Disipador con contacto directo con los heatpipes. Corrosión del aluminio (manchas grisáceas).

    Las dos razones que me llevan a no recomendarlos son las siguientes:

    • Un rendimiento térmico menor.
    • Aparición de corrosión en la interfase disipador-procesador.

    La corrosión se aprecia por la presencia de manchas de color gris oscuro de óxido de aluminio en la huella de la interfaz térmica.

    PIC02576 La alúmina es un mal conductor térmico.

    PIC02577 Restos de óxido de aluminio sobre el procesador.

    El sistema del cliente presentaba temperaturas anormalmente elevadas con un disipador y ventilador perfectamente limpios, lo que me hizo sospechar de un problema con la interfaz térmica.

    PIC02579 Otra vista.

    Tras limpiar tanto el procesador como la base del refrigerador de CPU y aplicar pasta térmica de nuevo recuperó las temperaturas nominales.

    PIC02581 Base del disipador tras la limpieza.

    De todos modos alerté al cliente sobre que este fenómeno reaparecería en el futuro y que la única solución era sustituir el disipador por un modelo diferente con base de cobre pasivado con zinc.

    martes 12 de mayo de 2009

    Sistemas de altas prestaciones. Mejora de refrigeración – ProfessionalSAT

    El equipo del que trata este artículo es de los primeros sistemas Core i7 que he montado, data de finales de 2008. Dadas las circunstancias de entonces era muy difícil conseguir sistemas de ventilación adecuados y el cliente decidió configurarlo con el ventilador original Intel. Además, la torre era de su anterior equipo, el primer Core2Duo que monté, allá por 2006.

    Puntualizar que este sistema no está configurado fuera de especificación sino a frecuencias nominales, en parte por las limitaciones de disipación térmica.

    PIC02523 Core i7 920. El sistema con el ventilador original Intel.

    Este equipo solo cuenta con 2 GB de DDR3 1333MHz en dos canales, como SVGA una ATI HD4850 512 MB y dos discos duros SATA2 de 500 GB. Aunque parezca una configuración extraña, está adaptado a las necesidades del cliente y pensad que a finales de 2008 el precio de la memoria DDR3 no era ni mucho menos el actual…

    PIC02528 ATI HD4850. La suciedad habitual en la SVGA.

    PIC02531 Intel DX58SO. Otra vista del sistema de refrigeración.

    Como podéis imaginar, con semejante ventilador, el procesador Core i7 920 subía a temperaturas insoportables en carga máxima. Lo primero que hice fue cambiar el ventilador de salida de 12 cm por uno nuevo Xilence (se aprecia en la primera fotografía) y cambié una de las tapas de las bahía de los dispositivos ópticos por una perforada.

    PIC02526 Tapa perforada para permitir mayor flujo de entrada.

    Y ya en Windows me dispuse a tomar las temperaturas iniciales en carga máxima con el ventilador estándar.

    TEMP_IDLE_FREQSTD1600_INTELREF Core i7 920 con ventilador estándar Intel en reposo.

    Como vemos, en el escritorio sin carga de proceso, mantiene unas temperaturas satisfactorias de 35 a 42 ºC. Esto es debido al muy superior diseño de clock gating y la desconexión completa de los cores inactivos en los Intel Core i7.

    Apliquemos estrés en las ocho CPUs lógicas con Prime95:

    TEMP_LOAD_FREQSTD2800_INTELREFEn carga 100%, en solo cinco minutos estamos ya en 75 – 79 ºC. Inaceptable.

    Los procesadores core i7 sufren de una disipación térmica extrema que pone en aprietos hasta a los sistemas de refrigeración más refinados, no digamos al pequeño ventilador referencia Intel.

    PIC02533 Triton 88 sobre el referencia Intel. No es lo mismo…

    PIC02542Como vemos la superficie de disipación no es ni por asomo parecida.

    Me dispuse a sustituir el minúsculo y claramente insuficiente ventilador referencia por un flamante Asus Triton 88.

    PIC02532 El pequeño refrigerador trabajaba al límite de su capacidad.

    PIC02544 Huella de interfaz térmica. Nada más desmontar el disipador.

    PIC02537 Se aprecia perfectamente la forma ovalada dejada por las zonas de mayor disipación.

    Los procesadores Core i7, como detallé en un artículo anterior, por su peculiar geometría con los cuatro núcleo en línea distribuye el flujo calorífico a lo largo del heat spreader como vemos aquí:

    i7

    Transparencia del die de Nehalem.

    PIC02540 La huella en el núcleo de cobre del disipador es similar.

    PIC02534 Asus Triton 88. Seis heatpipes dobles y mucha superficie de disipación.

    PIC02545 Una limpieza exhaustiva del procesador…

    PIC02553 Triton 88 ya montado en la placa del cliente.

    Cambio de interfaz térmica del North Bridge:

    Viendo el estado de la pasta del procesador y sabiendo que el chipset Intel X58 alcanza temperaturas cercanas a los 100ºC en torres con ventilación deficiente decidí, ya que tenía la placa base desmontada, cambiar la interfaz térmica. Para ello utilicé Artic Cooling MX2.

    PIC02549 Disipador de aluminio del X58 en la Intel DX58SO.

    PIC02547 X58 al desnudo, todavía con los restos de thermal pad. Se aprecia un hot spot en el centro del die.

    PIC02548 Restos de thermal pad en el disipador.

    PIC02548b Detalle.

    PIC02551 El X58 limpio y listo para aplicar la interfaz térmica.

    PIC02555Tras el montaje y una limpieza general…

    PIC02559 Todo ya montado y listo para pasar los tests de estabilidad.

    PIC02560 Como vemos, en esta torre el Triton 88 entra verdaderamente muy ajustado.

    PIC02562 Dos sistemas Core i7 en paralelo, muy diferentes pero con puntos en común.

    Pruebas térmicas:

    TEMP_LOAD_FREQSTD2800_TRITON88_1H40 Ya con el Triton 88 y en las mismas condiciones tras 1h y 40min de Prime95.

    Las temperaturas de los núcleos en carga 100% han disminuido más de 30ºC. Con el ventilador estándar a los 15 minutos llegaba a unos 86ºC y subiendo, ahí decidí abortar el test. Según Intel, la temperatura crítica para los procesadores Core i7 se sitúa en los 100ºC.

    Con carga combinada Prime95 y RTHDRIBL:

    TEMP_LOAD RTHDRIBL_FREQSTD2800_TRITON88 Sobre 60ºC.

    La temperatura de los cores bajaba al ejecutar concurrentemente Prime 95 junto a RTHDRIBL, ya que bajaba el IPC por polución de cachés.

    TEMP_LOAD RTHDRIBL_FREQSTD2800_TRITON88_ALQUITARRTHDRIBL Nada más cerrar RTHDRIBL se produce un aumento leve de temperatura en cores.

    lunes 11 de mayo de 2009

    Sistemas de altas Prestaciones. Metodología de validación – ProfessionalSAT

    Esta última semana he estado centrado en el montaje y ahora mismo en la fase de validación final, ya realizando los controles de temperaturas con ejecuciones de tests superiores a las 24h en carga 100%.

    LOAD_3800_P95Blend_1h Gracias a la excelente ventilación tras más de 1h en Prime95 Blend ocho threads no llega a los 60ºC.

    La primera prueba que ejecuto en un sistema nuevo es Memtest86+ durante al menos 24h en condiciones reales de funcionamiento, es decir con la torre cerrada y todos los componentes conectados.

    PIC02475Memtest86+ en ejecución.

    PIC02564 Otro sistema que tengo en pruebas pasando Memtest86+, ya lleva 21h.

    PIC02568 A las 24h pasadas he concluido el test y he empezado con Prime95.

    Si el resultado es satisfactorio procedo a la instalación desde cero del sistema operativo, en este caso un Windows Vista 64 y sus correspondientes drivers. Es en este punto cuando copio un extenso conjunto de tests y pruebas portables e instalo dos o tres que no existen en versión portable.

    La primera prueba ya en el escritorio de Windows siempre es Memtest for Windows, ejecuto una instancia por núcleo / core del procesador asignando la afinidad manualmente en el administrador de tareas.

    8X_Memtest Vista64 ejecutando ocho instancias de Memtest Memory Diagnostic.

    Como vemos, no queda memoria libre y el uso de los ocho procesadores lógicos es plano del 100%, consiguiendo así carga máxima. Esta prueba es recomendable que dure al menos unas 12 horas.

    Ahora llega el turno de los tests de procesador, tests de cálculo puro. El primero y más importante es Prime95.

    LOAD_3800_P95Blend_3h10 Prime95 SFFT tras 3h y 10 minutos. Temperatura máxima 64ºC.

    Prime95 es un excelente programa para poner a prueba la estabilidad de un sistema y más si opera fuera de especificación. Tiene tres modos de funcionamiento, que como explique en un artículo de SATSoftware son los siguientes:

    • Small FFTs. Fast Fourier Transformations (FFTs) de pequeño tamaño, de 8 a 64 KB. Máximo stress de las unidades de coma flotante, los datos caben en caché L2 y prácticamente no testea memoria. Este modo prueba únicamente el procesador y en menor medida la caché L2 y poco más. Uso de memoria cero. Es el mejor test de cálculo puro.
    • In-place large FFTs. FFTs de 128 a 1024 KB, en CPUs actuales (Core2Duo, Core2Quad, AMD Phenom.) los datos caben también en L2 o en su caso L3. Testea algo de memoria principal, uso de memoria 8 MB. Según los desarrolladores del software aquí se produce la mayor disipación térmica. Según mis pruebas no siempre es así.
    • Blend. Prueba concienzudamente la memoria puesto que utiliza FFTs de 8 a 4096 KB. En equipos con 2 GB utiliza unos 1750 MB de RAM. El modo de mayor disipación térmica en Athlon 64 X2 altos de gama (6000+ y 6400+).

    Personalmente ejecuto sobre 24h cada test, ya que más de una vez me ha fallado a las 10 o 15h… Hay que ser estricto. Y recordar que es necesario activar la opción round off checking.

    Cuando estos han concluido empiezo con las pruebas de carga combinada. Normalmente utilizo combinaciones de Prime95 con RTHDRIBL y Unigine Tropics a la vez que ejecuto desfragmentaciones de disco o escaneos del antivirus.

    P95_64_Blend_RTHDRIBL Prime95 SFFT + RTHDRIBL. Carga máxima en procesadores y tarjeta gráfica.

    En la captura, se ven todas las ventanas, pero la forma correcta de generar carga máxima es maximizar la ventana de RTHDRIBL. Como vemos la temperatura del core más caliente son 60ºC y la del núcleo de la ATI HD4890 58ºC con 63ºC en las controladoras de memoria GDDR5, unos excelentes resultados.

    RTHDRIBL, como explico en un artículo que le dediqué, es un test de DirectX 9.0C. Como sabéis la HD4890 de este sistema es una gráfica adherida a la especificación DirectX 10.1, para probar esta característica utilizo Unigine Tropics.

    Prime95SFFT UnigineTropics Carga combinada en DirectX 10.1

    Como en el caso anterior hay que maximizar Unigine Tropics para obtener la carga máxima.

    En estas pruebas de carga combinada máxima es importante que Prime95 esté configurado en el modo SFFT (así se ejecuta con código de las cachés L1), pues de otro modo la carga (medida como IPC) sería muy inferior debido a cache trashing en L2 y L3 y con ello también las temperaturas.

    En resumen, no es tarea sencilla el asegurar la estabilidad de un sistema de esta características. Es necesario mucho tiempo, muchas horas de trabajo y dedicación y sobretodo un espíritu de investigación y mejora constante para descubrir el nuevo hardware y los nuevos métodos de validación y stress.

    domingo 10 de mayo de 2009

    Sistemas de altas prestaciones. Validación nocturna - ProfessionalSAT

    Las pruebas necesarias para la validación de un equipo de estas características deben de ser continuas para representar un worst case scenario o peor escenario posible.

    PIC02519 Jugando con la exposición de la cámara…

    Se trata de producir el estrés máximo en todos los elementos para provocar el fallo si alguna pieza es defectuosa y detectar fallos de cálculo en el procesador, memoria y placa base fuera de especificación antes de ser entregado al cliente final.

    Es un proceso que he ido refinando con los años y puedo decir con orgullo que de todos los sistemas de estas características que he entregado ninguno ha tenido fallo alguno en su vida útil.

    PIC02521

    También debo añadir que el tipo de cliente al que van dirigidos estos sistemas de altas prestaciones realiza un mantenimiento esmerado y una limpieza a fondo de todos los elementos, en especial ventiladores, rejillas y disipadores – radiadores.

    sábado 9 de mayo de 2009

    Sistemas de altas prestaciones. Montaje – ProfessionalSAT

    Hoy, por fin, he procedido al montaje de este sistema al que ya he dedicado los dos últimos artículos.

    PIC02504Cooler Master HAF RC 932 KKN1 GP, así cualquiera monta sin problemas…

    Os recuerdo los componentes del equipo:

    • Torre Cooler Master HAF RC 932 KKN1 GP
    • Placa base Asus P6T DeLuxe V2
      • Host Clock 175 MHz
    • Procesador Intel Core i7 920 @ 3.675 GHz 1.30 V
      • Uncore / caché L3 @ 2.8 GHz 1.25 V
    • Refrigerador de procesador Asus Triton 88 regulado
    • Pasta térmica Artic Cooling MX2
    • Memoria: 3 módulos de 2 GB DDR3 @1400 7-7-7-21-1T 1.62 V para un total de 6 GB
    • Tarjeta Gráfica ATI Radeon HD4890 1GB GDDR5
    • Sistema operativo Windows Vista 64 Home Basic
    • Disco duro 1: WD 1500HLFS 150 GB VelociRaptor 10000 rpm
    • Disco duro 2: WD 1001FALS 1 TB Caviar Black 7200 rpm
    • Lector BluRay grabador DVD Pioneer
    • Lector multitarjetas
    • Fuente Corsair TX 750W

    En primer lugar he cambiado el modo de montaje de la fuente de alimentación para favorecer su refrigeración y evitar ruidos por transmisión de vibraciones al chasis.

    PIC02476 He retirado las dos chapas perforadas para aumentar el caudal de aire hacia la fuente.

    PIC02477Como vemos, limitan el paso de aire.

    PIC02478 Las chapas desmontadas.

    PIC02480 Fuente Corsair TX750W ya montada.

    PIC02479 Apoyada sobre dos amortiguadores de goma, totalmente estable y mejor refrigerada.

    PIC02502 Vista trasera del montaje de la fuente de alimentación.

    Un aspecto crucial en el montaje de un sistema de altas prestaciones es el enrutado de los cables y el orden exquisito en el interior del equipo. Esto favorece un mantenimiento rápido y un flujo de aire laminar, evitando ruidos ya que no aparecen turbulencias.

    PIC02496 Enrutado del cableado por la parte lateral trasera de la torre.

    PIC02497 Detalle del guiado de cables a la salida de la fuente.

    PIC02498 Distribución del cableado a sus destinos respectivos.

    PIC02499 Enrutado de la parte superior.

    A la izquierda los cables del panel frontal (cuatro USB, audio, eSATA, Firewire, leds, power switch y reset) y al  lector BluRay alimentación y cable SATA.

    PIC02491 Interior del sistema. Totalmente libre de cables.

    Un montaje limpio es la clave para una correcta refrigeración. La calidad es lo primero y hay que ser estrictos con el orden, en caso de problemas será mucho más sencillo solucionarlos.

    PIC02483 Los cables corren paralelos y pegados a las chapas.

    Los cables importantes que pueden llevar a confusión van etiquetados, como los cuatro cables SATA de datos.

    PIC02508 Vista desde arriba del ventilador de entrada de 23 cm en rojo.

    PIC02509 PIC02514 El frontal de la torre sin el lector de tarjetas.

    PIC02513 El sistema mientras ejecuta Prime95 en Vista64.

    PIC02501 Excelente ventilación de salida para la ATI HD4890 1 GB GDDR5.

    PIC02503 Perspectiva de la gran torre.

    PIC02515 Pasando tests junto a otro Core i7 del que hablaré en un próximo artículo.

    PIC02506 Espacio, espacio por todas partes, la placa base queda sobradamente holgada.

    PIC02485 Otra vista.

    Sinceramente merece la pena invertir en la Cooler Master los 150€ que cuesta si vamos a diseñar un sistema potente. Su refrigeración es excelente y hay espacio de sobras para lo que queramos montar, incluso sistemas de refrigeración líquida.

    PIC02482 Detalle del cableado sobrante de la fuente.

    PIC02487 Cinco bahías de discos, en la segunda el VelociRaptor, en la cuarta el Caviar Black.

    PIC02488 ¡Cuanto espacio libre!

    PIC02490 La HD4890 a sus anchas.

    PIC02489 No es de extrañar que mantenga en carga temperaturas muy moderadas…

    A modo de recapitulación, hoy he concluido el montaje e instalación de sistema operativo con drivers. He llevado a cabo una optimización preliminar del sistema que incluye:

    • Optimización de registro.
    • Desfragmentación de disco.
    • Creación de fichero de intercambio al principio de la primera partición del VelociRaptor.
    • Desfragmentación de metadatos , MFZ, zona MFT y ficheros de sistema.
    • Desactivación de servicios innecesarios de Windows Vista.
    • Optimización de arranque.

    Ahora estoy de lleno en la validación en cuanto a estabilidad y temperaturas. He empezado con Prime95 Blend Round off Checking y simultáneamente Unigine Tropics en modo DirectX 10.1 con AA 8X y filtro anisotrópico AF 16X Trilinear, además, a la vez estoy pasando tests completos a los dos discos duros.

    Así consigo una carga 100% en los ocho núcleos y de la tarjeta gráfica, forzando así mismo la fuente de alimentación con un consumo máximo.

    En pocas palabras, un verdadero placer.

    jueves 7 de mayo de 2009

    Sistemas de altas prestaciones. WD VelociRaptor y Caviar Black. Actualizado – ProfessionalSAT

    En este equipo hemos conseguido reunir muchos de los mejores componentes del mercado para conformar un sistema de altas prestaciones.

    PIC02473 ATI HD4890 1 GB GDDR5.

    PIC02443 Varios de los componentes de esta máquina.

    PIC02437Los discos duros elegidos, WD VelociRaptor (izquierda) y WD Caviar Black (derecha)

    El disco duro actualmente más rápido del mercado en formato SATA2 es el WD VelociRaptor de 10Krpm y por ello lo elegimos para este sistema. Como disco de almacenamiento nos hemos decidido por el WD Caviar Black de 1 TB y 7200 rpm. Con esta elección obtenemos un excelente compromiso entre velocidad y capacidad.

    Particularmente, el VelociRaptor es una joya tecnológica con tiempos de acceso sobre los 4 ms (!!) gracias a sus 10000 rpm debido a su excelente diseño mecánico y sus avanzados algoritmos de caché y NCQ.

    PIC02445 P6T: Southbridge sin la tapa “decorativa” de los señores de Asus.

    PIC02447Asus Triton 88: 12 heatpipes y gran superficie de disipación.

    PIC02444 Los 6 módulos de 2 GB DDR3 Kingston a 1.50V para un total de 12 GB a 1.4 GHz.

    Como la memoria trabaja establemente a un voltaje de 1.50V no es necesario el uso de ningún sistema de ventilación específico. Su temperatura de funcionamiento es realmente baja.

    PIC02449 La gigantesca Torre Cooler Master HAF RC 932 KKN1 GP.

    PIC02452 Vista interior y de la tapa lateral.

    La torre, además de ir sobrada de espacio, tiene una ventilación soberbia. Ya de serie cuenta con cuatro ventiladores y con filtros anti polvo. Su precio ronda los 150€ sin fuente de alimentación.

    PIC02453 Detalle del ventilador de la tapa lateral.

    PIC02454 El ventilador superior y el trasero.

    PIC02456 Detalle del frontal con los filtros anti polvo en las bahías de los lectores.

    PIC02457 La zona de las bahías de discos duros y el ventilador frontal de entrada.

    PIC02458 La parte inferior, donde se aloja la fuente de alimentación con espacio para ventiladores adicionales.

    PIC02459Hasta las tapas traseras van perforadas.

    PIC02461 El enorme ventilador de salida superior. Puede sustituirse por dos menores.

    PIC02462 La P6T con el Core i7 y los 12 GB parecen “de juguete” al lado de la Cooler Master.

    PIC02463 Primer plano de la placa y los discos duros.

    Ya llevo dos días con el proceso de validación fuera de la torre y cuando todo esté listo y ajustado, procederé al montaje definitivo y me dedicaré finalmente a las pruebas de temperatura y estabilidad en condiciones reales que me llevan sobre una semana.

    PIC02472 Ajustando la cámara para apreciar los 8 leds blancos bajo el South Bridge.

    PIC02471  Una vista de mi “laboratorio”, cada milímetro es oro.

    En total, en una semana y media o dos confío en tenerlo todo listo y entregarlo al cliente, que seguramente ya está ansioso…

    Actualizado. 08 Marzo 2009:

    Hoy he dedicado la tarde a realizar pruebas comparativas con configuraciones de 6GB y 12 GB. Por ahora me decanto por los 6 GB por su mayor velocidad.

    Con solo 1 DIMM por canal los procesadores Core i7 pueden utilizar el ajuste de 1T para las tres controladoras DDR3. Esto, unido a que es posible reducir los timings a 7-7-7-21 permite un aumento en ancho de banda y una notable reducción en la latencia media.

    PIC024756 GB DDR3 1400 7-7-7-21 1T con tres DIMM de 2 GB Kingston.

    Con 12 GB se obtienen 13158 MB/s comparados con los 15555 MB/s en la configuración de 6 GB, esto supone un incremento de un 18.2 %, nada despreciable teniendo en cuenta que son los mismos módulos.

    En principio y para las necesidades de este cliente en particular, me decanto por la configuración de 6 GB.

    PIC02474  Durante las pruebas de esta tarde.

    A lo largo de este fín de semana procederé al montaje en la torre y empezaré ya las pruebas de temperatura en carga máxima de procesador y tarjeta gráfica.

    miércoles 6 de mayo de 2009

    Sistemas de altas prestaciones. Core i7 y ATI 4890 - ProfessionalSAT

    Estos días estoy inmerso en el diseño, montaje y validación de un sistema de alta gama para un nuevo cliente. Se trata de un reto importante por algunas de las circunstancias de este pedido así como por la particularidad de alguna de sus piezas.

    PIC02415

    Componentes del sistema:

    • Torre Cooler Master HAF RC 932 KKN1 GP
    • Procesador Intel Core i7 920
    • Placa base Asus P6T DeLuxe V2
    • Refrigerador de procesador Asus Triton 88
    • Pasta térmica Artic Cooling MX2
    • Memoria: 6 módulos de 2 GB DDR1333 1.50 V
    • Tarjeta Gráfica ATI Radeon HD4890 1GB GDDR5
    • Sistema operativo Windows Vista 64 Home Basic
    • Disco duro 1: WD 1500HLFS 150 GB VelociRaptor 10000 rpm
    • Disco duro 2: WD 1001FALS 1 TB Caviar Black 7200 rpm
    • Lector BluRay grabador DVD SONY
    • Lector multitarjetas
    • Fuente Corsair TX 750W

    PIC02412 La extremadamente rápida ATI HD 4890.

    Como todos los sistemas de altas prestaciones, éste está configurado fuera de especificación del siguiente modo:

    • Cores @ 3.5 GHz / 3.675 GHz Turbo Mode (X21) 1.2750 V
    • Uncore clock / Frecuencia L3: 2.8 GHz 1.20 V
    • Memoria @ DDR3 1400 MHz a solo 1.50 V
    • Timings y voltajes ajustados manualmente

     

    PIC02422 Memtest86+ con 12 GB triple channel 8-8-8-24-2T @ 1400 MHz.

    Al ser una configuración con 12 GB de memoria no es posible configurar el Command Rate de la memoria a 1T, debiéndome conformar con 2T. Los timings elegidos han sido 8-8-8-24-2T con una frecuencia efectiva DDR3 1400 MHz, los nominales son 9-9-9-24-2T # 1333 MHz.

    Sin duda, solamente con 6 GB, sería estable un 7-7-7-21 1T consiguiendo un mayor ancho de banda de memoria, pero como todos los que manejamos procesadores Nehalem sabemos, no supone ninguna mejora significativa.

    PIC02375Memtest86+ con 6 GB triple channel 7-7-7-21-1T @ 1400 MHz.

    Los procesadores Core i7, si de algo van sobrados, es de ancho de banda de memoria (bandwidth) y además con una latencia que ronda los 30 ns.

    El sistema desde el que escribo estas lineas, un C2Q 9770 @ 3.4 GHz con un dual channel DDR2 1066 5-5-5-5-15 2N @ 1.95 V y Performance Level 5 llega a unos excelentes 54.5 ns de latencia gracias al Hardware Prefectch y a Memory Disambiguation.

    Todas estas tecnologías siguen presentes en Core i7, refinadas y ampliadas, pero lo que dispara las prestaciones son sus tres controladoras DDR3 integradas.

    PIC02413 Ventilador sobre los 6 DIMM DDR3 durante el test de memoria.

    PIC02414 Otra vista.

    PIC02416 Disipador del South Bridge al aire.

    Como es mi costumbre en las placas Asus P6T, retiro el “bonito” embellecedor del radiador (en la imagen superior a la derecha) del southbridge para permitirle disipar el calor. Lo que, en principio, debería de ser su función, aunque ya se sabe el poder de los departamentos de Marketing…

    PIC02417North Bridge con pasta térmica en lugar del Thermal Pad.

    Como describí en un artículo anterior, se aprecia una importante mejora de temperatura al sustituir el thermal pad original por pasta térmica de calidad en el chipset Intel X58 de la serie P6T de Asus.

    PIC018661_thumb El thermal pad original.

    Tengo bastante trabajo por delante, calculo unas dos semanas…