jueves, 19 de marzo de 2009

Core i7 940@3.83 GHz con 6 GB DDR3 1666 MHz – ProfessionalSAT

En este equipo he buscado los límites en refrigeración por aire de un Core i7 940 con memorias Patriot DDR3 1600. He sido conservador con los voltajes para no dañar un procesador de más de 500€ a la vez que mantenemos la estabilidad absoluta del sistema. Como sistema operativo, el cliente escogió Vista64.

PIC02021 El sistema Core i7 940 en funcionamiento.

La frecuencia final del Core i7 940 ha sido de 3.66 GHz y 3.83 MHz en Turbo Mode Multithreaded. Como sabéis, los últimas CPUs de Intel aumentan su frecuencia automáticamente uno o dos multiplicadores del siguiente modo:

Single Threaded: Con carga máxima en solo un core aumentan dos multiplicadores.

Multi Threaded: En cambio, si se da carga máxima de proceso en dos o más CPUs lógicas aumenta en uno el multiplicador.

En la práctica el Turbo Mode Single Threaded suele no ser efectivo, o no aparece o lo hace furtivamente por décimas de segundo. Es similar al modo IDA de los Core2 portátiles.

PIC01997El flamante Core i7 940

Configuración nominal del sistema:

Placa base ASUS P6T DeLuxe OC Palm Edition Intel X58

Procesador Intel Core i7 940 8 MB L3 2.93 / 3.06 / 3.20 GHz

Controladora de memoria y caché L3 @ 2.13 GHz

Kit de 6 GB de memoria Patriot DDR3 1600 9-9-9-24 2T 1.65V

ATI Radeon HD4870 1GB GDDR5

F/A Corsair TX 750W

Disco duro Western Digital  1 TB

Windows Vista x64

Refrigerador Asus Triton 88

He aumentado el Host Bus de los 133 nominales a 166 MHz, consiguiendo así un aumento de frecuencia a 3.66 GHz nominales y 3.83 GHz en Turbo Mode en Windows con carga 100 % de ocho threads en Prime95 Blend y SFFT.

Frecuencias y voltajes estables finales:

Procesador Intel Core i7 940 8 MB L3 3.66 / 3.83 / 4.00 GHz 1.350 V

Controladora de memoria y caché L3 @ 3.33 GHz 1.325V

Kit de 6 GB de memoria Patriot DDR3 @ 1666 8-8-8-24 1T 1.66V

ATI Radeon HD4870 @ 780 MHz 1GB GDDR5 4.4 GHz

PIC02019Core i7 @ 3.66 GHz: 18 GB/s en Memtest86+ 2.11

Como vemos en Memtest86+ no está activo el Turbo Mode, solo funciona dentro de Windows.

Los procesadores Core i7 de primera hornada, es decir los primeros steppings que se encuentran actualmente en el mercado, llegan a unos 3.8 GHz con refrigeración convencional y sin excederse con los voltajes. En este artículo lo podemos comprobar …

Aumentar más la frecuencia desde ahí es una carrera sin retorno hacia voltajes prohibitivos y temperaturas superiores a los 90ºC, sin duda no compensa. Un camino seguro hacia la electromigración, sobre la que algún día publicaré un extenso artículo. (5 de Abril 2012. por fin publiqué el artículo…)

PIC02001 La Asus P6T Deluxe OC Palm Edition, un verdadero juguete …

El OC Palm se conecta a la placa base mediante un cable USB y permite realizar overclock en Windows pulsando sobre los botones del accesorio y también monitorizar el hardware (temperaturas, voltajes y ventiladores). Un juguetito … aunque yo personalmente prefiero ajustar personal y manualmente la BIOS.

PIC02004 La ATI HD4870 @ 780 MHz con 1 GB GDDR5 @ 4400 MHz.

Pese a ser una tarjeta gráfica que ya lleva una larga temporada en el mercado, la HD4870 de ATI sigue siendo una excelente opción para gamers y más en su versión de 1GB GDDR5,  además … con el overclock aplicado obtenemos prestaciones excelentes.

PIC02011 El excelente Asus Tritón 88 con seis heatpipes dobles.

Lo primero en “experimentos” con procesadores fuera de especificación es asegurar una buena refrigeración y un suministro de corriente suficiente y estable. Por ello he recurrido al impresionante y gigantesco Asus Triton 88, que soporta tres de 12 cm ventiladores: dos adicionales  en push-pull al central que ya incorpora de serie.

PIC02024 La impresionante por su rendimiento, potencia y conexiones Corsair 750TX.

En las fuentes de alimentación no solo es importante la potencia máxima admisible y la estabilidad de la alimentación en cada uno de los voltajes sino también el rendimiento. El rendimiento es el porcentaje de potencia que alimenta al sistema sobre la potencia total consumida por la fuente en el enchufe.

Las buenas fuentes superan el 80% y esto se nota sobretodo en su muy inferior emisión térmica.

PIC02026Los cuatro conectores PCIEx de 8 pines de la Corsair TX750.

PIC02022 Asus P6T-Deluxe OC-Palm: tres fases de alimentación para la memoria.

PIC02035 Sin ventiladores adicionales mantuvo unos 68ºC máximos en Prime95 SFFT.

PIC02032 Quizás era gracias al “pequeño” ventilador de la tapa lateral …

PIC02031 … a la espera de montar el trasero de 12 cm.

PIC02012 Asus Triton 88: me ha causado una buena impresión …

… En breve tengo que diseñar tres sistemas de altas prestaciones para cálculo científico basados en Core i7 920, creo que me inclino por este magnifico refrigerador sobre el Noctua LGA1366.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

viernes, 6 de marzo de 2009

Revisión del segundo sistema de altas prestaciones - ProfessionalSAT

El segundo de los equipos, en la línea del primero también basado en un Intel Core2Quad esta vez de la serie 9000, está diseñado con las máximas prestaciones en mente y  el menor ruido de ventiladores posible. Estos días estoy procediendo a su revisión y configuración con algunos pequeños cambios.

Componentes utilizados:

  • Core2Quad Q9550 @ 3400 MHz FSB400 1.300 V
  • Asus P5K-E WiFi-AP iP35 FSB@1600
  • 4 GB de DDR2 800 Kingston @ 1066 5-5-5-15 2N 2.0V
  • Refrigerador Artic Cooling modificado con ventilador Noctua 12 cm
  • F/A 300W (!!) modificada ventilador Noctua 12 cm
  • Pasta térmica MX2 de Artic Cooling
  • Performance Level 5
  • Timings y ajustes optimizados

En este artículo me centraré en la “especial” refrigeración del sistema,

PIC02082

Una pareja de “Noctuas”.

Utilizando los excelentes (y no baratos) ventiladores austríacos Noctua NF-P12 con un diseño optimizado para la máxima eficiencia aseguro unas temperaturas contenidas con un bajísimo nivel sonoro.

PIC02086

El Artic Cooling Freezer7 es un verdadero fuera de serie aun con su recortado tamaño, sustituyendo su ventilador original por el NF-P12 logramos un excelente equilibrio y un mucho menor nivel sonoro.

El ventilador de la torre no es necesario hasta que la temperatura exterior ronda los 25 – 28 ºC, y se montó introduciendo aire para crear presión positiva dentro de la caja para evacuar adecuadamente el calor de la SVGA (una ATI HD 4850 512 MB GDDR3).

Empíricamente se demostró más eficiente esta opción que haberlo montado extrayendo aire como es norma.

PIC02088

Además con  el ventilador montado inclinado y descentrado obtenemos un importante flujo de aire sobre el chipset y sobre los módulos Kingston HyperX @ 1066 MHz.

PIC02087

En la fuente de alimentación realicé en su día ciertas “mejoras”, entre ellas la sustitución del ventilador original y la optimización del flujo de aire interno. De este modo y gracias a que es un modelo de gran calidad es posible alimentar a este sistema con solo 300W, pues otro de los requisitos del cliente además del bajo nivel sonoro fue un bajísimo consumo y disipación térmica.

El ventilador de la F/A es controlado por la placa base mediante el software SpeedFan, girando solamente a las revoluciones necesarias en función de las temperaturas.

PIC02092

Noctua NF-U12P montado sobre el Artic Cooling Freezer7.

Hoy ambos sistemas siguen pasando el banco de tests de estabilidad para ser entregados al cliente este próximo Lunes. Podéis preguntar vuestras dudas o dar vuestra opinión en los comentarios.

Etiquetas de Technorati: ,,,,,

jueves, 5 de marzo de 2009

Mantenimiento de dos sistemas de altas prestaciones. Primer sistema - ProfessionalSAT

Esta tarde he llevado a cabo la primera parte del mantenimiento programado de dos sistemas que llevaban realizando cálculos matemáticos ininterrumpidos durante seis y nueve meses respectivamente.

Esta revisión incluye desmontaje de las placas base para comprobar deformaciones o daños en cualquier integrado, una limpieza exhaustiva, cambio de la pasta térmica y testeo general del sistema para devolverlo al cliente y reanudar su trabajo.

PIC02090

Configuración:

  • Core2Quad Q6600 Stepping G0 Hand Picked @ 3600 MHz FSB400 1.3875V
  • Gigabyte GA-P35 DS3R iP35 FSB@1600
  • 4 GB de DDR2 800 Kingston @ 800 MHz 4-4-4-12 2N 2.0 V
  • Refrigerador Scythe Ninja 6 heatpipes dobles
  • Ventilador Scythe 12 cm
  • Pasta térmica MX2 de Artic Cooling
  • Performance Level 5
  • Timings y ajustes optimizados

PIC02074

Vista general con el enorme Scythe Ninja.

PIC02079

El ventilador de 12 cm.

PIC02070

Scythe Ninja: además de silencioso es muy eficiente a bajas rpm (1200).

Gracias a las láminas de aluminio con una gran separación entre ellas el Ninja es un disipador optimizado para ventiladores de pocas rpm, ya que el flujo de aire atraviesa todo el radiador aun con poca presión.

PIC02071

Ocho puertos SATA. Una de las razones para escoger esta placa base.

PIC02073

Los dos canales Kingston HyperX DDR2 800 4-4-4-12 2N 2.0V.

Para un análisis a fondo sobre la configuración de un sistema similar basado en un Intel P35 y un Core2Quad os remito a SATSoftware: Memset 4.0: Optimización extrema Intel Core2Quad P35. Actualizado – SATSoftware.

PIC02081

Posicioné el ventilador de manera no muy ortodoxa.

Así conseguía refrigerar también el North Bridge del Intel P35, recordemos que está trabajando a 1600 MHz y da servicio a cuatro cores a 3.6 GHz. No es tarea sencilla.

PIC02080

Con estos separadores conseguí flujo de aire sobre el North Bridge.

Las temperatura del radiador del chipset P35 alcanzaba 65ºC en superficie medida con un termómetro infrarrojo. Después de colocar el ventilador en la posición que os muestro se redujo hasta los 48ºC, un valor mucho más llevadero.

PIC02072

North Bridge Intel P35 bien refrigerado.

Ahora, tras montarlo en su torre después de la limpieza y revisión general está pasando tests de estabilidad y en un par de días lo tendrá el cliente listo para continuar el trabajo.

Intel Core i7 – Aplicación de la interfaz térmica – ProfessionalSAT

Hace algo más de un mes escribí un extenso artículo sobre la correcta aplicación de la pasta térmica sobre los procesadores actuales para asegurar el mejor rendimiento con la menor temperatura y mayor durabilidad.

Hoy he tenido la oportunidad de premontar un sistema Core i7 para un cliente que realiza un cambio de placa base a una Asus P6T-Deluxe y (dado que he recibido varias peticiones al respecto) he capturado unas cuantas fotografías centrándome en la colocación de la pasta térmica.

PIC02063

Pasta térmica sobre el Core i7.

En un Intel Core i7 debemos “dibujar” una línea con la pasta térmica que atraviese longitudinalmente el heat spreader por el centro. Así, tras anclar el disipador, conseguiremos una distribución uniforme del compuesto.

PIC02064

Core i7 con la interfaz térmica aplicada. Otra vista.

Extraído de Pasta térmica y transferencia de calor II. Actualizado – ProfessionalSAT :

“ La pasta térmica debe cubrir con una finísima película y sin resquicio alguno para el aire las principales zonas productoras de calor de nuestros procesadores. Para conocer cuáles son los hot-spots de nuestras CPUs debemos conocer qué hay debajo del heat-spreader de nuestra CPU. “

La peculiar geometría del die del procesador Core i7:

i7-art-2

Core i7 sobre su encapsulado para socket LGA1366.

PIC02065

Como vemos, la aplicamos longitudinalmente siguiendo los cuatro núcleos.

Etiquetas de Technorati: ,,,,,

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

domingo, 1 de marzo de 2009

Phenom II X4 940 BE: Overclock 3.6 GHz. Ampliado - ProfessionalSAT

En el artículo anterior de LowLevelHardware y en otro de este mismo blog traté sobre el tema del fácil overclock del nuevo procesador Phenom II de AMD basado en el proceso de 45nm SOI DSL. Una peculiaridad notable de este proceso es su amplio margen para incrementar el voltaje unido a su menor disipación térmica.

PIC02062

Con los nuevos Phenom II podemos llegar a los 1,50 V (e incluso 1.55 V) sin problemas con un buen conjunto refrigerador-ventilador por aire. En este caso no ha sido necesario ir más allá de los 1.425 V pues el objetivo eran los 3.6 GHz.

Además para llegar a los 3.8 GHz es necesario aumentar la alimentación hasta los 1.525 – 1,550 V. A mi modo de ver excesivo para solamente 200 MHz más, no merece la pena …

PIC01990

Para estas pruebas he escogido un Artic Cooling Freezer64, un modelo ya clásico pero con un rendimiento excepcional dada la gran calidad de las soldaduras en su base y el uso de la pasta Artic Cooling MX2 ya pre aplicada.

MX2

Le excelente pasta MX2 de Artic Cooling.

Para un análisis micro-arquitectural en profundidad de este sistema en overclock recomiendo el artículo que publicaré próximamente en LowLevelHardware.

PIC01991

La base del Artic Cooling Freezer64.

Configuración del sistema:

El procesador AMD Phenom (igualmente el Phenom II y el Core i7) es un diseño asíncrono. Diferentes partes del chip funcionan a distintas frecuencias relacionadas según unos multiplicadores fraccionarios.

PIC02058

El procesador usado en las pruebas, un stepping RB-C2.

Un procesador de última generación como el AMD Phenom II o el Intel Core i7 se divide principalmente en dos secciones funcionales distintas y asíncronas:

  • Los núcleos de ejecución
  • El Uncore o “todo lo que no son los núcleos” que incluye a su vez:
    • La caché L3
    • Las controladoras de memoria (DDR2 o DDR3)
    • Los buses de comunicaciones (HT o QPI)

Shanghai_ANÁLISIS

AMD Phenom II, mapa funcional del die.

En el caso que nos ocupa, el Phenom II X4 940 BE, las frecuencias nominales son las siguientes:

  • Los cuatro núcleos de ejecución funcionan a 3.0 GHz
  • El Uncore a 1.8 GHz (incluyendo la caché L3 de 6 MB y las dos controladoras de memoria DDR2)
  • Los buses de comunicaciones HyperTransport a 3.6 GHz

Para aumentar las prestaciones, he modificado las frecuencias del siguiente modo:

  • Los núcleos de ejecución funcionan a 3.6 GHz @ 1.425V (+20 %)
  • El Uncore a 2.4 GHz (+33%) (incluye la L3 de 6 MB y las dos controladoras de memoria DDR2)
  • Los buses de comunicaciones HyperTransport a 3.6 GHz (sin cambios)

Image2b Phenom II X4 940 BE @ 3.6 GHz, 2.4 GHz IMC/L3 y HT 3.6 GHz.

Image5

Dual channel DDR2 1066 unganged 5-5-5-18 2T 2.2 V.

Con este conservador overclock obtenemos prestaciones sobresalientes, nos interesa más una total estabilidad para una utilización continua y un consumo y disipación térmica controlados:

PIC01987

Phenom II X4 940 BE 3.6 GHz: unos excelentes 11 GB/s en Memtest86+ 2.11

Image4 

2703 KB/s en WinRAR multithreaded.

En Fritz Chess benchmark ha obtenido 8853 Knodos (18.44X) y en wPrime 10.672s para 32 M. Debajo podemos observar como ha mejorado el rendimiento del sistema gracias al overclock:

Phenom II X4 940 3.0 / 1.8 / Dual 1066 MHz

Phenom II X4 940 3.6 / 2.4 / Dual 1066 MHz

Diferencia %

Fritz Chess

7356 KN

8853 KN

+ 20.35 %

wPrime 32M

13.202 s

10.672 s

- 23.71 %

 
Un overclock del 20 % obteniendo una mejora en cálculos de un 20 a un 24 % es un resultado inmejorable y es debido a que hemos atacado el cuello de botella principal de la arquitectura Phenom: la frecuencia del uncore (aumentándola a 2.4 GHz).
 
cpuid

A 800 MHz Cool’n’Quiet con solo 1.000 V

 Image6

De este modo no hemos perdido los beneficios de bajo consumo y temperaturas sobre los 25 – 28 ºC en los cores debido a que mantenemos activo el Cool’n’Quiet y los estados de ahorro de energía C states. Más información en las capturas de configuración de BIOS próximamente en LowLevelHardware.

cachemem

En Everest el sistema ha obtenido unos excelentes resultados, con una latencia de memoria de 49.8 ns (179.3 ciclos a 3.6 GHz) y un ancho de banda de 8639 MB/s lastrado por el bus de 64 bit entre las IMC (controladoras de memoria), la L3 y las L2 de cada uno de los  núcleos.

Quiero recalcar que el bus al que me refiero es individual para cada core:

Uno de los cores de un AMD Phenom tiene a su disposición 64 bits/ciclo a frecuencia del uncore (1.8 GHz nominales o 14.4 GB/s), lo que es insuficiente para un dual channel DDR2 1066 (17 GB/s).

Esta es una limitación de la microarquitectura y no podemos hacer nada para solucionarlo, excepto incrementar el reloj IMC/L3 (por esta razón he incrementado porcentualmente más esta frecuencia que la de los núcleos).

rmma_20090227_145808_0078

Phenom II X4 @ 3.6 cores / 2.4 GHz uncore en RMMA 3.80. Acceso single core.

Como vemos, en acceso single core, el ancho de banda en la zona de la caché L3 (de 640 KB a 6.5 MB en el gráfico) corresponde a unos 11.5 a 12 GB/s o unos 3.2 a 3.4 bytes/ciclo. Una transferencia insuficiente para hacer frente a un dual channel DDR2 1066 con una transferencia pico de 17 GB/s.

Recordemos que son datos en condiciones reales (transferencia real sostenida, no un pico esporádico máximo) y en acceso de un solo núcleo con los otros tres en estado idle (reposo).

En modo de acceso multithreaded estas velocidades mejoran mucho, como podéis ver al final del artículo en LowLevelHardware dedicado a este sistema en RMMT  , llegando a un 86% del límite teórico.

Image1

Dado los voltajes conservadores y la cuidada preparación previa el sistema ha pasado sin problemas todos los tests de estabilidad con unas temperaturas en carga máxima de 61ºC a las 6h de Prime95 Blend.

PIC01988

Para un análisis pormenorizado de este sistema visita próximamente LowLevelHardware.