domingo, 28 de noviembre de 2010

nVidia GTX580 1536 MB y Corsair AX750. Actualizado – ProfessionalSAT

En este pequeño artículo voy a comentar algunos aspectos del nuevo buque insignia de nVidia, la excelente GTX580 con 1.5 GB de GDDR5. En este caso montada en un sistema Core i7 950.

GTX580_1536MBLa GPU más rápida del momento: la nVidia GTX 580.

Todos conocemos los problemas de AMD y nVidia con sus nuevos chips fabricados hace más de un año con el proceso de 40 nm de TSMC. Ahora, transcurridos más de doce meses parece que se van solucionando los problemas de leakage en los transistores fabricados en este nodo y tanto AMD como nVidia están mostrando su segunda generación.

GTX580_GPUZAl fin un chip Fermi completo: 512 procesadores en la nVidia GTX 580.

nVidia no pudo comercializar un chip Fermi completo con sus 512 procesadores inicialmente debido a problemas de yields (escaso número de chips funcionales) y una disipación térmica y consumo desmesurados.

En su día, la GTX 480 se conformó con frecuencias más moderadas de 700 MHz y solamente 480 de sus SPs activados.

Frecuencias:

  • Core: 772 MHz.
  • Shaders: 1544 MHz.
  • Memoria GDDR5 4008 MHz.

GTX580_Torre_01Zotac GTX 580 alimentada por una fuente Corsair AX750 Gold.

Como realmente los juegos comerciales no me interesan (carezco de tiempo material para dedicar a tales lides) y todos sabemos del nivel de prestaciones de esta tarjeta gráfica (es la más rápida exceptuando a la dual-GPU AMD HD5990) me centraré en aspectos más técnicos.

6 8pin

8 + 6 pines llegan a esta GPU desde la fuente de alimentación.

Lo que más me ha llamado la atención de la GTX580, aparte de su soberbio nivel prestacional, ha sido su muy moderado consumo y sus temperaturas absolutamente ridículas en reposo.

Todo esto es gracias a la mejora del proceso de 40 nm de TSMC desde que apareciesen las primeras GTX480 (que por cierto, literalmente asustaban por su excesivo consumo, emisión térmica y peligrosos niveles de temperatura).

GTX580_Temp_RTHDRIBL_01En RTHDRIBL muestra temperaturas muy aceptables.

Realmente 68º C al minuto de test y con una pendiente de subida muy moderada es un gran resultado, la temperatura pico tras una hora en RTHDRIBL fue de unos moderados 71º C.

GTX580_Temp_RTHDRIBL_01_AMPRTHDRIBL AA16X: 68º C en Windows 7 X64.

Con cargas más exigentes como Furmark la temperatura obviamente llega a cotas superiores:

GTX580_FurmarkFurmark en GTX580.

Gracias al mecanismo de throtling de frecuencia (y voltaje) implementado por los ingenieros de nVidia al detectar el ejecutable, las temperaturas no van a más, sin duda rondaríamos en su defecto los 100º C consumiendo unos 50 – 80 W más en la GPU.

GTX580_Furmark_AMP0182º C en Furmark.

Debo resaltar el nivel sonoro muy contenido de la GTX580, por supuesto solo me refiero al sistema mostrado. En otra torre con pero ventilación los resultados sin duda variarían ostensiblemente.

GTX580_Furmark._AMP02jpgTemperatura estabilizada en 82 ºC en Furmark.

nVidia ha diseñado un eficiente sistema de refrigeración para la GTX580, esta vez no está basado en heat pipes sino en una cámara de vapor (Vapor Chamber).

GTX580_HeatsinkRadiador Vapor Chamber para la GTX580.

VaporChamber01La cámara de vapor es más efectiva que un diseño basado en heat pipes.

nVidia ha hecho un buen trabajo en la refrigeración de la tarjeta, ahora nos toca a nosotros conseguir evacuar rápidamente este calor que llega en pico a unos 280W.

GTX580_Torre_02GTX580 montada en la caja, la ventilación es la clave.

En el equipo mostrado monté 4 ventiladores de 12 cm en la torre:

  • Frontal metiendo aire.
  • En tapa lateral sacando aire (a la altura de la tarjeta).
  • Trasero sacando aire.
  • Superior sacando aire.

GTX580_TraseraEs necesario abrir todas las tapas traseras de la torre.

Además, tanto la fuente de alimentación como la propia turbina de la GTX580 evacuaban al exterior su aire caliente. Por otro lado, la fuente aspiraba su aire de refrigeración directamente del exterior de la torre por la parte inferior.

Corsair AX750

La AX750 pertenece a la gama estrella de Corsair, la gama AX.

Diseño de cableado totalmente modular en la AX750 de Corsair.

Debo decir que ha demostrado un comportamiento excepcional, salta a la vista su superior rendimiento eléctrico en el hecho siguiente: durante la utilización normal del equipo nunca se enciende su ventilador y permanece templada, casi fría (no como otros modelos que paran su ventilador sacrificando su temperatura).

El ventilador no gira hasta que la carga supera los 150W.

Curva acústica en función del consumo.

Solo en momentos de carga extrema como en Furmark empezaba a girar lentamente (sin duda lejos de las 1000 rpm) el ventilador. Todo sea dicho, montada en una torre con excelente ventilación.

Curva de rendimiento de la AX750.

Hasta un consumo real de 150 W el ventilador permanece detenido, a partir de ahí empieza a girar lentamente, siempre manteniendo un nivel sonoro inapreciable en las cargas máximas del sistema (no llegamos a los 500W).

RTHDRIBL P95X64Core i7 950 a 63º C en carga combinada Prime95 y RTHDRIBL.

Esta fuente de alimentación tiene certificación 80 Plus Gold y la supera con creces llegando a un rendimiento pico de casi el 93 % (!!!), algo realmente excepcional. No es nada exagerado decir que este sistema consumiría unos 100W en el enchufe más en carga máxima con una fuente de 700W mediocre.

Las temperaturas del sistemas son muy bajas: El procesador llegaba en pico a los 63º C en Prime95 X64 InPlace Round off Checking, un resultado que dice mucho del excelente resultado térmico del sistema y de su estudiado flujo de aire sin creación de Hot Spots.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

jueves, 25 de noviembre de 2010

Windows 7 X64 Ultimate y 24 GB de DDR3 – ProfessionalSAT

Todos sabemos que la memoria libre es uno de los principales factores limitantes para las prestaciones de nuestras máquinas. Esto es mucho más cierto todavía conociendo la excelente gestión de la memoria libre por Windows 7, especialmente en su versión de 64 bit.

Gracias a que el precio de los módulos de 4 GB DDR3 está llegando a ser inferior por GB que en los DIMM convencionales DDR3 de 2 GB se empiezan ya a montar en los últimos de mis Sistemas de Altas Prestaciones.

24GB_22GB_LibresCore i7 con 24 GB DDR3: 22 GB libres en Win7 Ultimate X64.

Windows 7 hace un adecuado uso de la memoria libre dedicándola a caché de disco y para el mecanismo de prefetch de aplicaciones, SuperFetch. Otro modo de aprovechar cantidades ingentes de RAM es crear un disco RAM (RAMDisk) para todos los ficheros temporales del sistema operativo y los de navegación a través de Internet.

En mi caso, por el contario se trata de clientes que necesitan esta cantidad de memoria para ejecutar ocho cálculos concurrentes, cada uno de ellos con un working set de 2 GB. En este caso los cálculos ocupan 16 GB y quedan para el sistema, gestión general y caché de disco 8 GB.

24GB_Sistema_W7X64Windows 7 Ultimate X64 con 24 GB de RAM.

En reposo, con el sistema recién arrancado quedan libres unos 22 GB de memoria para cargar aplicaciones… suficiente para la mayoría de usuarios.

24GB_AdminTareas0122 GB de RAM libres. En total 24 GB.

Un ejemplo de utilización total de esta cantidad de memoria es el agresivo test IntelBurnTest en su versión 2.5 de 64 bit, llega a dejar el sistema sin apenas memoria disponible:

IBT25_24GB8 threads de IBT 2.5 utilizando 22 GB de RAM.

Es uno de los tests más estrictos que conozco para entorno Windows, cuanta más memoria se asigne al proceso más stress se produce sobre las unidades de coma flotante del procesador. Es código “nativo” Intel, optimizado para procesadores Intel por ingenieros de Intel corp.

24GB_14MB_libres23840 MB en uso.

Un efecto secundario del uso de más memoria por IBT, en este caso 24 GB, es un aumento cifrado en unos 5ºC respecto al test en una máquina idéntica configurada con 6 GB (cada cálculo Linpack dura mucho más; unas 4 veces).

24 GB_74CIncremento de temperatura debido al test con 24 GB.

Otro efecto negativo de la ampliación a 24 GB llenando todos los slots de memoria con módulos de 4 GB consiste en el deterioro de los timings de memoria respecto a configuraciones con las controladoras de memoria menos pobladas:

24GB_MemoryTimingsLa verdad es que no son timings para tirar cohetes.

De todos modos el incremento en velocidad producido por el hecho de tener siempre memoria libre y evitar la paginación a disco duro (archivo de intercambio) compensa con creces estos pequeños problemas… realmente el sistema es una delicia en el día a día.

A este hecho también ayuda (…) que ambos sistemas disponen de discos SSD Crucial C300 de 128 GB para el sistema operativo y las aplicaciones (unidad C:) y de dos discos duros Western Digital Caviar Black de 1 TB para datos en configuración RAID 1 mirroring.

Otro software que es capaz de aprovechar por completo una cantidad tal de memoria es 7zip en su versión 64 bit y con el algoritmo LZMA2:

24GB_7zip7zip configurado para utilizar 24 GB.

En la captura anterior hay que cambiar un parámetro: Solid Block Size de 4 GB a No Limit. De este modo y con un tamaño de diccionario descomunal de 512 MB conseguiremos comprimir más todavía datos con una recurrencia de baja localidad.

Hasta la próxima…

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

miércoles, 24 de noviembre de 2010

24 GB y 18 GB en Core i7 930 – ProfessionalSAT

Como he comentado en algún artículo pasado de LowLevelHardware estoy inmerso en el diseño de dos máquinas de mis Sistemas de Altas Prestaciones que incorporan módulos de 4 GB DDR3 1333 con las siguientes configuraciones:

DSCF077024 GB de DDR3 1333 en Memtest86+.

Sistema 1:

  • Core i7 930
  • 24 GB de RAM: 6 DIMM de 4 GB DDR3 1333
  • Frecuencias objetivo de 3.8 GHz en cores y 3266 en uncore
  • Latencias RAM por determinar
  • Command Rate 2N

Sistema 2:

  • Core i7 930
  • 18 GB de RAM: 3 DIMM de 4 GB DDR3 1333 y 3 DIMM de 2 GB DDR3 1333
  • Frecuencias objetivo de 4.0 GHz en cores y 3266 en uncore
  • Latencias RAM por determinar
  • Command Rate 2N

DSCF076824 GB de DDR3 1333 en BIOS de Asus P6T SE.

A modo de valoración general me gustaría apuntar algunos detalles sobre la utilización de módulos de 4 GB DDR3 1333 y sobre el hecho de ocupar totalmente los seis slots DDR3 de las placas de socket 1366.

En primer lugar, hablando de los DIMM de 4 GB, señalar que son más lentos en cualquier parámetro (latencias y frecuencia) que los típicos DIMM de 2 GB. Su disipación térmica es considerable incluso en algunos modelos preocupante (he probado unos Patriot que arden literalmente, 60ºC en superficie con medición infrarroja, los Kingston son más moderados en este aspecto).

En segundo lugar quiero destacar un hecho no muy conocido:

Siempre que ocupamos todos los DIMM de una placa base nos topamos con limitaciones de uno u otro tipo en cuanto al rendimiento de la memoria.

Concretamente en placas de socket LGA1366 para Core i7 de la serie 900 he observado lo siguiente en diferentes placas base y con diferentes CPUs, steppings y revisiones de BIOS:

  • Es necesario activar en BIOS el Command Rate a 2N en lugar del más óptimo y rápido 1N.
  • Muchas veces se debe incrementar el voltaje de la memoria en sí (VDIMM o VDDR3) así como el voltaje del uncore (VUncore) para lograr una total estabilidad.
  • También penaliza el rango de frecuencia en el Uncore siendo recomendable partir de 2.66 GHz con un VUncore de 1.20 V, en algunas ocasiones es necesario llegar a 1.25 V aún a 2.66 GHz.
  • Para configuraciones de Uncore a 3.266 GHz es normal rondar los 1.325 V (no me parece adecuado superar este valor).

Debo decir que todos estos “problemas” obligan a dilatar unos días la validación de cada uno de estos sistemas, de echo y como es lógico cada tests ejecutado en estas máquinas debe correr más tiempo para asegurar una cobertura completa del gran rango disponible de memoria.

Lamento no poder detallar más la evolución de los sistemas pero el deber (el exceso de trabajo) es lo primero y estos Blogs, para mí, continúan siendo un verdadero placer…

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

sábado, 13 de noviembre de 2010

Scythe Yasya cooler – ProfessionalSAT

Estos días estoy evaluando varios coolers para socket 1366 para montarlos en algunos de mis Sistemas de Altas Prestaciones. Comparando sus características, sobretodo su rendimiento térmico y comportamiento acústico con varios tipos de ventiladores de 12 y 14 cm, en condiciones idénticas para todos ellos.

En este conciso y casi fotográfico artículo detallaré alguna de las características del llamativo Scythe Yasya. Todas las fotografías han sido tomadas con una Fujifilm Finepix HS10.

ScytheYasya_01Agresivo perfil de láminas en el Scythe Yasya.

El radiador se caracteriza por unos acusados ángulos de ataque en las láminas de aluminio. Los ingenieros de Scythe intentan conseguir con ello un mejor rendimiento del disipador con presiones estáticas de aire bajas y con un solo ventilador en configuración push (metiendo aire).

ScytheYasya_02Detalle de la depresión central de las láminas.

ScytheYasya_03Scythe Yasya sin ventilador.

El aire, al encontrar tal distancia desde su salida del ventilador hacia el radiador, disminuye su turbulencia y adopta un flujo más laminar, entrando con más facilidad en el cuerpo del disipador.

ScytheYasya_10Base del Scythe Yasya.

Comparándolo con el excelente Scythe Mugen 2 B se pone de manifiesto su menor superficie total de disipación y su perfil más adaptado para ventiladores ultra silenciosos de poco flujo. El Mugen 2 B ofrece un perfil de entrada más convencional y por ello más adecuado para una mayor presión y doble ventilador.

ScytheYasya_05El Yasya con un ventilador a 1200 rpm consigue un excelente rendimiento.

Scythe adjunta con el Yasya un ventilador Slip Stream 120 PWM Adjustable regulable desde un nivel de ruido prácticamente inaudible hasta ser un verdadero tornado (de 470 hasta 1900 rpm) con un consumo máximo considerable: 7,19 W.

Slip Stream 120 PWM Adjustable.

Si comparamos el Yasya con su hermano mayor el Mugen 2 B aprecio unos 5 – 7 ºC de incremento en temperatura pico en cores (Prime 95 X64 v25.11 Blend Round Off Checking durante 24 h) en procesadores Core i7 930 a 4 GHz a un voltaje de 1.325V en BIOS cuando monto dos ventiladores de unas 1200 rpm en Push-Pull.

ScytheYasya_07El sellado de los seis heatpipes dobles del Scythe Yasya.

Como apunte señalar que con el Mugen 2 B con dos ventiladores las temperaturas oscilan sobre los 75 ºC en torres con ventilación estudiada al detalle, siempre en las condiciones apuntadas en el párrafo anterior.

ScytheYasya_base01La base presenta un estricto pulido y un baño en Zinc.

La base presenta un aspecto perfecto, sin rayas ni restos del proceso de pulido. En su parte central es algo protuberante, lo que facilita el contacto con el centro de los heat spreaders de los procesadores multicore actuales ya que es ahí donde se genera la mayoría de los W de disipados.

ScytheYasya_11La base es prácticamente un espejo.

Debajo del disipador de láminas principal hay un minúsculo radiador soldado al cuerpo que acoge los seis heatpipes de cobre, su material es aluminio.

ScytheYasya_09El testimonial radiador inferior.

En resumen, el Yasya es un excelente radiador diseñado para configuraciones de serie y configuraciones fuera de especificación hasta unos 3.8 GHz a 1.30 V en procesadores Core i7. De este modo obtenemos picos absolutos de temperatura en cores sobre los 70 ºC.

Sin duda es posible ir más allá pero personalmente no considero aceptable que mis Sistemas de Altas Prestaciones no superen excesivamente la barrera de los 70 ºC.

ScytheYasya_12Interfaz térmica sobre un Core i7 930.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

lunes, 8 de noviembre de 2010

Sistemas de Altas Prestaciones- Core i7 930 a 4 GHz (III) –ProfessionalSAT

En este tercer artículo de la serie continúo con la validación del sistema Core i7 configurado a 4 GHz. Aquí detallo algunos de los pasos que sigo en este complejo y lento proceso.

DSCF0671Asus Triton 88.

La configuración queda del siguiente modo:

  • Reloj maestro de 181 MHz.
  • Cores: multiplicador X22, 3982 MHz.
  • Uncore y caché L3 de 8 MB: multiplicador X18, 3258 MHz.
  • Memoria DDR3 Triple Channel: multiplicador X8, 1448 MHz.
  • Latencias DDR3: 7-7-7-14 1T.
  • Memoria total 6 GB.

XR11

Siguen las capturas de algunos de los tests iniciales con parámetros de configuración no definitivos, sobretodo en lo que concierne a los voltajes de Cores, Uncore y DDR3.

Tras los tests de memoria preliminares con la placa base fuera de la torre (desmontada) continúo, tras instalar sistema operativo y drivers, con tests de memoria en entorno Windows:

8X_MemTestTests de memoria en Windows.

Normalmente los ejecuto durante unas 2h preliminarmente:

En este momento de la validación todavía no tengo definidos todos los parámetros definitivos del sistema en cuanto a frecuencias finales y voltajes.

DSCF0669Refrigeración sobre el procesador y sobre el chipset X58.

Después empiezo con los tests específicos de procesador, tanto FPU como enteros y sobretodo cálculo vectorizado SSE. De todos los tests ejecuto ocho threads para saturar las unidades de ejecución del Core i7 9XX.

Normalmente empiezo con IntelBurnTest:

IBT_50XLa máquina tras 50 pasadas de IBT.

Continúo con Prime95, en este caso en modo Blend con Round Off Checking:

P95_LLC_1325V_80C_2h30Prime95 X64 Blend Round Off Checking.

Debido a alguna experiencia anterior el tiempo de ejecución de Prime95 lo he establecido en 36 h en cada uno de sus tres modos de chequeo:

  • Blend.
  • In Place.
  • Small FFTs.

Esto se debe a que en dos ocasiones he detectado errores (sutiles errores) en Prime95 más allá de las 24h de ejecución.

  X58_Off_TempCalibrando el termómetro infrarrojo láser sobre el radiador del chipset X58.

Después ya paso a los tests específicos para el cliente: obviamente de nada sirve que una máquina pase todos los tests de estabilidad del mundo cuando no ejecuta apropiadamente el software del cliente… es una de las partes más interesantes de mi trabajo. Por ello “me toca” aprender con cada cliente todos los secretos de sus aplicaciones. Normalmente incluso hago profiling para un análisis más estricto.

En este caso cálculo vectorizado utilizando SSE 4.2 optimizado para Core i7 y afinitizado manualmente a cada CPU lógica, en total 8 threads.

Sinus_8X_2min_2Ocho threads de cálculo científico de diseño específico para Core i7.

Posteriormente a estos tests mejoré las temperaturas en carga 100% del procesador añadiendo simples unas arandelas de Teflón en la base del Triton 88 (como detallé en un artículo anterior) y realizando algunas mejoras en la refrigeración de la torre.

DSCF0668Canal de aire de delante hacia atrás sin ningún obstáculo aerodinámico.

El aire que entra en el radiador del procesador, en este caso un Asus Triton 88, es el que intercambia el calor con las láminas del disipador. Lógicamente cuanto más frío se encuentre este aire y cuanto mayor caudal entre del exterior más efectivamente reduciremos la temperatura con el mínimo ruido.

DSCF0660Como se aprecia, el aire no tiene impedimentos para entrar hacia el procesador.

La clave reside en la temperatura del aire y en evacuar el aire saliente (más caliente) lo antes posible evitando que haya mezcla entre las dos corrientes.

DSCF0665Detalle del frontal.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

Etiquetas de Technorati: ,,,,,