martes, 25 de noviembre de 2008

Portátiles vs polvo - ProfessionalSAT

Ya se ha convertido en un caso diario el encontrar clientes con sistemas agonizantes por culpa de la dejadez y la falta de mantenimiento.

El pensar común entre los lusers, es que un sistema informático es análogo a un electrodoméstico, es decir, no necesita de intervención alguna del usuario. Muchas veces, esto es alentado por la presencia de etiquetas a modo de precintos de garantía en muchos PCs de algunas marcas.

Cualquier persona que tenga cierta experiencia conoce la necesidad de un mantenimiento preventivo, tanto a nivel software (reinstalación de sistema, mantenimiento del S.O., desfragmentación, eliminación de archivos temporales, ...) como hardware (limpieza, comprobación conexiones y ventiladores, etc ...)

A modo de ejemplo os presento el siguiente caso:

PIC01476_400

Un cliente de esta misma mañana al que su equipo se le apagaba repentinamente, señal inequívoca de ThermTrip.

PIC01477_400

PIC01478_400

PIC01479_400

Como podéis ver, el radiador de cobre con heat pipes, prácticamente estaba tapizado por el polvo con pelusas. El aire no pasaba por ningún sitio.

PIC01479_400_cut 

Detalle del radiador ampliado.

Tras limpiar convenientemente tanto el radiador de cobre, como el ventilador y el procesador y haber cambiado la interfaz térmica se ha instalado WinXP correctamente y ha pasado 3h de Prime95 sin Thermal Throtling.

Etiquetas de Technorati: ,,,,,

lunes, 24 de noviembre de 2008

Overclock Core i7 920 a 3.66 GHz - ProfessionalSAT

El Intel Core i7 aporta numerosas novedades microarquitecturales ya discutidas en numerosos artículos de LowLevelHardware y ProfessionalSAT que hacen que su velocidad clock-for-clock sea superior a su antecesor, el Core 2 Quad de la serie 9000 basado en núcleos Penryn de 45 nm.

PIC01476a

Core i7 sobre la placa Intel DX58SO

Sistema de pruebas:

  • Core i7 920 @ 3.33 GHz / 2.66 GHz Uncore
  • Placa Intel DX58SO Intel X58 - ICH10
  • 3 canales Kingston DDR3 1333 9-9-9-24-1T @ 1.58V
  • Western Digital 500 GB WD5000AAKS 7200 rpm 16 MB SATA2
  • Grabadora DVD SATA LG
  • ATI Radeon 4850 512 MB GDDR3 625 MHz / 2 GHz
  • F/A Tacens Radix 520W
  • Instalación limpia con drivers Windows XP Home SP3

PIC01479

El nuevo socket LGA 1366

Este articulo está dedicado al overclock de Core i7, aunque con una condición, no modificar voltajes de:

  • Procesador
  • Uncore
  • QPI
  • Northbridge
  • Southbridge

Únicamente me he permitido modificar el valor del voltaje de la memoria DDR3 a 1.58 V.

PIC01477a

Mi cámara, ya con 5 años, todavía cumple con su función ...

El efecto de color es intencionado, en mi opinión le sienta bien el dorado al Core i7.

PIC01479a

El i7 920 en el socket preparado para la acción ...

PIC01476b

El refrigerador utilizado, nada del otro mundo.

Para el análisis he deshabilitado el Turbo mode pues confunde al software en la medición de latencias, porque cambia la frecuencia en función de la carga. Con Turbo Mode se pone en 3.5 GHz con carga de más de 4 threads y 3.66 GHz con carga de 2 threads (1 core).

Por cierto, con Turbo Mode es igualmente estable ... (a 3.66 GHz) es realmente sorprendente la escalada de reloj tan sencilla de estos procesadores con voltaje nominal.

Así el procesador mantiene constantemente los 3.33 GHz y el Uncore a 2.66 GHz.

cpuz148_1

Observad el bus QPI a 3 GHz (double pumped) correspondiente a 6 GT/s (la velocidad nominal es de 4.8 GT/s).

cpuz148_2

Uncore a 2.66 GHz y memoria a 1333 MHz triple channel. Se podrían mejorar las latencias a 8-8-8-20 ... manteniendo el acceso 1T.

Everest Ultimate 4.60

cachemem

No considero a Everest un buen software para medir latencias, pues siempre busca el mejor dato, haciendo uso eficiente del hardware prefetch.

Latencias: CPUZ 1.23

cpuz123_Lat

Las latencias son:

  • L1: 4 ciclos.
  • L2: 10 ciclos.
  • L3: 42 ciclos.
  • Memoria principal: 183 ciclos @ 3.33 GHz (unos 55 ns).

WinRAR 3.80 benchmark:

WinRAR

Os invito a que probéis en vuestro sistema. 4012 KB/s es un rendimiento desorbitado ...

wPrime Benchmark 2.00

wPrime

Un resultado sobresaliente, 7.39 s para calcular 32M (!!).

Fritz Chess Benchmark

Fritz

25.45X y 12214 KNodos/s, uff!!

RMMT 3.80:

RMMT_8t RMMT_8t_B Una transferencia máxima efectiva de memoria de 19200 MB/s. Impresionante. Y digo efectiva en el sentido de que es un valor real, no como por ejemplo Sisoft Sandra que muestra el pico máximo utilizando todos los trucos de programación y optimizaciones posibles.

PIC01482

Conclusión:

Un rendimiento absolutamente excepcional e inalcanzable por cualquier Core2Quad con refrigeración convencional.

Escogí el bus 167 por pura estética, sin duda podría haber conseguido unos MHz extra. Pero me apetecía probar esta frecuencia en particular. Además sabía que así no debía entrar en cambios de voltaje ... tampoco quiero arriesgar una CPU de más de 300€ ...

domingo, 23 de noviembre de 2008

Intel Core i7 y el triple channel - ProfessionalSAT

Core i7 es el primer procesador x86 en contar con tres controladoras de memoria independientes, en este caso de DDR3 1066 MHz, lo que le otorga una baja latencia pero sobretodo un ancho de banda nunca visto hasta la fecha.

Sistema de pruebas:

  • Core i7 920 2.66 GHz / 2.13 GHz Uncore
  • Placa Intel DX58SO Intel X58 - ICH10
  • 2 o 3 módulos Kingston DDR3 1066 7-7-7-20-1T @ 1.58V
  • Western Digital 500 GB WD5000AAKS 7200 rpm 16 MB SATA2
  • Grabadora DVD SATA LG
  • ATI Radeon 4850 512 MB GDDR3 625 MHz / 2 GHz
  • F/A Tacens Radix 520W
  • Instalación limpia con drivers Windows XP Home SP3

CPUZ_148A_2ch_NOTurbo

Aquí compararé las prestaciones entre un Core i7 con un dual channel y un triple channel DDR3 1066.

Dual channel DDR3 1066:

CPUZ_148B_2ch_NOTurbo

Latencia de memoria:

CPUZ_lat_2ch_NOTurbo

Latencia de memoria efectiva de 161 ciclos para 512 Kb stride. Correspondiente a 60 ns a una frecuencia de núcleo de 2666 MHz.

Test de algoritmos ajedrecísticos: Fritz chess benchmark.

Fritz_2ch_NOTurbo

Resultado: 20.33 X, 9758 Knodos/s.

Test wPrime 32M:

WPrime_2ch_NOTurbo

Resultado: 9.25 s.

WinRAR 3.80 beta benchmark:

 Wrar_2ch_NOTurbo

Resultado: 3370 KB/s.

RMMT (182 bit SSE2 / Read w.PF / Blocksize 16MB):

RMMT_16MB_2ch_NOTurbo

Resultado acceso a memoria 8 threads: 14890 MB/s.

Triple channel DDR3 1066:

CPUZ_148A_3ch_NOTurbo 

Latencia de memoria:

CPUZ_lat_3ch_NOTurbo

Latencia de memoria efectiva de 161 - 162 ciclos para 512 Kb stride. Correspondiente a 60 ns a una frecuencia de núcleo de 2666 MHz.

Test de algoritmos ajedrecísticos: Fritz chess benchmark.

Fritz_3ch_NOTurbo

Resultado: 20.33 X, 9757 Knodos/s.

Test wPrime 32M:

WPrime_3ch_NOTurbo

Resultado: 9.249 s.

WinRAR 3.80 beta benchmark:

Wrar_3ch_NOTurbo

Resultado: 3491 KB/s.

RMMT (182 bit SSE2 / Read w.PF / Blocksize 16MB):

RMMT_16MB_3ch_NOTurbo

Resultado acceso a memoria 8 threads: 16842 MB/s.

Sumario de resultados:

  Dual channel Triple channel Diferencia
Latencia RAM 161 ciclos 161 ciclos =
Fritz chess 20.33 X 20.33 X =
wPrime 9.25 s 9.249 s =
WinRAR 3.80 3370 KB/s 3491 KB/s 3.6 %
RMMT 14890 MB/s 16842 MB/s 13.1 %

Conclusiones finales:

Como vemos, las diferencias en software "real" son nulas, en cambio en software ávido de ancho de banda (como WinRAR) ronda el 4% de mejora con tres canales.

La mejora pura de ancho de banda ronda el 13% como demuestra el test RMMT multithreaded X8.

En cualquier caso, con frecuencias de núcleo más altas (aquí testeamos el más bajo de la gama) los Core i7 se muestran más exigentes con el subsistema de memoria. Entonces será cuando empiece a apreciarse más la ventaja del triple canal.

Para Intel, la necesidad del tercer canal, viene marcada por el mercado de servidores multisocket, que es hacia donde están dirigidos realmente los actuales Core i7. En el mundo del PC de sobremesa es más un plus estético que algo útil.

Para un análisis microarquitectural de las diferencias encontradas en este artículo entre dual y triple channel en procesadores Core i7 estad atentos a LowLevelHardware en los próximos días.

miércoles, 19 de noviembre de 2008

Core i7 - Intel X58. Temperatura en OC - ProfessionalSAT

Para tests de bajo nivel visita LowLevelHardware.

Configuración sistema de pruebas:

  • Core i7 920 3.33 GHz / 2.66 GHz Uncore
  • Placa Intel DX58SO Intel X58 - ICH10
  • 1 módulo Kingston DDR3 1333 9-9-9-24 1T 1.62V
  • Western Digital WD5000AAKS 7200 rpm 16 MB SATA2
  • Grabadora DVD SATA LG
  • ATI Radeon 4850 512 MB GDDR3 625 MHz / 2 GHz
  • F/A Tacens Radix 520W
  • Instalación limpia con drivers Windows XP Home

Image1

Con voltaje nominal y cuatro ajustes en BIOS, ahí lo tenéis 3633 (multiplicador 22) MHz en Turbo mode para una frecuencia nominal de 3333 MHz. Un overclock verdaderamente trivial.

Image3

Con el "bus" a 166 MHz el Uncore queda a 2.66 GHz (multiplicador 16) y la RAM a 1333 MHz (multiplicador 8).

El Uncore siempre debe quedar, como mínimo, al doble de la frecuencia de la memoria según las directrices de Intel.

WRAR_35GHz_1ch

WinRAR no es capaz de extraer todo el paralelismo de un Core i7 y sus 8 CPUs lógicas (gracias al SMT) pero logra cargas de un 73%, lo que no está nada mal.

Y nos deleita con un resultado de 3542 KB/s en su benchmark, ¡en single channel!

Y ahora por fin la medición térmica del radiador del Intel X58 en overclock, del que corren rumores de altísimas temperaturas:

ICH_3.5GHz

Solo 51ºC sin refrigeración activa. Un resultado excelente, como vemos no hay que temer por su integridad. Como veis, rumores infundados ...

Para ello, eso sí, es necesario activar el ahorro de energía del bus QPI en la BIOS, como podéis ver en la siguiente fotografía:

PIC01481

Si te interesa la microarquitectura de CPUs no olvides pasar por LowLevelHardware.

martes, 18 de noviembre de 2008

Core i7 IDLE: Consumo en reposo Core i7 920 - ProfessionalSAT

Configuración sistema de pruebas:

  • Core i7 920 2.66 GHz / 2.13 GHz
  • Placa Intel DX58SO Intel X58 - ICH10
  • 1 módulo Kingston DDR3 1333 @ 1066 7-7-7-20 1.62V
  • Western Digital WD5000AAKS 7200 rpm 16 MB SATA2
  • Grabadora DVD SATA LG
  • ATI Radeon 4850 512 MB GDDR3 625 MHz / 2 GHz
  • F/A Tacens Radix 520Wç
  • Instalación limpia con drivers Windows XP Home

PIC01477_400

Un Core i7 con un monitor del siglo XX.

IDLE_131W

Solamente 131W en el escritorio de WinXP, es un muy buen consumo, sobretodo teniendo en cuenta la mediocre eficiencia de la Tacens Radix 520W con esa carga (131 W).

PIC01483_400

Con una fuente de mayor categoría (80 plus) estaríamos en menos de 120 W. El equipo desde el que escribo estas líneas, un C2Q 6850 Extreme con 4 GB DDR2 800 4-4-4-12 @ 2 V y ATI R4850 512 GDDR3 se queda en 126 W con una F/A bastante mejor que la Radix.

Más por llegar ...

lunes, 17 de noviembre de 2008

Core i7. Análisis prestacional. Single Channel - ProfessionalSAT

Hoy es el día elegido por Intel para lanzar su nuevo procesador Core i7. Nosotros ya hemos recibido un Kit Retail compuesto de:

  • Core i7 920 2.666 GHz
  • Placa base Intel DX58SO
  • Varios kits de memoria DDR3 1333 y 1066 de baja latencia

PIC01477_400

Con Nehalem asistimos a un avance excepcional en cuanto a ancho de banda disponible.

Integrando tres canales independientes de DDR3 a 1066 MHz en el propio procesador consigue un acceso a memoria de bajísima latencia (la menor hasta el momento en el mundo x86) y un ancho máximo de 8.5 GB/s por canal (hasta 25.6 GB/s).

PIC01475_400

Configuración del sistema Nehalem:

  • Core i7 920 2.666 GHz (Uncore 2.133 GHz)
  • Placa base Intel DX58SO Intel X58 - ICH10
  • 1 módulo DDR3 1333 @ 1066 MHz Kingston 1.5V
  • Latencias ajustadas manualmente: 7-7-7-20-64-3-8-4-4-1T
  • ATI 4850 512 MB GDDR3

Image4

Quizás algunos de vosotros estéis pensando que la configuración en single channel degradará en exceso las prestaciones. Para esos lectores dedico la comparativa con siguiente sistema Core2Quad (desde el que escribo estas líneas):

  • QX6850 Extreme Edition FSB333 3.0 GHz 4 + 4 MB L2
  • Chipset iP35 en configuración extreme (Performace Level 6)
  • Dual channel 4 GB DDR2 800 (2 x 2 GB) Kingston HyperX Timings ajustados manualmente 4-4-4-12 2.0 V

QX6850

Core2Quad QX6850 en el test de WinRAR 3.80

WRAR_1ch_SMT_77720

Core i7 920 en el mismo test.

Como vemos, pese al single channel, el Core i7 "humilla" al antiguo líder en prestaciones, el Core2Quad (1847 contra 3163 KB/s).

PIC01481_400

La diferencia de memoria 1GB vs 4 GB entre los dos sistemas no influye en este test.

PIC01483_400

Latencia de cachés L1, L2 y L3:

CPUZ_Lat_1canal

Como podemos ver en esta captura de CPU-Z, las latencias son las siguientes:

  • Caché L1: 4 ciclos (32 + 32 KB)
  • Caché L2: 9 ciclos (256 KB)
  • Caché L3: unos 35 ciclos (8192 KB shared)

Recordemos que este procesador, el Core i7 920 (y también el 940) llevan su Uncore fijo a una frecuencia de 2133 MHz. Pese a este funcionamiento asíncrono y un mayor tamaño de su L3, Intel ha logrado mejorar las latencias de L3 de AMD en su core Barcelona.

Puntualizar además que las latencias medidas corresponden con mi estimación de Marzo de este año: 9 ciclos.

" Según Intel las nuevas L2 de 256 KB serán de baja latencia. Recordemos que en Core2Duo las L1 tienen 3 ciclos y las L2 14 ciclos. Si mantiene la latencia L1 (lo más probable), la L2 sin duda decrecerá, pero es difícil saber cuanto. Los Pentium III Coppermine con sus 256 KB tenían 10 ciclos de latencia, por ahí podría ir la de Nehalem. Yo apostaría por unos 9 ciclos. "

Image1

Captura de CPU-Z. Nótese la frecuencia de 2910 MHz fruto del Turbo mode que le permite escalar uno o dos grados de 133 MHz. En este caso a un multiplicador 22 desde el 20 nominal.

Temperaturas con el cooler retail:

PIC01479_400

Cooler retail del Intel Core i7 920. El que me conoce reconocerá mi maletín de piel marrón.

Escritorio1024_P95_SFFT

Prime95 Small FFTs  8 treads en Core i7.

Temp_Escritorio1024_P95_SFFT

Podemos decir que el refrigerador es algo justo. Aunque siendo honestos no es en absoluto culpa del procesador sino de la pobre construcción del refrigerador. Sin Heatpipes y mayoritariamente en aluminio.

cooler_al_400

Mucho más esta semana ...