jueves, 2 de febrero de 2017

Sandy Bridge fuera de especificación 4.0, 4.4 y 4.6 GHz. Actualizado. – ProfessionalSAT

En este artículo os ofrezco las prestaciones en CineBench R11.5 (Descarga la última versión) de tres Sistemas de Altas Prestaciones fuera de especificación. El primero un Core i7 930 D0 con un triple channel DDR3, el segundo un AMD Phenom II X6 a 4 GHz y por último el novísimo procesador Sandy Bridge Core i7 2600K. Estas dos últimas máquinas cuentan con un más convencional dual channel DDR3.

CBR11.5CineBench R11.5.

Para un análisis en profundidad de la microarquitectura subyacente en estos nuevos procesadores os recomiendo varios de mis artículos en LowLevelHardware, mi Blog más técnico:

- Microarquitectura Intel Sandy Bridge. Parte 1. Actualizado – LowLevelHardware
- Previo Intel Sandy Bridge. Actualizado – LowLevelHardware
- Intel Sandy Bridge versus Westmere die. Actualizado – LowLevelHardware
- Micrografía detallada de Intel Sandy Bridge – ProfessionalSAT
- Intel Sandy Bridge. Introducción – ProfessionalSAT

Actualización 19 de Enero 2011: Adición de resultados CineBench R11.5 multithreaded del AMD Phenom II X6 fuera de especificación a 4 GHz con NorthBridge y caché L3 de 6 MB ajustados a 2.82 GHz.

Actualización 21 de Enero 2011: Adición de la sección de escalado multithread y comentarios generales sobre microarquitectura del AMD Phenom II y futuras mejoras en AMD. Corrección de algunos errores gráficos.

Sistema Nehalem Core i7 930 D0 Quadcore

Sobre este procesador y sus hermanos de gama he basado durante ya más de dos años mis Sistemas de Altas prestaciones. Se trata de CPUs que desde los primeros steppings han mostrado un rendimiento IPC excelente además de un extremo potencial en frecuencia, llegando en los samples más afortunados a los ajustes que aquí se detallan.

El primer sistema consta de 3 módulos de 2 GB DDR3 configurados en triple channel a una frecuencia efectiva de 1451 MHz con latencias 7-7-7-14-1N.

SandyB_Nehalem_WestmereNehalem (izquierda) vs. Sandy Bridge (derecha).

La frecuencia de los cores es de 4 GHz con máxima carga de 8 threads y de hasta 4.2 GHz con carga de 1 thread (ambas frecuencias son sostenidas y estables en carga 100%).

Por su parte, el uncore (controladoras de memoria y otros buses internos) y la caché L3 de 8 MB están fijados a 3.439 GHz.

Sistema AMD Phenom II X6 Hexacore

El procesador Phenom II X6 está configurado a una frecuencia constante de 4 GHz (desde los 2.8 GHz nominales) mediante un bus de 282 MHz y un multiplicador X14. El Turbo Core permanece deshabilitado.

El North Bridge (que comprende la caché L3 de 6 MB y 48 vías y los buses y controladoras de memoria) está ajustado a 2.82 GHz (desde los 2 GHz nominales) mediante un multiplicador X10.

La memoria de esta máquina consta de 2 DIMM DDR3 1600 para un total de 8 GB ajustados a 1503 MHz con latencias 7-7-7-21 1T.

Sistema Sandy Bridge Core i7 2600K Quadcore HT

El subsistema de memoria consta de 2 DIMM de 4 GB DDR3 configurados a 1600 MHz con latencias 9-9-9-24 (nominales).

SB_Die_630Sandy Bridge quad core.

La frecuencia de los cores está fijada respectivamente a 4.0,  4.4 y 4.6 GHz. La caché LLC de 8 MB es síncrona a los cores, funciona a su misma frecuencia y está dividida en cuatro bancos de 2 MB y 16 vías de asociatividad.

Refrigeración de los procesadores

Debido a que utilizo los voltajes más bajos dentro de lo posible (siempre garantizando una total estabilidad de los equipos) la disipación térmica está realmente controlada.

Esto no supone un grave problema para los conjuntos ventilador – radiador utilizados, se trata de los famosos Scythe Mugen 2 B configurados con dos ventiladores Slip Stream de 12 cm en configuración push – pull.

Resultados CineBench R11.5

Designación Frecuencia 1 thread Multithreaded SpeedUp
Intel Core i7 2600K 3,4 / 3,8 GHz 3,4 / 3,8 GHz 1,55 6,96 4,49 X
Intel Core i7 2600K 4,0 GHz 4,0 GHz 1,62 7,82 4,82 X
Intel Core i7 2600K 4,4 GHz 4,4 GHz 1,76 8,61 4,89 X
Intel Core i7 2600K 4,6 GHz 4,6 GHz 1,86 8,91 4,83 X
Intel Core i7 930 D0 4,0 / 4,2 GHz 4,0 / 4.2 GHz 1,45 6,88 4,74 X
AMD Phenom II X6 1090T 4 GHz 4,0 GHz 1,25 7,07 5,66 X
Nehalem, Thuban y Sandy Bridge fuera de especificación.

Sobran los comentarios, el nuevo procesador Sandy Bridge supera en modo nominal al flamante Core i7 930 configurado fuera de especificación a 4 / 4.2 GHz (su límite práctico en frecuencia a voltajes pensados para utilización 24h).

El Phenom II X6 se defiende agresivamente gracias a sus 6 cores físicos y da un excelente resultado multithreaded que supera al Core i7 930 a 4 GHz con Hyper Threading y al nuevo Core i7 2600K “de serie” aunque se mantiene a una distancia respetable de los inalcanzables procesadores Sandy Bridge fuera de especificación.

imageCineBench R11.5. Resultados gráficos.

Tened en cuenta que el sistema i7 930 es ya de por sí sumamente rápido pero sin duda Sandy Bridge marca un hito prestacional y eclipsa definitivamente a Nehalem pese a contar solamente con un dual channel DDR3 1600 frente al triple channel 1451 MHz de Nehalem.

Además Nehalem cuenta en esta prueba con una frecuencia en su Uncore y caché L3 aumentada a 3.44 GHz desde los 2.66 nominales, lo que le ayuda en gran medida.

Escalado multicore / multithread

En esta sección analizo el incremento de velocidad de cálculo aumentando el número de threads desde 1 al máximo soportado por el procesador.

El AMD Phenom II X6 soporta seis threads, uno por core.

Tanto los Core i7 930 como los nuevos Core i7 2600K soportan 8 threads, dos threads por cada core físico (4 cores, 4 threads).

imageEscalado prestacional multihilo en CineBench R11.5.

Empezando por el procesador AMD Phenom II X6 constato un excelente escalado acercándose mucho al valor máximo teórico de 6X, quedando en 5.66X lo que dice mucho del excelente trabajo realizado por los ingenieros de AMD respecto al acceso concurrente de todos los cores hacia la caché L3 y los dos canales DDR3.

Sin duda AMD, con un SMT al estilo de Intel, superaría un factor de 6X y estaríamos rondando el 7.5X para un score multithreaded sobre los 9 puntos, rondando o superando la velocidad de cálculo del Core i7 2600K a 4.6 GHz.

De todos modos donde AMD debería poner énfasis es en su IPC por core, muy inferior al de Intel (sobre un 20 – 30 %) y especialmente en refinar su Branch Prediction y aumentar la asociatividad de sus cachés L1.

Respecto a los dos procesadores de Intel, señalar que gracias a Hyper Threading (el SMT de dos vías implementado en ellos) consiguen superar el factor de 4X (factor máximo para un quad core) y acercarse prácticamente a un escalado de 5X. También un remarcable resultado.

Poco más puede decir… se acabó la era Nehalem…

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

Carlos Yus Valero – informaticapremium informaticapremium-logo-150px[3]