lunes, 29 de diciembre de 2008

PCIEx = AGP8X - ProfessionalSAT

La vida me ha enseñado que siempre quedan cosas por ver en cualquier ámbito y hablando de los equipos que entran en el SAT día a día constato que es así.

Hoy os presento un caso increíble. Un cliente compró una SVGA AGP8X para ampliar su sistema y, según me explicaba, notó que no "entraba del todo bien".

PIC01580

¿No veis algo extraño? Debajo se aprecia mejor ...

PIC01585

¡No puede ser, una AGP8X incrustada en un PCIEx 16X!

PIC01586

El usuario en cuestión debió pensar: "Todos esos pines que sobran están de adorno ..."

Probó a encender el equipo y según él "hacía unos pitidos extraños" y "no daba imagen por pantalla" ... por lo que decidió, haciendo un alarde de bricolaje casero"recortar" , la torre para "hacer sitio" a la tarjeta (por que como él decía "no encajaba"):

PIC01590

Más que "recortar" arrancó un trozo de chapa ...

PIC01591

Sí, aunque no lo creáis era un humilde e inocente slot PCIEx16.

PIC01587

¿Para qué servirá este puente PCIEx->AGP8X si lo "enchufamos" a un PCIEx 16?

PIC01589

Vista del slot PCIEx a través del "bricolaje" practicado en la torre.

PIC01581

No comment!

Sin decir nada, lo entré al taller y sustituí la SVGA AGP8X que el cliente en cuestión había comprado el día anterior por una PCIEx 16X y, ¡Milagro! arrancó y dio imagen. Cambio en garantía de SVGA y tupido velo ...

Etiquetas de Technorati: ,,,,,,,

domingo, 28 de diciembre de 2008

Pasta térmica y transferencia de calor I - ProfessionalSAT

La interfaz térmica entre el procesador y el disipador está ganando importancia conforme la densidad térmica aumenta en los nuevos diseños de AMD e Intel. Cada vez hay más transistores por mm2 y funcionan a mayores frecuencias lo que crea hot spots de difícil tratamiento. Por ello, una correcta elección de la interfaz térmica es crítica para garantizar la estabilidad de nuestro sistema.

AS5_big_blue1[1]

Una de las mejores y más aclamadas pastas térmicas: la excelente Arctic Silver 5.

Hay dos tipos de interfaces térmicas aplicadas a procesadores:

  • Pastas térmicas. De naturaleza líquida y más o menos viscosa las hay con base de silicona o aceites sintéticos y como componente de transferencia térmica óxidos de aluminio, plata metálica micronizada, compuestos cerámicos micronizados ...
  • Thermal pads o materiales de cambio de fase: Son más densos que las pastas térmicas a temperatura ambiente teniendo una apariencia sólida plástica. Con el aumento de temperatura pasa a un estado líquido viscoso que hace que bajo la presión ejercida por el disipador se rellenen uniformemente los vacíos de las irregularidades de las superficies.

TPad

Thermal Pad sobre un refrigerador con núcleo de cobre y láminas de aluminio Intel.

TPad2

Retirando la protección de un thermal pad.

Normalmente un buen thermal pad tiene mejor estabilidad a largo plazo que una pasta térmica debido a su mayor viscosidad y está recomendado sobretodo para CPUs desnudas, es decir, sin heat spreader (Pentium III S370, Athlon y Athlon XP S462, procesadores de portátiles como Intel Banias, Dothan, Yonah, Merom, Penryn o AMD Athlon64 mobile, Turion, TurionX2).

Función de la interfaz térmica:

El propósito de la pasta térmica es llenar y ocupar totalmente los huecos entre el heat spreader del procesador y la base del disipador de CPU que de otro modo estarían llenos de aire (que como todos sabemos es un excelente aislante térmico).

Llenando estos vacíos (zona irregular blanca en la imagen inferior) transmite eficazmente el calor desde el heat spreader a la base del disipador (en este caso ambos de Cobre "chapado" en Zinc).

Image1

La interfaz térmica debe rellenar con precisión los vacíos y crear una conducción térmica eficaz.

Las pastas térmicas se presentan normalmente en jeringuillas, sobres plásticos o frascos para su correcta aplicación, en cambio los thermal pads suelen venir preaplicados sobre la superficie de la base del disipador o protegidos entre dos láminas plásticas.

Opteron_Paste

Fuente: AMD, Thermal Interface Material Comparison: Thermal Pads vs. Thermal Grease

Conductividades térmicas de algunos metales puros:

  • Plata (Ag): 4.29 W/cmK (Metal noble, lentísima oxidación al aire)
  • Cobre (Cu): 4.01 W/cmK (Lenta oxidación al aire)
  • Oro (Au): 3.17 W/cmK (Metal noble, no es oxidado por el aire)
  • Aluminio (Al): 2.37 W/cmK (Lenta oxidación por el aire)
  • Zinc (Zn): 1.16 W/cmK (Lentísima oxidación por el aire)
  • Hierro (Fe): 0.802 W/cmK (Rápida oxidación al aire)

Debido a la relación precio / prestaciones los mejores disipadores del mercado recurren a cuerpos de cobre con heat pipes también de cobre y láminas de disipación en cobre o aluminio. Normalmente el cobre se pasiva con una ligerísima capa de zinc para evitar su oxidación por el oxígeno atmosférico.

Tiempo de cura o rodaje:

Las pastas térmicas y los thermal pads no despliegan todas sus prestaciones nada más ser aplicados, necesitan al menos de 24h para llegar a su conductividad térmica óptima. Arctic Silver recomienda 200h de uso con ciclos de encendido - apagado para asentar los componentes (ciclos térmicos) y lograr el máximo rendimiento.

PIC01577_thumb[1]

En la segunda parte trataré la correcta aplicación de la pasta térmica en función del procesador que tengamos entre manos, me centraré en los siguientes modelos:

  • Procesadores Intel con die desnudo (Pentium III S370 y CPUs de portátiles e Intel Atom)
  • Intel Pentium 4 single core S478 o S775 (Willamette, Northwood y Prescott cores)
  • Intel Pentium D serie 800 dual core S775 (90 nm Smithfield core)
  • Intel Pentium D serie 900 dual core S775 (65 nm Presler core)
  • Intel Core2Duo dual core S775 (núcleos Conroe 65 nm y Penryn 45 nm)
  • Intel Core2Quad quad core serie 6000, 8000 y 9000 S775 (núcleos Conroe 65 nm y Penryn 45 nm)
  • Intel Core i7 quad core (núcleo Nehalem 45 nm)
  • Procesadores AMD con die desnudo (Athlon, AthlonXP y CPUs de portétiles)
  • AMD Athlon64 single core S754 / S939 / AM2 (130 nm y 90 nm)
  • AMD Athlon64 X2 dual core S939 / AM2 (90 nm y 65 nm)
  • AMD Phenom X4 quad core AM2+ (65 nm core Barcelona)
  • AMD Phenom X3 triple core AM2+ (65 nm core Barcelona)
  • AMD Athlon X2 serie 7000 dual core AM2+ (65 nm core Barcelona)
  • AMD Phenom II X4 quad core AM2+ (45 nm core Shanghai)

Debemos tener en cuenta que es necesario saber donde están físicamente los núcleos debajo del heat spreader para posicionar correctamente la pasta térmica en cantidad y orientación, más en la segunda parte ...

sábado, 20 de diciembre de 2008

Equipos de altas prestaciones: 1.2 KW, Intel X38 y DDR3 - ProfessionalSAT

Ayer tuve el placer de encontrarme con un sistema montado en una gigantesca torre Antec:

  • Intel Core2Quad Extreme QX6800 desbloqueado
  • Placa base Asus X38 DDR3
  • 4 DIMM DDR3 OCZ Platinum 1066 1.5 V
  • F/A doble Antec de 1.2 KW Antec
  • nVidia GeForce 8800 GTX

Un equipo con un año a sus espaldas y 4000E del ala de entonces (!!).

Es un sistema comprado por internet y lo ha traído un cliente quejándose de inestabilidad en juegos DX9 y DX10 tras dos o más horas de uso que le provoca un bloqueo del sistema y paralización del sonido.

PIC01529

Vista general del equipo.

PIC01531

Zona del procesador y RAM.

PIC01533

Los 4 módulos OCZ DDR3 1066, una joya en manos de técnicos experimentados.

PIC01526

Detalle de la brutal fuente Antec doble de 1200W.

PIC01525

Con su túnel de ventilación y cámara separada junto con los dos discos duros, entre ellos un WD Raptor.

PIC01528

Vista trasera de la torre, observad las "dos" fuentes.

PIC01563

La regulación manual de los dos ventiladores superiores y el trasero.

Y ahora llegamos a la raiz del problema, pruebas de esta misma mañana:

PIC01562

Sólo tres minutos de Prime95 y 74ºC, desde los 37º en reposo, a la media hora llega a los 98ºC y empieza el Thermal Throtling monitorizado con RMClock y Hardware Monitor. 98º que serían más y habrían acabado con el procesador de no ser por la protección térmica automática brindada por el Thermal Monitor 2 de los procesadores Core2.

Un claro fallo de la interfaz térmica entre CPU y disipador:

PIC01567

PIC01568

Como vemos la pasta térmica ha desaparecido de las zonas con gran disipación térmica, los dos dies Core2. En la foto están situados sobre la vertical en el centro.

PIC01569

Vista del disipador, la pasta térmica ya no cumplía con su función.

PIC01573

Limpieza de CPU ...

PIC01573b

Y el C2Q Extreme QX6800 en todo su esplendor.

PIC01577

Nueva pasta térmica y ...

PIC01578

... un magnífico Artic Cooling Freezer Extreme.

La semana que viene más ...

Etiquetas de Technorati: ,,,,,,

viernes, 19 de diciembre de 2008

nVidia Ion, nueva vida para Atom - ProfessionalSAT

Desde las páginas de LowLevelHardware y desde este mismo blog he criticado hasta la saciedad la horrible y desafortunada elección del chipset referencia para los procesadores Atom (Silverthorne) por parte de Intel, el arcaico i945G.

reference_photo2[1]

nVidia ha fabricado un interesante "juguete".

Image1

Página de inicia de nVidia.es

Recordemos que Atom en su primera implementación junto al chipset i945G es incapaz de reproducir video HD, además de ser extremadamente lento en aplicaciones 3D por culpa de los mediocres gráficos integrados.

Silverthorne_package

Atom junto a Poulsbo. Atom es el procesador de menor tamaño.

nVidia ha decidido entrar en el mercado de los sistemas con procesadores Silverthorne y lo ha hecho por la puerta grande, con su chipset GeForce 9400M. A esta plataforma le ha dado el nombre de Ion.

  • Compatible con Windows Vista Premium.
  • Gráficos DirectX 10 de alta calidad con conexión a pantallas digitales.
  • Tecnología CUDA de coproceso mediante la GPU para acelerar la conversión de vídeo y ejecutar aplicaciones de alta carga computacional (una buena ayuda para Silverthorne.
  • Vídeo HD 1080p con audio 7.1.

Ion_1

nVidia simplemente ha montado en una placa con un procesador Atom un chipset de Core2, debido a que Atom comparte el diseño físico y eléctrico de su bus con los Pentium 4 y Core2.

Os muestro una fotografías de una placa referencia del diseño, formato microITX, minúsculo:

reference_photo6[1]

Silverthorne es insignificante al lado del 9400M.

 reference_photo5[1]

Toda la placa cabe en la palma de una mano (!!).

reference_photo7[1]

Apenas hay espacio para los puertos ...

reference_photo8[1]

En la parte inferior de la placa se observa el socket para un SODIMM DDR3.

El chipset GeForce 9400M cuenta con:

  • 16 shaders processors.
  • 20 lanes PCIEx.
  • Relojes de 580 MHz core / 1.4 GHz shaders.
  • Fabricado en 65 nm.

Ion2

Sin duda será un éxito de ventas. Además mantiene el consumo respecto a la solución de Intel y con la experiencia y calidad de nVidia en el terreno de los gráficos ... y sus excelentes drivers.

Estoy deseando echarle el guante ...

Etiquetas de Technorati: ,,,,,,,,

miércoles, 17 de diciembre de 2008

Rumores AMD ATI RV775 - ProfessionalSAT

Según los últimos rumores, ATI va a introducir en breve una nueva gama de procesadores gráficos para competir con las nuevas tarjetas gráficas de nVidia, las GTX295. GTX295 será una tarjeta doble (dos placas con sus GPUs y chips de memoria y un ventilador único).

rv775

Parece ser que ATI ha fabricado un nuevo procesador con más procesadores (840) y más unidades de texturas (48) manteniendo el proceso de fabricación y utilizando menos transistores, todo un logro.

Aunque mi opinión al respecto de estos datos es de reserva. Veo más lógico que el RV775 y el RV770 compartan el mismo diseño, es decir, que sean el mismo chip aunque no necesariamente el mismo stepping. AMD puede haber reservado los mejores dies para el RV775.

45843A_RV770_single_Chip_Frt[1]

No sería extraño que ATI hubiera puesto originalmente 840 procesadores en el RV770 habiendo activado solamente 800, igualmente pasaría con las unidades de texturas (40 activadas de 48). Es una técnica usual utilizada por todos los fabricantes y consiste en incluir en el diseño un número extra de unidades redundantes para aumentar la tasa de chips funcionales (yield) con una configuración dada.

En cualquier caso, sin duda AMD plantará cara a nVidia en el segmento de gama alta y nos espera una dura lucha ya que nVidia ha optado por seguir los pasos de ATI y fabricar tarjetas gráficas con dos GPUs pese a haber hecho campaña en contra de esta opción.

Etiquetas de Technorati: ,,,,,,,

martes, 9 de diciembre de 2008

CPUs lógicas vs. cores - ProfessionalSAT

Hace unos días analicé en un artículo de LowLevelHardware la problemática que crea el hecho de las ocho CPUs lógicas en procesadores Core i7, aquí haré un resumen de las conclusiones de aquel artículo.

Como sabéis un procesador Core i7 está compuesto de cuatro núcleos con SMT de dos vías, lo que nos da un total de 8 threads ejecutables concurrentemente. El sistema operativo no es capaz de discernir entre procesadores reales y lógicos y a veces no asigna los recursos de manera óptima.

Image8

Core i7: Captura del Administrador de Tareas.

En una CPU Core i7 las CPUs lógicas están emparejadas de dos en dos como sigue:

  • Las CPUs lógicas 0 y 4 (en azul) forman parte del primer núcleo o procesador físico (real).
  • Las CPUs lógicas 1 y 5 (en marrón) forman parte del segundo núcleo o procesador físico (real).
  • Las CPUs lógicas 2 y 6 (en rojo) forman parte del tercer núcleo o procesador físico (real).
  • Las CPUs lógicas 3 y 7 (en verde) forman parte del cuarto núcleo o procesador físico (real).

CPUsLogicasNEHdie

Para un análisis más detallado y con mediciones prestacionales recomiendo el siguiente artículo.

Etiquetas de Technorati: ,,,,,

Encuesta: ¿Cómo te afecta profesionalmente la crisis? - ProfessionalSAT

La grave crisis financiera que ha provocado la mala praxis de muchos gurús de la bolsa y ejecutivos de campanillas ha llevado al grueso de las economías mundiales a una profunda crisis económica global.

En el caso doméstico, la renta disponible de las familias se reduce día a día y como resultado el consumo se resiente y con ello las cuentas de resultados y los balances.

Como sé que muchos de vosotros, profesionales del mundo de las TI, tenéis negocios o trabajáis por vuestra cuenta me gustaría que compartiérais vuestra visión y el impacto en vuestra vida profesional de este crudo episodio económico.

jueves, 4 de diciembre de 2008

AMD Phenom II Shanghai. Perspectivas - ProfessionalSAT

AMD ya comercializa los nuevos procesadores quadcore basados en el nuevo núcleo Shanghai de 45 nm. En este artículo hablaré sobre las diferencias con el AMD Barcelona de 65 nm y haré una estimación de sus prestaciones así como de sus frecuencias esperadas.

amd_01[1]

Fotografía del die de AMD Shanghai 45nm

Cambios microarquitecturales

Respecto al AMD Barcelona, utilizado en los Phenom y Opteron quadcore de 65 nm, Shanghai aporta algunas mejoras importantes y algunos otros trucos para incrementar el rendimiento.

Shanghai estará fabricado en el nodo de 45 nm (por las actuales fábricas de AMD en Alemania) con una superficie total estimada de 258 mm2 (frente a los 283 mm2 de Barcelona) contando con unos 758 M de transistores (frente a los 483 MT de Barcelona).

Block_Diagram_for_Socket_F1207White_Background_375W[1]

Esquema de Shanghai

Caché L3 de 6 MB

En primer lugar Shanghai aumenta el tamaño de la caché L3 de 2 a 6 MB siendo una cantidad más acorde al diseño del procesador y acercándole a las cachés de sus rivales de Intel (Core 2 y Core i7).

La arquitectura de caché queda del siguiente modo:

  • L1 de 64 KB + 64 KB (Datos e instrucciones)
  • L2 de 512 KB por núcleo
  • L3 común para los cuatro núcleos de 6 MB (6144 KB)

Un amplio espectro del software actual se beneficiará significativamente del nuevo tamaño de la caché L3, ya que 2 MB para cuatro procesadores se antojaba claramente insuficiente, recordemos el gráfico siguiente:

rmma_20080512_214303_0609

Latencias de L1, L2, L3 y RAM en un Phenom 9600 BE stepping B2 sin TLB Patch

Podemos ver que la zona de L3 es exigua y gran parte del código actual no se ajusta a esas dimensiones y más pensando en entornos reales multitarea, en los que se ejecutan concurrentemente diferentes programas con ubicaciones y datos diferentes en memoria y con sets de trabajo globales superiores a los 2 MB.

Latencia y frecuencia de L3

Además la L3 de Shanghai no solo mejora su capacidad sino también en velocidad. Su frecuencia aumenta (en los primeros modelos) a 2.2 GHz desde el máximo de 2 GHz de Barcelona.

L3_Cache_Architecture[1]

Arquitectura de caché exclusiva de Shanghai. Fuente AMD Developer Blogs

Se ha rediseñado su esquema de acceso, reduciendo de manera drástica su latencia (latencia efectiva medida) de 53 ciclos en Barcelona a solo 43 en Shanghai (igualando de este modo a Core i7 en su latencia L3). Este es un punto muy importante y en innumerables ocasiones he criticado (a veces duramente) este aspecto de la arquitectura K10. Esta mejora en latencia L3, aportará por sí misma una buen plus en prestaciones.

Extraído de AMD Developer Blogs, Larger L3 in Shanghai. Part I:

" Latency reduction in the new L3 cache:

Within the processor the L3 cache is part of the north bridge subsystem and runs at the North Bridge (NB) frequency. Hence the L3 hit latency is also dependent on the NB frequency.

"Shanghai" has a best case latency of 29 CPU clocks, whereas "Barcelona" had a best case latency of 34 CPU clocks. So the lower latency to data stored in L3 cache should also help to significantly boost performance. "

Hardware Prefetch

Los arquitectos de AMD han trabajado también en el rediseño y mejora del mecanismo de Hardware Prefetch, que funciona precargando en caché los datos e instrucciones que el algoritmo estima serán necesitados posteriormente por el programa reduciendo así la latencia efectiva de la memoria y acelerando la ejecución.

Optimizaciones caché probing

AMD ha doblado el ancho de banda de test de L2 y L1 de cada núcleo para probar la coherencia de los datos (Probe Bandwidth). Recordar que AMD utiliza arquitecturas de caché exclusivas que fuerzan un alto tráfico de coherencia de cachés para comprobar que los datos en ellas son correctos y solo existe la "última versión" en todos los niveles de caché y en memoria principal.

Optimizaciones energéticas y de consumo

Shanhai se fabrica en 45 nm y cuenta con un ACP de 75 W en sus versiones Opteron de 2.3 a 2.7 GHz. Las versiones Phenom II de sobremesa probablemente llegarán a los 105W ACP a 3 GHz. La reducción de consumo y disipación térmica es muy importante destacando que un Opteron Shanghai a 2.7 GHz disipa bastante menos que un Barcelona a 2.3 GHz.

Shanhai_die_top

AMD ha dotado a Shanghai con un sistema que permite "dormir" a un núcleo "sin trabajo" totalmente moviendo sus contenidos de L1 y L2 a la L3 compartida permitiendo así parar el reloj de los cores no utilizados. En cualquier caso, este núcleo con el reloj detenido sigue consumiendo debido al Leakage. AMD ha llamado a esta tecnología Smart Fetch.

Para una excelente y divertida discusión sobre Leakage recomiendo la siguiente lectura de ArsTechnica:

The future of Prescott: when Moore gives you lemons...

Conclusiones:

En resumen, esperemos a verlos en acción en el terreno sobremesa. AMD parece que ha encontrado con Shanghai la senda del éxito y puede lanzar productos competitivos en la gama baja y media quadcore. Parece ser que inicialmente los nuevos Phenom II llegarán a los 3 GHz con el modelo 940 BE.

Probablemente un AMD Shanghai sea equivalente o ligeramente inferior en prestaciones a un Core2Quad a la misma frecuencia, lo que para AMD es un gran paso adelante.

Si el proceso de 45 nm evoluciona favorablemente para AMD y puede producir versiones superiores a los 3 GHz a lo largo de 2009 Shanghai será todo un éxito, pero no nos llevemos a engaño, Core i7 está a otro nivel, en prestaciones y ... en precio.