martes, 25 de agosto de 2009

Sistemas de Altas Prestaciones, algoritmos de Inteligencia Artificial. Parte I – ProfessionalSAT

Después de un período en el que he alternado semanas de vacaciones con breves periodos de trabajo vuelvo de nuevo con energía renovadas, aunque todavía con unos diez días de vacaciones pendientes…

PIC03282

En estos momentos estoy enfrascado en el diseño de un sistema que realizará tareas de investigación en inteligencia artificial, análisis Monte Carlo y evaluación de soluciones óptimas mediante tablas Hash. Su proceso se centrará en ocho threads concurrentes con carga 100% con un mix de instrucciones de enteros e intensivamente de branch prediction.

Es el primer sistema de cálculo que optimizo para proceso de enteros y no para coma flotante como es habitual en mis sistemas de altas Prestaciones fuera de especificación. Observando atentamente las cargas de trabajo a las que se verá sometido continuamente este sistema y analizando la dinámica de los performance counters del procesador así como su consumo y temperatura pico he llegado a varias conclusiones:

  • Este tipo de procesamiento es menos arduo en cuanto a cargas térmicas y eléctricas que las cargas de trabajo típicas de mis sistemas (principalmente coma código en flotante altamente optimizado).
  • Hay un margen superior en cuanto a frecuencia máxima debido a temperaturas inferiores en carga en unos 8 – 10 ºC.
  • En un artículo a parte hablaré brevemente sobre este tipo de cargas de trabajo con un análisis mediante PerfMonitor.

Para este peculiar trabajo son necesarios 12 GB de memoria y un sistema operativo de 64 bit, en este caso Windows XP 64. Ya en Febrero de este año monté otro sistema con 12 GB para uso en arquitectura, principalmente para AutoCad.

PIC03146 Alguna de las piezas que conformarán este Sistema de Altas Prestaciones.

Para esta compleja tarea he elegido los siguientes componentes principales:

  • Torre Antec 900 Two
  • Placa base ASUS P6T Deluxe V2
  • Procesador Core i7 920 stepping D0
  • ASUS Triton 88
  • 12 GB en 2 KITs de 3 DIMMs de DDR3 1600 Patriot 8-8-8-24 1.65 V
  • ATI HD4670
  • HD 1 TB
  • SSD Intel X25M G2 34 nm 80 GB
  • F/A 720W Tacens

Configuración fuera de especificación:

Los Core i7 920 tienen una frecuencia nominal de 2.66 GHz y 2.8 GHz en Turbo Mode multithreaded, en esta ocasión y gracias a la variación del Host Clock desde los 133 MHz nominales hasta los 181 MHz conseguimos una frecuencia efectiva en carga 100% en Windows de 3.82 GHz.

La frecuencia objetivo para el Uncore (controladora de memoria y la caché L3 de 8 MB) es de 3622 MHz, con un aumento de un 70% (!!) desde los 2133 MHz nominales de los procesadores Core i7 920 stepping D0.

Como destaqué en varios artículos anteriores la frecuencia del Uncore es crítica en las prestaciones de un procesador Core i7.

PIC03157 Uno de los preciados i7 920 en stepping D0.

Un punto importante a considerar al configurar sistemas Core i7 (y que es extensible a otras plataformas) es considerar el incremento de la exigencia a las controladoras de memoria con cargas elevadas de las mismas (cargas eléctricas).

En este caso se montan seis DIMM de 2 GB llenando todos los slots, este hecho hace que tenga que ser especialmente cuidadoso con los ajustes en BIOS en cuanto a voltajes y multiplicadores de las controladoras de memoria integradas en los chips Nehalem.

Normalmente con tal carga es necesario recurrir al ajuste 2T e hilar fino con el voltaje tanto en Uncore como en memoria y QPI.

PIC03148 Los siempre excelentes Kits de 6 GB Patriot a 1600 MHz.

PIC03150 Detalle de los 6 DIMM DDR3.

PIC03151 Ya montados sobre la ASUS P6T Deluxe V2.

PIC03154 Vista del área del socket LGA 1366.

PIC03155 El Core i7 920 presentado sobre la placa base.

Mejoras en la placa base:

En las placa base P6T Deluxe de Asus llevo a cabo algunas mejoras de cara a optimizar la refrigeración del chipset X58, ya que la frecuencia del QPI será incrementada por encima de los máximos 6.4 GHz llegando a unos 6500 – 6600 MHz.

PIC03158 Parte inferior de la P6TDeluxe V2.

En primer lugar procedo a apretar los dos tornillos negros de la captura anterior para aumentar la presión sobre el chipset X58 (siempre con cautela…), a mayor presión mejor transferencia térmica.

La segunda mejora consiste en sustituir el Thermal Pad que esconde el radiador del chipset en su interior por pasta térmica de primera calidad.

PIC01862Radiador del X58 desmontado, se aprecian sus dos partes de cobre y aluminio.

PIC01866Disipador del X58 desmontado con el thermal pad visible.

En la foto anterior podemos apreciar las dos partes, la superior en aluminio lacado en negro y la inferior, un bloque sólido de cobre atravesado por el heat pipe.

PIC01867

Como podemos apreciar, el contacto térmico entre ambos componentes es fácilmente mejorable, por lo que elimino el thermal pad de origen y lo sustituyo por pasta térmica, en este caso Artic Cooling MX2.

PIC01863Thermal pad retirado y superficies limpias, listas para aplicar la interfaz térmica.

PIC01864El thermal pad, seguro que encuentro algún chip donde ponerlo …

PIC01869Por el orificio podemos ver la pasta térmica aplicada producto de la intensa presión de los tornillos.

PIC01871El disipador de aluminio ya montado y listo.

PIC03159 La zona central no hacía contacto térmico, perjudicando gravemente la refrigeración.

La tercera consiste en retirar el embellecedor que cubre el radiador de calor de láminas de cobre del south bridge ICH10R:

PIC01892

Muchos fabricantes de placas base tienen últimamente la extraña e incomprensible costumbre de tapar los radiadores con chapitas de aluminio con sus logos. Sinceramente me parece ilógico e incluso estúpido aunque quizás a los responsables de marketing les parecerá muy bonito:

PIC01887Disipador del southbridge ¿dónde está? … tapado tras el logo de ASUS.

PIC01907Ahora sí, el radiador ya puede realizar su función de irradiar calor infrarrojo y disipar por convección y conducción.

Ahora llega el turno del montaje del radiador – ventilador de CPU. Como sabéis, en procesadores fuera de especificación es más importante si cabe la elección de un compuesto térmico adecuado y una correcta colocación. Segundo enlace.

Si nominalmente un i7 920 stepping D0 disipa en pico sobre los 130W (entre los 4 cores con SMT, la cahé L3, las 3 controladoras de memoria, el QPI y el northbridge integrado) en condiciones fuera de especificación como las expuestas y debido al aumento de frecuencia y al aumento de varios voltajes aterriza en valores sobre los 200 – 225 W estimados.

Montaje fuera de la torre. Tests de memoria:

Una vez optimizados estos aspectos, procedo con la configuración de BIOS a las frecuencias objetivo fuera de especificación y empiezan ya los tests de memoria fuera del sistema operativo.

PIC03162 El sistema ya pasando los rigurosos tests de memoria tras la configuración de BIOS.

PIC03164 Otra vista.

PIC03167 Memtest+ 2.11 con 12 GB.

Dentro de unas 24h veré los resultados del test.

viernes, 17 de julio de 2009

Cambio electrónica disco duro Seagate – ProfessionalSAT

Muchas veces nos hemos encontrado con un fallo físico de un disco duro. La duda en estos casos reside en saber si es fallo electrónico (de la tarjeta de circuitos integrados) o mecánico del propio mecanismo del disco duro (platos, cabezas, servos, …)

La única manera de averiguarlo es conseguir un ejemplar idéntico nuevo y sustituir la placa electrónica, confiando en que la avería se encuentre en ella y no en el disco propiamente dicho.

Orden y método

Lo primero es tener claro qué vamos a hacer y como vamos a operar. En segundo lugar es crucial un orden escrupuloso con cada tornillo y cada componente identificado.

5Dos discos idénticos, a la izquierda el defectuoso (antiguo).

4 Les damos la vuelta y procedemos a desmontar las dos placas…

3 Presentamos cada tornillo en su sitio para después no dar lugar a errores de montaje.

2 Otra vista.

1 Placas ya desmontadas.

Debemos asegurarnos de que los discos deben ser absolutamente idénticos, esto se sabe por las inscripciones.

Tras probar el disco defectuoso con la nueva placa de circuitos seguía fallando del mismo modo, con lo que podemos concluir que el fallo es mecánico y no podemos hacer nada más.

Echad un vistazo a la web de mi nueva empresa, un proyecto de gran envergadura que llevo preparando hace más de un año.

Os lo recomiendo para la recuperación de datos profesional:

ip16_texto_300px_blanco

Allí tenéis a vuestra disposición el formulario de contacto, para consultas sobre este artículo hacedlo más abajo en la sección de comentarios.

Y mi nuevo Blog de contenido muy técnico y actualizado donde encontraréis artículos míos sobre hardware, procesadores y sistemas y también otros posts de expertos programadores e informáticos sobre otros temas:

infromaticapremium-blog

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

Sin comentarios: La crisis - ProfessionalSAT

De camino al trabajo paso cada día por un establecimiento dedicado a las puertas y marcos y me llamó la atención el siguiente cartel alegórico a la crisis para subir las ventas:

1 O gastamos o todos al paro.

Una frase lapidaria, no comment.

Etiquetas de Technorati: ,

Renfe, retrasos, incivismo y cuelgues – ProfessionalSAT

Retrasos…

Hace unos días viajé a Barcelona en tren, disfrutando de las excelencias de las cercanías en Catalunya. Llegué con el habitual retraso de media hora en un trayecto de menos de 100 km (Tarragona – Barcelona). Pero me pudo el “seny” catalán y no protesté (y no por falta de ganas y cabreo) pues ya estamos acostumbrados (más o menos como cuando pagamos en los peajes de las autopistas)…

Cuelgues…

1El Active Desktop de Windows XP… colgado.

2 Panorámica.

Incivismo…

Me siento en el tren, lo que es todo un éxito (porque Renfe tiene la costumbre de poner “micro trenes” hacia Barcelona (yo creo que disfrutan hacinando a los viajeros…) y mirad qué me encuentro.

3 Uñas mejilloneras del “incívico de turno”, ya decía yo que olía a cabrales.

De todos modos he visto cosas peores, como una vez que llevábamos detrás unas “señoritas” (por decir algo) de procedencia oriental (probablemente china) que se estaban cortando las uñas con un cortaúñas y éstas salían volando y le caían a mi hijo en la cabeza…

Etiquetas de Technorati: ,

martes, 14 de julio de 2009

Dos nuevos sistemas Core i7 D0 – ProfessionalSAT

En este artículo os presento dos nuevos sistemas i7 basados ambos en el popular modelo 920 stepping D0 pero con placas base Asus P6T de diferente modelo:

  • Una P6T y el otra máquina con el modelo superior, la P6T DeLuxe V2 con su sistema de refrigeración de heatpipes en cobre.

PIC02892 Intel X58 bien refrigerado en la P6T DeLuxe V2.

Y con tarjetas gráficas y fuentes de alimentación muy diferentes debido al uso muy diferenciado de ambos sistemas:

  • Una ATI 4670 de 1 GB con una excelente F/A AOpen de 880W para el sistema de la P6T DeLuxe.
  • Una GeForce GTX260 216 cores con una F/A Tacens Valeo II modular de 600W.

PIC02890 Uno de los sistemas pasando Memtest mientras el otro, ya montado, se las veía con Prime95

La metodología de validación de estas máquinas es diferenciada del resto de sistemas, ya que al ser sistemas dirigidos a un público singular por sus necesidades y requerimientos de calidad, debemos esmerarnos más si cabe en su montaje y posterior test.

Un equipo normal basado en procesadores Core 2 Duo  o Athlon 64 X2 lo solemos entregar incluso en el mismo día, tras validarlo unas dos horas con Prime95 después de dos o tres pasadas de Memtest, ya que muchos clientes valoran los plazos breves de montaje y entrega.

En cambio, los sistemas de mayor nivel, entre los que a día de hoy se incluyen los basados en los siguientes procesadores (siempre configurados a frecuencias nominales):

  • Core 2 Quad de la serie 9000
  • Phenom II X4
  • Core i7

Necesitan de, como mínimo, dos o tres días de pruebas para asegurar su óptimo rendimiento y la máxima estabilidad.

Las máquinas basadas en los procesadores anteriores pero con frecuencias y ajustes de BIOS fuera de especificación los entrego de media tras unos 15 días de validación.

PIC02892B En la P6T DeLuxe V2 observamos que el North Bridge estaba preparado para un segundo heatpipe.

PIC02903 En cambio, en la P6T la refrigeración es más convencional, aunque no menos eficaz.

PIC02913 Los dos sistemas ya montados y preparados para los tests de estabilidad.

PIC02920 Detalle de la torre Noctua con ventiladores en push pull.

PIC02919 Las láminas del radiador Noctua, optimizado para ventiladores de pocas rpm.

PIC02901 Los conectores PCIEx de 8 pines de la Tacens Valeo II 600W.

PIC02900 … conectados a la GTX 260 216 cores.

Etiquetas de Technorati: ,,,,,