jueves, 30 de septiembre de 2010

Recopilatorio: Sistemas de Altas Prestaciones - ProfessionalSAT

Como mis lectores más asiduos saben, una de mis principales ocupaciones consiste en el diseño, montaje y validación de Sistemas de Altas Prestaciones.

Son actualmente, hasta que haya disponible alguna arquitectura superior, equipos basados en procesadores Intel Core i7 (normalmente 920 / 930 / 950 / 960) configurados fuera de especificación.

Ci7_Nov2008 Desde Noviembre de 2008 migré todos mis sistemas a la arquitectura Nehalem.

Todos ellos son versiones para socket LGA 1366 con triple channel DDR3 por dos importantes razones:

  • Mayor margen y flexibilidad en frecuencia fuera de especificación..
  • Mayor capacidad de memoria al haber disponibles seis slots físicos para DDR3 en placa.

Las frecuencias a las que quedan configuradas estas máquinas con procesadores (todas ellas) basados en stepping D0 son las siguientes:

  • En cores desde los 3.6 GHz hasta los 4.2 GHz en función del nivel de exigencia del cliente y de la calidad de los componentes. El incremento máximo es de un 58 %.
  • En Uncore (caché L3 de 8 MB, controladoras de memoria) de los 3.2 a los 3.6 GHz desde los 2.13 GHz nominales con mejoras en frecuencia de hasta un 69%.

PIC03259Algunos de estos sistemas recurren a soluciones “imaginativas”.

Estos incrementos de frecuencia tan radicales aseguran unas velocidades de calculo inalcanzables para sistemas “de serie” y además, y ahí reside el “secreto” de mi trabajo, con absoluta estabilidad para un funcionamiento continuo y sin interrupción alguna.

P95_BlendPrime95 Blend, T máxima  82ºC, excelente a 4.2 GHz por aire.

Pensad que el grueso de estos sistemas (sobre un 55%) van destinados a cálculo intensivo. Se trata de cálculos en coma flotante compilados específicamente para la máquina con los últimos compiladores de Intel Fortran para arquitectura Nehalem.

Sinus8X8 threads de cálculo intensivo e ininterrumpido.

Son procesos de cálculo que se lanzan afinitizados por thread (ocho por CPU en Core i7 con HT activado) y tardan aproximadamente unos 20 días en finalizar. Por supuesto es inadmisible cualquier fallo de precisión en el cálculo o problema con el sistema.

Por este motivo, después de las fases de diseño y montaje de la máquina en cuestión (lo que me lleva de 5 a 10 días) procedo con las dos semanas de validación ininterrumpida.

PIC03858 Validación de un sistema con cuatro monitores.

Son pruebas y tests de stress destinados a explorar el límite de cada componente y a asegurar (dentro de los razonable) una ausencia de fallos posterior. El proceso me lleva sobre unas dos semanas ( a veces tres) y normalmente proceso varias máquinas en paralelo.

Mi filosofía de trabajo es sencilla: calidad extrema, perfeccionamiento continuo y máxima atención al detalle.

Entre los tests incluyo:

  • Tests single threaded de memoria en 64 bit.
  • Test multithreaded (8 hilos) de memoria 64 bit en entorno Windows 7 X64.
  • Tests de cálculo matemático en coma flotante X87.
  • Tests de cálculo matemático vectorizado SSE SIMD.
  • Tests gráficos DX9, DX10 y DX11.
  • Tests de stress de los VRM de la SVGA.
  • Tests de stress de la fuente de alimentación (variando rápidamente la carga máxima en distintas fases de la misma) con consumos pico en cada fase (12 V, 5 V, etc.)
  • Tests de temperatura máxima en cores y en cada uno de los sensores.

Durante estos días, en dos ocasiones desmonto en radiador de CPU y compruebo la huella de interfaz térmica sobre el heat spreader del procesador.

DSCF0258 Huella de pasta térmica de un Core i7 LGA1366.

Para más información de parte del software utilizado en la validación de estas máquinas recomiendo mi Blog SATSoftware.

PIC03737 reparado para empezar con los tests de memoria preliminares.

Es crítico conseguir los voltajes mínimos estables 100% en cada área (cores, uncore, QPI, DDR3, PPL, …). Solamente esta parte del proceso lleva fácilmente 3 o 4 días. Con ello se consiguen consumos y temperaturas mínimas en funcionamiento a la frecuencia objetivo, siempre con una estabilidad garantizada en cualquier escenario.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.

8 comentarios:

  1. Un trabajo envidiable. Ya me gustaría a mi tener clientes con esas necesidades. Nosotros la mayoría de los experimentos son para buscar el máximo silencio y el mínimo de ventiladores. Y mira que me gustaría ponerme a overclokear algo así.
    Por cierto las fotos son cojonudas

    ResponderEliminar
  2. Tenderodigital, en primer lugar te agradezco tus alabanzas, sobretodo por venir de alguien con tu experiencia.

    Realmente, como comentas, es una verdadera suerte el poder tener clientes con necesidades tan especiales y exigentes, aunque a veces es difícil satisfacer sus necesidades en el terreno de la validación de los sistemas (exigen cientos de horas por máquina).

    Sobre las fotografías, hace un mes acabo de cambiar mi vetusta cámara de 3 MP (con casi 7 años a sus espaldas) por una Fujifilm HS10 (con ella he hecho la foto del disipador con pasta térmica).

    Con el cambio la calidad de las fotografías aumentará en futuros artículos (es espectacular de lo que es capaz en modo super macro).

    Un saludo,

    Carlos Yus.

    ResponderEliminar
  3. Hola de nuevo Carlos.

    Yo tengo la gran curiosidad de preguntarte, sin ánimo de parecer pretencioso o violar tus intimidades, ¿Qué has estudiado tú? Sé que, como muchos otros la experiencia es mucho más que un grado, la experimentación -lo empírico-. Pero sabes mucho, y eso, aunque puedo equivocarme, se deberá a unos estudios... No me digas que eres autodidacta....

    Que vaya todo bien.

    ResponderEliminar
  4. PS3RO,

    Mi formación es más científica que informática. Soy más físico - matemático - químico que informático.

    Piensa que no hay estudios en España actualizados al día en informática de sistemas.

    Conocer el funcionamiento interno de un procesador contemporáneo como por ejemplo un Core i7 o un AMD Phenom II o un futuro Bulldozer o Sandy Bridge exige mucho más.

    Es una labor de investigación diaria e implica la lectura de miles (muchos...) de páginas de PDFs (siempre en Inglés) de los datasheets internos de cada producto.

    Un saludo,

    ResponderEliminar
  5. Hola carlos... Espero no molestarte con mis preguntas, pero como a ti, o quizá más, porque yo lo hago por gusto, por hobbie, también me gusta el tema de preparar sistemas fuera de la especificación (mis sistemas). Otros lo llaman overclock... Me gusta más denominarlo "fuera de la especificación" es más profesional. Y es por eso que me dirijo a ti. Tengo montado un i7 930 sobre una placa gigabyte. He aumentado de 2.80 a 3.66 (166x22) Consiguiendo un 30% de OC en el micro y un 25% en la controladora a unos voltajes mínimos. Vcore 1.23VTT 1.195V. con unas temperaturas en carga máxima de 60º. Estoy bastante contento con lo conseguido y no me hace falta más. LE he hecho los test convenientes, linx 20 pasadas (full memory) prime 95 12 + 12 horas (blend, smalltff) y occt 2 horas. Cuando tu compruebas tus sistemas ¿cuándo consideras que el sistema es estable? ¿Es suficiente con los test que yo le hago?
    Querría escuchar de alguien que se dedica a esto profesionalmente. Gracias y saludos.

    ResponderEliminar
  6. PS3RO, tienes una buena metodología de validación aunque todo puede mejorar.

    Te recomiendo que leas este artículo donde detallo algunos de los programas que utilizo para certificar mis sistemas.

    -- http://professionalsat.blogspot.com/2009/05/sistemas-de-altas-prestaciones_11.html

    También debes visitar mi Blog de Software: SATSoftware.

    -- http://satsoftware.blogspot.com/

    Ten en cuenta que me lleva de diez días a dos semanas de tests continuos el llegar a una certeza razonable sobre la estabilidad de la máquina.

    Verdaderamente no es una tarea fácil y sobretodo nada rápida, exige mucha dedicación y un conocimiento absoluto de los componentes a bajo nivel.

    Sobre Memtest86+:

    -- http://satsoftware.blogspot.com/2008/03/memtest86-y-memtest86.html

    -- http://satsoftware.blogspot.com/2008/11/memtest86-210-en-intel-core-i7.html

    -- http://satsoftware.blogspot.com/2008/04/memtest86-201-con-8-gb.html

    Sobre Prime95:

    -- http://satsoftware.blogspot.com/2008/04/prime95-torturador-de-procesadores.html

    -- http://satsoftware.blogspot.com/2008/06/errores-en-prime95.html

    Sobre Intel Burning Test:

    -- http://satsoftware.blogspot.com/2010/08/intel-burn-test-actualizado-satsoftware.html

    Sobre S&M:

    -- http://satsoftware.blogspot.com/2008/07/test-s-191.html

    Sobre Memtest en Windows:

    -- http://satsoftware.blogspot.com/2008/04/memtest-35-para-windows.html

    Un saludo,

    Carlos Yus.

    ResponderEliminar
  7. Excelente paisano, te he encontrado de casualidad en la pagina noticias 3d,etccc en el foro yo soy de un pueblo de jaén, saludos buen trabajo chao.

    ResponderEliminar
  8. mjfm,

    Mi principal problema es la falta de tiempo para mantener como quisiera mis cuatro Blogs, voy escribiendo lo que me es posible fuera de las obligaciones familiares y mis dos trabajos...

    La verdad es que es una satisfacción ver que pese a esto tanta gente me felicita por mi trabajo...

    Un saludo para Jaén,

    Carlos Yus.

    ResponderEliminar

Nota: solo los miembros de este blog pueden publicar comentarios.