jueves, 2 de febrero de 2017

AMD Vishera FX 8350. Primeras impresiones – ProfessionalSAT

Siendo sincero debo admitir que me ha sorprendido gratamente el nivel de prestaciones de la nueva serie de CPUs FX de AMD basadas en el nuevo stepping dotado de cores Piledriver.

En un artículo de LowLevelHardware exploré detalladamente las mejoras que aportaba este core refinado, este nuevo stepping a la conocida micro arquitectura Bulldozer de AMD.

PiledriverCORE_640Piledriver module con sus 2 MB de caché L2.

Podríamos sintetizar las mejoras en dos fundamentales:

- Por un lado una menor disipación térmica por core y un menor voltaje mínimo estable a una frecuencia dada. A igual frecuencia menor consumo y temperatura.

- Por otro lado un aumento IPC de un 5 a 30% en función de la carga de trabajo (enteros, branches, coma flotante, SSE, AVX,…) A igual frecuencia más rendimiento.

Gracias a estas dos mejoras AMD ha conseguido incrementar la frecuencia base del FX 8350 en 400 MHz.

PDvsBSAMD FX8150 vs. FX8350. Bulldozer vs. Piledriver.

En modo Turbo Core Vishera aplica el Turbo máximo en todas las situaciones, es decir, en carga máxima de un thread (ST, single threaded) o de varios threads e incluso 8 threads simultáneos (MT, multi threaded):

BD_TurboTurbo Core en FX8150 Bulldozer.

Podemos decir, para simplificar, que en Vishera el estadio intermedio Turbo Core desaparece.

En la práctica, medido por mí mismo, un Vishera FX8350 a 4 GHz en Prime95 Blend 4 GB consume exactamente lo mismo a un Bulldozer FX8150 a 3.6 GHz a voltajes nominales.

PiledriveModule_640Bulldozer module 32 nm SOI HKMG.

Como deduciréis fácilmente, Vishera aportará un 11% más de frecuencia en cargas paralelas y en cambio no incrementa nada en cargas single threaded. Por ello en cargas ST el rendimiento solo aumentará por el incremento de IPC y en cambio en cargas MT se sumará el 11% de frecuencia nominal al incremento IPC.

Undervolting

A esto debo añadir que tanto en los antiguos FX Bulldozer como en los nuevos Vishera AMD ha sido bastante exagerado en cuanto a los voltajes a los que vende sus CPUs. Normalmente son absolutamente estables a voltajes 0.100 – 1.150 V inferiores a los nominales. Con ello además ganamos unos 20 – 30 W en consumo y 10 – 15 ºC de temperatura. Merece la pena hacerlo aunque con ello perdamos horas o incluso a veces algunos días.

AMD debería hacer este proceso en fábrica pero resulta laborioso y por ello caro. De este modo saca al mercado las CPUs a un voltaje excesivamente prudente para asegurar su estabilidad sin probar individualmente en exceso cada uno de los chips para ajustar individualmente su voltaje.

Piledriver. Mejoras micro arquitecturales respecto a Bulldozer.

AMD ha mejorado Bulldozer en muchos aspectos aunque sin cambiar nada importante del diseño, de hecho Piledriver no es más que un stepping más avanzado del mismo core.

piledriver_enhancements_640

Se ha mejorado el Branch Prediction, algo crítico en este diseño debido a su larguísimo pipeline. Esto mejorará el rendimiento sobretodo en cargas de enteros.

Se ha activado la unidad de división de enteros (INT Div, iDiv) que estaba deshabilitada en Bulldozer por un fallo de diseño, como comenté en Abril de 2011 en mi artículo:

AMD AGLUs, Bulldozer INT cores. Actualizado – LowLevelHardware

“ EX0 contiene una unidad de división de enteros parcialmente pipelinizada y con latencia y capacidad de proceso variable en función de la precisión. Aunque examinando detenidamente la documentación parece que más bien se trata de una unidad “virtual” ya que la instrucción IDIV se decodifica en el Microcode Engine y se secuencia en instrucciones sencillas ALU que se ejecutan en EX0. Además incluye una unidad para LZCNT y POPCNT.

Efectivamente, en Bulldozer, la unidad iDiv no estaba habilitada y por ello la latencia y velocidad de las divisiones de enteros eran tan decepcionantes. Por fin, en Piledriver se encuentra habilitada.

Se ha doblado el tamaño del L1 dTLB (TLB de datos de nivel 1). Para el que quiera amplia información sobre para que sirve un TLB le remito a algunos artículos pasados.

piledriver_enhancements2_640

En total todas estas mejoras aumentan el IPC de un 5 a 30%, en general sobre un 10%. En el caso del 30% es más por un rendimiento terrible de Bulldozer en algunas tareas que por méritos de Piledriver.

En cualquier caso podríamos caracterizar las prestaciones de Piledriver en el AMD FX8350 del siguiente modo:

- Cargas de trabajo de enteros con excelente paralelización y con carga máxima en los 8 INT cores. Ejemplo: compresión de datos en WinRAR o 7zip LZMA2. Prestaciones generalmente muy superiores al Core i5 3570K y superiores al Intel Core i7 3770K.

- Cargas de trabajo de coma flotante con excelente paralelización y con carga máxima en las 4 FPUs FMACs con 8 threads.

  Ejemplo 1: Rendering, cálculo matemático. Prestaciones generalmente bastante superiores al Core i5 3570K y ligeramente inferiores al Core i7 3770K. En PovRay en cambio el más rápido y por buen margen es el FX8350.

   Ejemplo 2: Edición y codificación de video x264 / H264. Prestaciones generalmente superiores al Core i7 3770K y muy superiores al Core i5 3570K.

- Cargas de trabajo principalmente de enteros con baja paralelización y raras veces con carga máxima en 4 INT. Ejemplo: SysMark 2012, compilación y usos multitarea de la máquina en Windows con varias aplicaciones a la vez. Prestaciones muy similares o algo inferiores al Core i5 3570K (como mucho un 10%).

- Cargas de trabajo de enteros single thread o con paralelización muy leve. Ejemplo: instalaciones de software, instalación de sistema operativo, javascript. Prestaciones inferiores a Core i5 3570K hasta un 40% en proceso javascript.

Si hacemos la media el FX8350 nos da un rendimiento superior en un 5% al Core i5 más alto de gama, el i5 3570K que está situado por encima en precio (unos 20 – 30@ más).

El Core i7 3770K se sitúa en un nivel de prestaciones superior gracias al Hyper Threading como atestiguan sus más de 150€ extras de coste.

Conclusiones

Lo más positivo que puedo sacar de Vishera es su notable aumento de velocidad de trabajo en aplicaciones ofimáticas respecto a Bulldozer (ha mejorado más de un 20%) y el hecho de haberse convertido en el rey en prestaciones en temas de video, sobretodo en coding x264. En estos casos supera incluso al excelente y mucho más caro Core i7 3770K.

FX8350_640El die completo del procesador AMD FX 8350 32 nm.

Vishera mantiene exactamente los niveles de consumo y disipación térmica de los anteriores AMD FX con un rendimiento medio en cargas multithread de un 20% (ayudado por los 400 MHz extras) superior y un 5 – 10% en cargas single thread (con igual frecuencia).

Post Scriptum

Animo a los posibles compradores de estas CPUs a cambiar el funcionamiento nominal de Turbo Core. AMD ha dejado invariado el Turbo Core con carga single threaded o dual threaded a 4.2 GHz respecto a Bulldozer.

En Bulldozer FX8150 la disipación térmica y consumo era prácticamente igual con cargas MT de 8 threads (3.6 GHz) que en single o dual threaded (4.2 GHz) e igual a 125W.

En Vishera, en cambio, con cargas de 8 threads (4.0 GHz) llega a los declarados 125W en Prime95 pero con cargas single o dual threaded (4.2 GHz) se queda corto marcando unos 100 – 105W.

Los samples que he probado del AMD FX8350 son absolutamente estables en cargas single o dual threaded a voltaje nominal a 4.6 GHz y manteniendo siempre la disipación térmica por debajo de los 125W nominales. Para ello, en BIOS, cambio manualmente el funcionamiento de Turbo Core aumentando el multiplicador máximo a 46X.

En este caso conseguimos otro 9 – 10 % adicional de velocidad en casos ST (single threaded), el talón de Aquiles de esta micro arquitectura.

Echad un vistazo a la web de mi nueva empresa, un proyecto de gran envergadura que llevo preparando hace más de un año.

Os lo recomiendo para diseño de sistemas de altas prestaciones optimizados al límite:ip16_texto_300px_blanco422222

Allí tenéis a vuestra disposición el formulario de contacto, para consultas sobre este artículo hacedlo más abajo en la sección de comentarios.

Y mi nuevo Blog de contenido muy técnico y actualizado donde encontraréis artículos míos sobre hardware, procesadores y sistemas y también otros posts de expertos programadores e informáticos sobre otros temas de actualidad:

infromaticapremium-blog422222

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

Carlos Yus Valero – informaticapremium      informaticapremium-logo-150px[3]

20 comentarios:

  1. Carlos ¿Sería correcto decir que piledriver a 4Ghz rinde lo mismo que Bulldozer a 4.3 pero consumiendo lo mismo que Bulldozer a 3.6?

    ResponderEliminar
  2. tiene rendimiento del IPC inferior a intel , frecuencias notoriamentes mas altas y un TDP mucho mas alto que intel consume el doble y dices que es un buen procesador?

    Intel tiene IGP y consume la mitad, si intel se avispara lanzar i5 e i7 sin IGP abarateria mucho los CPU

    pero en fin cada procesador tiene algo que el otro no tiene y es dificil hacer una comparacion ya que se ubican en otro segmento(intel con IGP e AMD FX sin IGP)

    ResponderEliminar
    Respuestas
    1. En los escenarios que plantea el articulo es posible, pero en el aspecto energetico intel esta mejor que es otro de los aspectos junto con otros

      Intel ya tiene i3 e i5 sin IGP (o deshabilitada) esto lo puedes consultar en el ark de intel, y aun siendo a si siguen siendo carisimos porque intel ya no tiene porque para bajar los precios por su competidor tanto por rendimiento como por consumo

      Eliminar
  3. Muy buen blog, informacion tecnica bien explicada, excelente sigue asi estaremos a la espera de tus articulos sobre la arquitectura steamroller (de esta se dice que arreglara el problema de las FPUS y del rendimiento en apps que no usen tantos hilos de procesamiento)

    ResponderEliminar
  4. DavidCianorris,

    No andas desencaminado, aproximadamente es así.

    DarkThunder,

    No te falta razón, Intel desde 2006 con Conroe 65 nm se ha centrado en diseños con alto IPC y pipelines de ejecución relativamente cortos.

    En sucesivas evoluciones, (2007 Penryn 45 nm , 2008 Nehalem 45 nm , 2009 Westmere 32 nm, 2010 Sandy Bridge 32 nm y 2011 Ivy Bridge 22 nm) ha ido mejorando el diseño, aumentando el IPC y reduciendo el consumo por core y por instrucción procesada.

    AMD, en cambio, ha dejado de evolucionar la arquitectura K8 (que a mi modo de ver todavía tenía potencial) y ha roto con todo lo anterior con un nuevo diseño: Bulldozer. Larguísimos pipelines, altas latencias y necesariamente altas frecuencias.

    El primer integrante, Bulldozer, fue para mi decepcionante. Puedes leer unos diez extensos artículos míos sobre su micro arquitectura.

    Piledriver, en cambio, me parece un excelente paso adelante sabiendo que AMD no puede competir con Intel en recursos y más pensando en el futuro Steamroller.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
    Respuestas
    1. asi como el fracaso de bulldozer , era mejor que siguieran optimizando los phenom 2, ya a estas alturas tendrian un consumo notablemente mas bajos, es tan solo darse cuenta el phenom 2 x6 1090T con un consumo de 125W mientras que el FX8xxx tiene solo 4 nucleos pero el TDP nada que decir

      por lo tanto en consumo estarian muy cerca de intel

      Eliminar
  5. GamesOnWire,

    Ciertamente Intel no compite con AMD en igualdad de condiciones. Hablando puramente de fabricación, un Ivy 22nm es mucho más barato que un FX8350 de 32 nm e Intel puede venderlo más caro pues es más rápido y consume menos.

    AMD juega a vender al mismo precio que su homólogo de Intel una CPU con las mismas prestaciones, aunque con más TDP, más frecuencia y más mm2 de silicio.

    Catulichw,

    Sobre Steamroller, creo que aportará mucho en proceso de enteros y branches pero no tanto en FPU, veremos...

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  6. DarkThunder,

    No digo que un core K10 de un Phenom II sin cambios pueda ser buen competidor de todo un Ivy Bridge...

    AMD debería evolucionarlos de manera importante dando flexibilidad a sus unidades de enteros con schedulers compartidos, ampliando las FPUs a 256 bits, añadiendo soporte para los nuevos juegos de instrucciones, aumentando el ancho de banda de las L1i, L1d y L2 (al doble y algunas al cuádruple) revisando su organización interna (yo iría a cachés inclusivas con L1i y L1d de 32 KB y L2 de 256 o 512 MB con anchos buses para la L3 shared aumentada a 8 MB.

    He escrito algunos artículos al respecto:

    http://professionalsat.blogspot.com.es/2011/10/amd-bulldozer-mi-opinion-personal-parte.html

    http://professionalsat.blogspot.com.es/2011/12/bulldozer-32-nm-amd-fx-parte-2.html

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
    Respuestas
    1. Necesitarian una FPU mas completa...

      He analizado y note, en el bench de cinebench muestra que el Phenom II no tiene perdidas por nucleo al trabajar en multi hilo, el Sandy (sin HTT) tiene 8% y el Ivy 5%, pero los FX tiene de 18 a 23% (Bull y Pile, respectivamente) AMD con Steamroller espera eliminar esta perdida e incrementar el rendimiento per core, podriamos decir que Steam apunta de 20~25% mas rendimiento por nucleo, lo que lo dejaria hasta con 55% mas rendimiento usando todos sus hilos, lo que lo pondria por encima de cualquier i7, pero, aun asi se quedaria de 30~40% por debajo en mono tarea, sera un gran procesador para Server y equipos multi GPU donde el HTT no es muy efectivo con los cuellos


      Saludos

      Eliminar
  7. Carlos, mira este comentario que publiqué en una web, no soy científico ni nada parecido, de hecho soy pésimo en matemáticas pero hice este cálculo unos días antes de los reviews de piledriver y fue más o menos acertado aunque no se si realmente esta mal planteado ¿me puedes ayudar a revisar mi "argumento matemático"?... Mira la cosa va así:

    Dime si me equivoco. Hagamos el siguiente ejercicio deductivo: según los últimos datos filtrados, piledriver (FX 8350) ha de tener una frecuencia de 4Ghz mientras que su consumo, en teoría, será el mismo que el del FX 8150 el cual funciona a solo 3.6Ghz ¿correcto?. El otro dato que tenemos es que piledriver representa una mejora de rendimiento mono-hilo de un 8.5% a iguales frecuencias de bulldozer ¿hasta aquí bien?.

    Ahora, supongamos que la historia del consumo sea correcta y luego haremos la siguiente operación: basándonos en el rendimiento y consumo de bulldozer a 3.6Ghz multiplicamos 3.6 x 1.1 (para sumar un 10% a la frecuencia) lo que nos da 3.96 y observaremos que prácticamente esa es la frecuencia de funcionamiento prometida para piledriver (4ghz).

    Como también sabemos, el IPC de piledriver es un 8.5% superior al de bulldozer por lo que podemos hacer la siguiente equivalencia: un piledriver es básicamente un bulldozer a 4Ghz, un 8.5% mas rápido pero con el mismo consumo que si tuviera 3.6Ghz. Podemos decir entonces que el rendimiento de piledriver expresado en frecuencias de bulldozer queda de esta manera: 3.6 x 1.1 x 1.085 = Frecuencia de bulldozer necesaria para igualar el rendimiento de piledriver a 4.0Ghz (3.96 Ghz) lo que nos resulta 4.3Ghz (4.2966).

    En pocas palabras, para que el Bulldozer rinda como un piledriver a 4Ghz necesitaría funcionar a 4.3Ghz pero su consumo sería considerablemente superior, todo esto hablando de los 4 módulos funcionando a esa frecuencia simultáneamente y a plena carga.

    Ahora, para medir el porcentaje de mejora que representa piledirver sobre bulldozer (suponiendo como verdadero que tengan exactamente el mismo consumo) lo único que tenemos que hacer es dividir 4.3/3.6. Es decir: la frecuencia de bulldozer que representa el rendimiento de piledriver a 4.0Ghz sobre la misma base de consumo energético que sería 3.6Ghz lo que nos da 1.2 (1.1944...). Dicho de otra manera, piledriver representa una mejora del 20% por sobre bulldozer a iguales consumos energéticos.

    Ahora solo resta esperar a ver si se cumple lo que digo. Si estoy cometiendo alguna falacia lógica o algún error de operaciones espero que en los comentarios me puedan echar la mano con ello.

    Saludos!!

    ¿Como lo ves Carlos?

    ResponderEliminar
  8. Bueno la verdad es que talvez Vishera solo mejoro de 5 a 10% a las mismas frecuencias y de 10 a 15% en consumo, pero, algo es algo, ya es considerable cambiarse de un C2 o K10 a un FX Vishera, porque hasta en stock debido a las altas frecuencias resulta mejor y es mas completo, para los usuarios de FX Actaules, Core i3 y Core de primera generacion, es bueno que esperen a los Steamroller o a Scavator


    Saludos

    ResponderEliminar
  9. Pues veamos tengo dos ordenadores un vaio y uno montado por mi.

    El vaio tiene:
    (vgn-fz31m)
    Dual core T7250 a 2Ghz
    Ram a 667 mhz 3 gbs
    Hdd 320 gb
    gpu 8400m gt

    y la torre....

    tiene

    -Aerocool Strike-X 800W Modular
    -FX-8350
    -Asus Crosshair V Formula-Z
    -Corsair Cooling Hydro Series H100i
    -Kingston HyperX Beast DDR3 2133 8Gb (3ghz Ramdisk)
    -6x Noctua NF-P12
    -Sapphire Radeon HD 7950 OC Boost Vapor
    -OS > Win 7 x64
    -Hdd 250gb 2.5 (normal... me estoy mirando el Samsung pro 840 SSD 120 o el Samsung 840 SSD normal 256...)
    - mas otro hdd de 2 tbs

    Pues el caso es que portátil me va mucho mas fino con los programas que en la torre.... (excepto algún que otro programa....)


    Uso en ambos win 7 x64 ultimate, pero se nota como si OS no supiera manejar los componentes como debería..... es como usar un i7 con windows 98.

    >Lo tengo puesto con los drives actuales de las paginas oficiales y la segunda ultima actualización de la bios..... y la ram se niega a ir a 1600 mhz de los 2133 posibles.

    [>_<] Tendría que a verme esperado por un 3770k.....

    ResponderEliminar
  10. Tengo un Amd Phenom II X6 1100T, ?compensa cambiarlo por el FX Vishera 8350? o, ?sería mejor esperar?

    Gracias.

    ResponderEliminar
    Respuestas
    1. No, no compensa. Mejor aguántate a que salgan los steamroller o los excavator.

      Eliminar
  11. saludos tendo un PhenomII X4 965 Black Editon valdrá la pena cambiarlo por el FX8350??

    ResponderEliminar
  12. Saludos Therion,

    Si partes de un Phenom Quad Core si notarás incremento de rendimiento.

    Mucho en compresión de datos, descompresión y codificación de vídeo. En otros apartados será menos espectacular la mejora.

    Lo importante es saber si en tu placa base funciona el FX8350, si es así yo iría a por él.

    Un saludo,

    Carlos Yus Valero.

    ResponderEliminar
  13. DavidCianorris,

    Tus cálculos más o menos iban en la buena dirección. El FX8350 es lo que Bulldozer debió ser desde un principio.

    En rendimiento medio iguala al Core i7 2600K Sandy Bridge y se queda a un 10% de media del i7 3770K. Creo que son excelentes resultados para su precio.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  14. gracias por responder Carlos mi placa si lo sporta es una Gigabyte GA-990FXA-UD3 (rev. 1.0) ahora una pregunta mas pienso comprar tambien una vga es la Gigabyte GV-R787OC que fuente de poder me recomendarias por favor ya que la vga requiere 500watts

    ResponderEliminar
  15. Cual es mejor?me quedo con i5 3470 o el fx8350 vishera?

    ResponderEliminar
  16. Therion,

    Sobre la fuente yo me riía a por una de calidad, 500W es suficente. En cambio si compras una de 500W barata quizás acabe fallando.

    Anónimo,

    Están, en rendimiento, en posiciones similares. El AMD gana en soft que use bien sus 8 threads, en cambio, el Intel gana y de lejos en consumo.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar