Rechercher dans ce blog

Tuesday, October 12, 2021

FX-8150/8370/9590 im Retro-Test: So schnell ist AMDs Bulldozer heute - Golem.de - Golem.de

Die FX-CPUs hätten fast das Ende von AMD bedeutet: Ein Jahrzehnt später testen wir, ob die Bulldozer-Chips konkurrenzfähiger geworden sind.

Ein Test von
Der FX-9590 alias Centurion war das Bulldozer-Topmodell.
Der FX-9590 alias Centurion war das Bulldozer-Topmodell. (Bild: Marc Sauter/Golem.de)

So erfolgreich AMD mit den Ryzen-CPUs seit einigen Jahren ist, so erfolglos war die Generation davor: Die FX-Chips mit der Bulldozer genannten Mikroarchitektur gingen als kolossaler Flop in die Annalen ein, der Launch anno 2011 war ein Desaster.

Eine Dekade später wollten wir es noch einmal wissen - wie würden die Prozessoren heute abschneiden? Innerhalb eines Jahrzehnts sind Anwendungen und insbesondere Spiele deutlich parallelisierter geworden, was den FX-CPUs tendenziell entgegenkommt.

Der CMT (Core respektive Cluster Multithreading) getaufte Design-Ansatz von Bulldozer unterschied sich drastisch von allen davor; statt klassischer Kerne gab es Module: Hier teilen sich zwei Integer-Einheiten einen Gleitkomma-Block sowie das vorangestellte Frontend und den L1-Instruktionen/L2-Cache.

Sammelklage wegen Octacore-Werbung

Für die Flächeneffizienz war die Idee klasse, laut AMD belegte die zweite Integer-Einheit gerade einmal 12 Prozent eines Moduls. Bulldozer sollte so 80 Prozent der Leistung zweier klassischer Kerne erreichen, dabei jedoch kompakter und sparsamer sein. Mit 315 mm² fiel das Orochi-Die mit vier Modulen und acht logischen Kernen (4M/8T) allerdings relativ groß aus.

  • Alle FX-Desktop-Modelle basierten auf dem Orochi-Die. (Bild: AMD)
Alle FX-Desktop-Modelle basierten auf dem Orochi-Die. (Bild: AMD)

Hierbei gilt zu beachten, dass AMD damals noch exklusiv bei Globalfoundries fertigen musste und deren 32-nm-SOI-Verfahren nicht mit Intels 32 nm vergleichbar war. Ein Sandy-Bridge-Quadcore wie der Core i7-2600K (4C/8T) für PCs kam auf 216 mm², das Octacore-Pendant (8C/16T) als Xeon für Server mit 435 mm² quasi auf das Doppelte.

Ungeachtet des CMT-Prinzips ließ AMD es sich nicht nehmen, die Desktop-Modelle von Bulldozer als die weltweit ersten Achtkerner zu bewerben. Das führte viele Jahre später zu einer Sammelklage, die AMD verlor und 12 Millionen US-Dollar an Vergleichszahlungen leisten musste.

FX-8150 FX-8370 FX-9590
Codename Zambezi Vishera Centurion
Architektur Bulldozer Piledriver Piledriver
Module / Threads 4M/8T 4M/8T 4M/8T
CPU-Takt 3,6 bis 4,2 GHz 4,0 bis 4,3 GHz 4,7 bis 5,0 GHz
Uncore-Takt 2,2 GHz 2,2 GHz 2,2 GHz
Speicher DDR3-1866 DDR3-1866 DDR3-1866
TDP 125 Watt 125 Watt 220 Watt
Bulldozer-Modelle im Überblick

Hinzu kam, dass für die Prozessoren das seit den Athlon 64 nicht mehr verwendete FX-Präfix verwendet und damit entsprechende Erwartungen geschürt wurden. Selbst einen Comic und ein Video zur "Rückkehr der Legende" legte AMD auf, um die Scorpio genannte Plattform zu bewerben - Gürtelschnallen gab es übrigens auch.

Schauen wir uns an, welche Bulldozer-Topmodelle es gab und wie diese in heutigen Benchmarks abschneiden. Wir haben sie mit Intels damaligen Sandy-Bridge-Chips und AMDs späteren Ryzen-CPUs, vom 1800X bis zum 5800X, verglichen.

Den Start machte im Oktober 2011 der FX-8150 alias Zambezi mit der Ur-Bulldozer-Architektur. Ein Jahr später folgte der FX-8350 alias Vishera mit Piledriver-Technik, welche Optimierungen aufwies (Hallo Zen+); dank eines gereiften 32-nm-Verfahrens stieg überdies der Basistakt um 400 MHz auf 4 GHz. Im Sommer 2013 schob AMD den FX-9590 alias Centurion nach, eine Variante mit bis zu 5 GHz und beigelegter 120-mm-AiO-Wasserkühlung.

Für unsere Tests haben wir die drei CPUs der Reihe nach in ein 990FXA-GD80 von MSI gesteckt, denn gerade der FX-9590 mit seinen 220 Watt stellt hohe Anforderungen an die Spannungsversorgung. Um ein Heruntertakten unter Last zu verhindern, kam sicherheitshalber eine 280-mm-AiO-Wasserkühlung (die Silent Loop 2 von Be Quiet) zum Einsatz.

Gleich unser erster Benchmark zeigt Stärken und Schwächen von Bulldozer auf: Das Integer-lastige 7-Zip liegt den FX-Chips gut, schon der FX-8150 ist etwas flotter als der Core i7-2600K. Die Verbesserungen des FX-8350 und der CPU-Takt des FX-9590 sorgen jedoch nur für einen geringen Leistungszuwachs, da die RAM- und die Uncore-Frequenz inklusive L3-Cache sowie Northbridge/Speichercontroller-Takt nicht steigen.

Apps oft so lala, Spiele meist pfui

In Anwendungen wie Blender, Cinebench oder Faststone Image Viewer kann zumindest der FX-8350 den Core i7-2600K in Schach halten; einzig der Singlethread-Score ist katastrophal niedrig. Beim Light-Baking mit der Unreal Engine 4 fallen alle Bulldozer-CPUs aus uns unbekannten Gründen weit zurück, dafür läuft das Berechnen der Zahl Pi per y-Cruncher lokal im RAM äußerst flott. Der FX-9590 mit 5 GHz bleibt gegen den auf 5 GHz übertakteten Core i7-2600K ungeachtet dessen chancenlos.

  • 990FX, X470, X570, P67, RTX 3080, 32GB DDR3/DDR4, Win10 20H2 (Bild: Golem.de)
990FX, X470, X570, P67, RTX 3080, 32GB DDR3/DDR4, Win10 20H2 (Bild: Golem.de)

Spiele sind heutzutage zwar deutlich Multithreading-lastiger als vor einem Jahrzehnt, eine hohe Singlethread-Performance ist aber immer noch sehr wichtig. Im auf sehr vielen Kernen laufenden Total War Troy schafft bereits der FX-8150 fast einen Gleichstand zum Core i7-2600K, in allen anderen Titeln ist schon der Core i5-2500K schneller als der FX-8350.

Einzige Ausnahme ist Kingdom Come Deliverance, das bei den Bulldozer-CPUs ein merkwürdiges Verhalten hervorruft: Zwei Benchmark-Durchgänge sind meist kein Problem, spätestens beim dritten aber friert das Spiel für fast eine Minute bei 100 Prozent Last auf der SSD ein. Danach läuft KCD flüssiger, es fehlt jedoch ein Großteil der hochauflösenden Texturen - was ziemlich gruselig aussieht.

  • 990FX, X470, X570, P67, RTX 3080, 32GB DDR3/DDR4, Win10 20H2 (Bild: Golem.de)
990FX, X470, X570, P67, RTX 3080, 32GB DDR3/DDR4, Win10 20H2 (Bild: Golem.de)

Neben der durchwachsenen Performance ist es die hohe Leistungsaufnahme und damit die Effizienz, bei der die Bulldozer-CPUs besonders schlecht dastehen: Unser System mit dem Core i7-2600K weist ein idle/load-Delta von vergleichsweise sparsamen 80 Watt auf, wenn wir Leerlauf und Blender-Last in Relation setzen. Beim langsameren FX-8150 sind es 123 Watt und beim (verglichen mit dem i7) etwas flotteren FX-9590 horrende 206 Watt; derartige Werte werden von heutigen Intel-CPUs wie dem Core i9-11900K allerdings locker überboten.

AMD hat den Verkauf der Bulldozer-CPUs schon vor vielen Jahren eingestellt, parallel zu den ersten Ryzen-Modellen anno 2017 wurden mit Bristol Ridge aber sogar noch APUs mit DDR4 auf Basis dieser Architektur angeboten. Wer heute einen FX-8150 erwerben möchte, bekommt den Chip schon ab 50 Euro - kleinere Modelle kosten keine 30 Euro. Für einen FX-9590 sind aufgrund des Seltenheitswerts hingegen oft 200 Euro fällig, selbst als Tray-CPU.

Fazit

Machen wir es kurz: Der Bulldozer war anno 2011 schon kein Rennwagen und daran hat sich bis heute auch nur wenig geändert. Für AMD bedeutete das viele Jahre in Folge rote Zahlen, die meisten Quartale endeten mit einem Verlust. Alleine die Tatsache, dass der FX-9590 von 2013 bis 2017 das nominelle Topmodell war, spricht Bände.

Die Gründe für die schlechte Leistung der Bulldozer-CPUs sind vielfältig: Die an sich innovative CMT-Architektur, also Core respektive Cluster Multithreading, entpuppte sich in der Praxis insbesondere bei Singlethread-Workloads als äußerst langsam und selbst bei Multithreading-Anwendungen waren Intels Sandy-Bridge-Prozessoren oft schneller unterwegs.

Module statt Kerne, bei denen sich zwei Integer-Einheiten das gemeinsame Frontend mit dem einzelnen Gleitkomma-Block plus den L1/L2-Caches teilen, erwiesen sich als Fehlentwicklung. Hinzu kam, dass das 32-nm-Verfahren von Globalfoundries die gewünschten Taktraten einzig bei vergleichsweise hoher Leistungsaufnahme ermöglichte.

Überdies war beim Launch die Software nicht vorbereitet, so benötigte Windows 7 einen Patch, damit der Scheduler die Threads auf die passenden Module legt - erst Windows 8 machte das von Beginn an richtig. Gerade Spiele profitierten davon, generell aber war und ist die Gaming-Leistung angesichts der Shared-FPU und des niedrigen Uncore-Takts eine Schwachstelle der Technik.

Das eigentliche Ziel, mit Bulldozer und CMT eine bessere (Flächen)effizienz zu erreichen, wurde zwar von AMD verfehlt. Die Idee hat jedoch bis heute überdauert: ARM setzt beim Cortex-A510 für Smartphones ebenfalls auf Cluster Multithreading, wenngleich der Ansatz sich im Detail stark unterscheidet.

Adblock test (Why?)


FX-8150/8370/9590 im Retro-Test: So schnell ist AMDs Bulldozer heute - Golem.de - Golem.de
Read More

No comments:

Post a Comment

One UI 5.1: Samsung kündigt Update-Start für ältere Galaxy-Smartphones an, los geht es u.a. mit Galaxy S20, S21 und S22 - Notebookcheck.com

Nachdem es vor wenigen Tagen bereits inoffizielle Informationen zum Rollout von Samsungs One UI 5.1 für die ersten Modelle jenseits der ne...