26

News des 26. Februar 2024

Gemäß TechPowerUp hat AMD den offiziellen Listenpreis für die Radeon RX 7700 XT von bislang 449 auf nunmehr 419 Dollar gesenkt. Die Preissenkung erhöht den Preisabstand zur Radeon RX 7800 XT von 50 auf 80 Dollar – was allgemein als sinnvoll betrachtet wird, die Radeon RX 7700 XT lag preislich in der Tat viel zu nahe an der Radeon RX 7800 XT dran. Zugleich sticht AMD mit der neuen Preislage tiefer in eine schwache Stelle des nVidia-Portfolios: Die Radeon RX 7700 XT duelliert sich hierbei mit den zwei Ausführungen der GeForce RTX 4060 Ti, wobei die AMD-Lösung eigentlich klar überlegen ist und sich preislich nunmehr wieder besser in die Mitte zwischen beide nVidia-Angebote legt. Zum Teil scheint die AMD-Preissenkung schon im deutschen Markt angekommen zu sein, die günstigsten Angebote zur Radeon RX 7700 XT erreichen knapp die Marke von 430 Euro. Der reale Preisabstand zur Radeon RX 7800 XT erreicht somit ~90 Euro, was die Radeon RX 7700 XT gegenüber der größere Navi-32-Lösung somit erstmals attraktiv macht.

AMD Preislage nVidia
  450-500
Euro
GeForce RTX 4060 Ti 16GB
nVidia AD106, 5nm Ada Lovelace, DX12 FL12_2, 4352 FP32 @ 128 Bit, 2310/2535 MHz & 18 Gbps, 16 GB GDDR6, Realverbrauch: ~160W, Performance FHD: 1660%, 4K: 235%
Produkt- & Preissuche: Caseking Geizhals Amazon Mindfactory Alternate
Radeon RX 7700 XT 12GB
AMD Navi 32, 5/6nm RDNA3, DX12 FL12_2, 6912 FP32 @ 192 Bit, 1700/2171/2544 MHz & 18 Gbps, 12 GB GDDR6, Realverbrauch: 229W, Performance FHD: 1930%, 4K: 285%
Produkt- & Preissuche: Caseking Geizhals Amazon Mindfactory Alternate
430-480
Euro
 
  400-440
Euro
GeForce RTX 4060 Ti 8GB
nVidia AD106, 5nm Ada Lovelace, DX12 FL12_2, 4352 FP32 @ 128 Bit, 2310/2535 MHz & 18 Gbps, 8 GB GDDR6, Realverbrauch: 151W, Performance FHD: 1660%, 4K: 230%
Produkt- & Preissuche: Caseking Geizhals Amazon Mindfactory Alternate

Nachdem inzwischen sogar die großen Magazine von einer (angeblichen) "Chip-Krise" bei nVidias NextGen-Hardware sprechen, sei nochmals auf die eigentlich ausreichend erklärenden Worte nVidias im Zuge der Analysten-Konferenz zu den jüngsten Quartalszahlen verwiesen. Hierbei machte der Firmenchef persönlich klar, dass die kommenden Lieferschwierigkeiten primär den Startzeitraum der nächsten Hardware-Generation umfassen werden, wie üblich gemünzt allein auf die nächsten HPC/KI-Gerätschaften von nVidia. Insbesondere der Zeitraum beim Hochfahren der Fertigung ist diesbezüglich kritisch, da nVidia dann schon Aufträge annimmt, gleichzeitig aber noch nicht am Fertigungs-Maximum steht. Zu bedenken ist hierbei, dass insbesondere HPC/KI-Gerätschaften eigentlich nie einen offiziellen Marktstart-Termin haben – man stellt dies Monate vorher vor und liefert schlicht dann aus, wenn sich erste Fertigungskontingente ergeben.

However, whenever we have new products, as you know, it ramps from zero to a very large number. And you can't do that overnight. Everything is ramped up. It doesn't step up.
And so whenever we have a new generation of products -- and right now, we are ramping H200's. There is no way we can reasonably keep up on demand in the short term as we ramp.

Quelle:  nVidia CEO Jensen Huang zum "Q4 2024 Earnings Call" am 21. Februar 2024, notiert von Seeking Alpha

Logisch, dass dies anfänglich wenig ist, sich erst mit der Zeit steigert. Und genauso logisch ist, dass anfänglich mitnichten alle Aufträge bedient werden können – gerade in der aktuellen Situation, wo viele die nächste Generation an KI-Beschleunigern nahezu unbesehen ordern werden. Der ganze Ablauf ist damit auch deutlich abweichend vom Consumer-Segment: Dort baut man erst einmal Lagerbestand auf, um einen zumeist weltweiten Marktstart mit ordentlicher Liefermenge begehen zu können. Oftmals muß man dafür einige Wochen vorproduzieren, bei Apple sind es eher einige Monate an Vorproduktion – wo allein jener Lagerbestand aufgebaut wird, welcher für den weltweiten Marktstart mit einem singulärem Bedarf von mehreren Millionen iPhones an einem Tag notwendig ist. Bei HPC/KI-Geschäftschaften entfällt diese Vorproduktions-Phase, hier wird sofort ausgeliefert, sobald die Fertigung anläuft. Nochmals logisch, dass hier am Anfang ein riesiger Unterschied zwischen Bedarf und Fertigung existiert – mit der Betonung auf "am Anfang". Jener Ablauf ist bei einem vorausschaubar stark nachgefragtem Produkt absolut normal und rechtfertigt keinerlei Schwarzmalerei einer (angeblichen) "Chip-Krise".

Von jener könnte man vielleicht reden, wenn nVidia über einen längeren Zeitraum substantiell weniger liefern kann als Bedarf vorhanden ist. Allerdings hat dieser bei den Hopper-basierten KI-Beschleunigern durchaus für einige Zeit existierende Zustand dennoch nicht wirklich zu einer "Chip-Krise" geführt. Schlecht verfügbar waren schlicht nVidias H100-Beschleuniger & Derivate – alles andere war davon jedoch unbetroffen, das allgemeine Wort "Chip-Krise" ist hier unpassend. Dies gilt um so mehr, als dass Chipfertiger TSMC durchaus noch mehr zugrundeliegende GH100-Chip hätte fertigen können, nur das benötigte "Advanced Packaging" hierbei nicht mithalten konnte. Dies soll sich allerdings in den letzten Monaten auch entscheidend verbessert haben, so dass die Situation beim GB100-Chip bzw. entsprechenden B100-Beschleunigern vielleicht nicht ganz so drastisch ausfällt. Dem Anfangs-Ansturm kann nVidia allerdings so oder so nicht standhalten, bei einem ausreichendem Hardware-Sprung könnte nVidia umgehend mit Aufträgen für mehrere Quartale eingedeckt sein. All dies wäre dann aber wieder allein GB100/B100-bezogen, hat keine Auswirkungen auf andere nVidia-Chips oder auch die Chip-Industrie insgesamt.

Von YouTuber RedGamingTech kommen einmal mehr aktualisierte Gerüchte zur Hardware von Intels "Battlemage". Jene präsentieren noch einmal einen ganz abweichenden Ansatz gegenüber allen vorherigen Hardware-Gerüchten zu "Battlemage": Anstatt doppelter Anzahl an Xe-Kerne nur die gleiche Anzahl an Xe-Kernen wie mit "Alchemist", zudem auch nur mit gleicher Anzahl an ALUs bzw. FP32-Recheneinheiten pro Xe-Kern (die Nachfrage nach einem Schreibfehler an dieser Stelle wurde verneint). Dies wäre eine harsche Verkleinerung des bisher kolportierten Hardware-Ansatzes, welcher von verdoppelter Xe-Anzahl samt zuzüglich auch noch einer FP32-Verdopplung ausging. Somit könnte Battlemage gegenüber Alchemist faktisch nur noch mittels interner Architektur-Verbesserungen sowie höherer Taktrate vorankommen – was einen sicherlich nur limitierten Performance-Sprung ergeben würde.

Alchemist → Battlemage BMG-G31 (Flagship model) BMG-G21 ('Mid range' die)
Flagship: 32 → 32 Xe cores
Xe cores: 16 → 8 EU
EU: 8 → 16 ALU
(FP32: 4096 → 4096)
32 Xe Cores
512 EU
Clock targets high 2ghz
256Bit Bus / 16GB GDDR6(x)
24 or 32MB L2 cache
Similar die sizes to AD103
TSMC N5P
20 Xe cores
Clock targets high 2Ghz?
192 bit bus / 12GB GDDR6(x)
16MB L2
20 Gbps GDDR6
250mm²~ (roughly)
x8 PCIE gen 5
Wiedergabe der Gerüchte RedGamingTech @ YouTube, ergänzt um eine Angabe der sich daraus ergebenden FP32-Einheiten zwischen Alchemist & Battlemage

Vergleichsweise sinnig sind hingegen die anderen Angaben, welche von einem 256-Bit-Interface beim großen Chip sowie einem 192-Bit-Interface beim kleinen Chip sprechen – womit wenigstens die Speichermengen mit 16 bzw. 12 GB ein gewisses Niveau erreichen. Daneben deuten die eher kleinen Mengen an Level2-Cache (zwischen 16-32 MB) nochmals auf ein eher niedriges Performance-Level hin, der Video-Titel "New Midrange King" erscheint somit als etwas hoch gegriffen. Auf dieser Hardware-Ansetzung wäre nur höheres Mainstream-Niveau denkbar (Performance in Richtung der Radeon RX 7700 XT), jedoch kaum mehr. Die denkbar wichtigste Information ist aber womöglich die Namensnennung des größten Battlemage-Chips als "G31" – anstatt des in der Intel-Roadmap notierten "G10" (zu welchem Intel schon letzten August Validierungs-Exemplare hatte). Dies deutet darauf hin, dass das ganze Projekt noch einmal grundsätzlich verändert wurde – was wiederum einen Zeitverzug gegenüber den ursprünglichen Release-Plänen (Frühling 2024) nahelegt.

Daneben kann man immer darüber diskutieren, ob es sinnvoll ist, alle diese Leaks im Rahmen der 3DCenter-News anzusprechen – immerhin kann sich gerade von widersprechenden Angaben immer nur ein Bruchteil bestätigen, auch generell ist die Trefferquote nicht wirklich hoch. Andererseits haben sich aus solchen Leaks auch immer mal wieder bedeutsame Entwicklungen lange vorab ergeben, und nicht gerade selten waren die am Anfang unglaubwürdigsten Leaks am Ende zutreffend. Man kann eine Glaubwürdigkeits-Skala zu jedem Gerücht ansetzen, aber letztlich hat jedes davon seine Chance – und genau dies ist der Grund, wieso jene hier erwähnt werden: Denn was am Ende zutrifft, ist mit den vorher zur Verfügung stehenden Informationen oftmals nicht solide abzuschätzen. Zudem ist es generell besser, dies alles hier im ruhigen Maßstab zu erwähnen und einzuordnen, besonders hochfliegende Erwartungen dabei bremsend. PS zum gestrigen Zen5-Gerücht: Jenes stammt nicht von Twitter, sondern original aus dem AnandTech-Forum.