Genau das bleibt aber am Ende die spannendste Frage dieses Tages, denn von einer breiten Verfügbarkeit und vor allem stabiler Software war ja bisher kaum etwas zu spüren. Es kann also eigentlich nur besser werden.
Doch was bleibt einem am Schluss übrig, wenn man, aus welchen Gründen auch immer, erst einmal kein Sample erhält, um pünktlich zum vorgezogenen Launchtag mit am Start sein zu können? Wir haben deshalb versucht, mit einem zusätzlichen Abschnitt zur VR-Performance und einer Effizienzbetrachtung wenigstens noch etwas Mehrwert zu generieren, um nicht das 1001. Review von der Stange anzubieten, das eh keinen mehr interessiert.
Gerade der VR-Bereich rund um unsere FCAT-Messungen zeigt jedoch, dass nicht nur AMD offene Baustellen ohne Absicherung betreibt. Wir haben unseren Test nämlich mehrmals verschieben müssen, weil eine FCAT-Bibliothek fehlerhaft war. Zusammen mit Nvidia konnten wir dann exklusiv auch die neueste Software testen und nutzen. Zumindest diese Werte sind also auch exklusiv aktuell nur hier zu lesen und es hat schon einen gewissen Unterhaltungswert, dass sich sogar Nvidia extra bemüht, damit indirekt einen RX Vega56 Artikel noch einigermaßen zeitnah zu gewährleisten.
Wir verweisen an dieser Stelle natürlich auch noch einmal auf unseren Test der Vega Frontier Edition und den Launchartikel zur RX Vega64, die beide dann auch die entsprechenden Informationen zur Technologie und Theorie unter der Haube enthalten. Darüber hinaus hatten wir ja auch schon mit dem Wasserkühlungsumbau (“Übertaktet und abgekocht: AMD Radeon RX Vega64 wassergekühlt“) ein weiteres Follow-Up veröffentlicht, das andere Facetten zeigen konnte.
Was unterscheidet die Radeon RX Vega56 von der RX Vega64?
Die Radeon RX Vega 56 nutzt den gleichen Vega-10-Prozessor, wie wir ihn auch in der Vega64 finden. Es ist ein 486 mm² großer Chip mit 12,5 Milliarden Transistoren, der in GlobalFoundries 14LPP-Prozess hergestellt wird. Man findet vier Shader Engines, jede mit eigenem Geometrieprozessor und Draw Stream Binning Rasterizer.
Besitzt die RX Vega64 noch 64 aktive Compute Units in diesen Shader Engines, deaktiviert AMD bei der RX Vega56 zwei CUs pro Shader Engine, so dass es am Ende auf 56 hinausläuft. Womit sich dann auch die Namensgebung erklärt. Bei 64 Stream-Prozessoren und vier Textureinheiten pro CU erhält man folgerichtig 3584 Stream-Prozessoren und 224 Textureinheiten – also ca. 88% der Vega-NCU-Ressourcen.
Die niedrigere Rechenleistung und der gringere Texturendurchsatz sind auch durch die niedrigeren Basis- und typischen Boost-Taktraten bedingt. Die Radeon RX Vega56 taketet im Vergleich zur Vega64 nur noch mit 1156 MHz statt 1274 MHz, während der mögliche Boost-Takt der RX Vega56 bei 1471 MHz im Vergleich zu den 1546 MHz der RX Vega64 liegt. Die theoretische SP-Performance sinkt damit von maximal 13,7 TFLOPS auf 10,5 TFLOPS, wobei dies natürlich nur absolute Peak-Werte sind.
Jeder der Shader-Engines von Vega 10 besitzt vier Render-Back-Ends, die 16 Pixel pro Takt-Zyklus liefern, woraus sich die 64 ROPS ergeben. Diese Render Back-Ends hängen gemeinsam am L2, der jetzt 4 MB groß ist, während Fidji noch mit zwei MB L2-Kapazität auskommen müsste. Idealerweise bedeutet dies, dass die GPU weniger häufig auf den HBM2 zugreifen muss und die Abhängigkeit von Vega 10 von der Speicherbandbreite verringert. Da die Taktraten von Vega 10 auf der 56-Cu-Karte bis zu 40% höher sind als noch bei als Fiji ‘s, jedoch die Speicherbandbreite auf 102 GB/s sinkt, sollte ein größerer Cache hier also durchaus hilfreich sein, um Flaschenhälse auf dem Flaggschiff zu verhindern.
Der Einsatz von HBM2 ermöglicht AMD die Halbierung der Anzahl der Speicher-Stacks auf dem Interposer im Vergleich zu Fiji, was den aggregierten 4096-Bit-Bus quasi halbiert. Im Vergleich zu den 4GB-HBM-Modulen der Radeon R9 Fury X, nutzt die Radeon RX Vega56 recht komfortable 8 GB mit 4-Hi-Stacks, ähnlich wie die Vega64. Mit einer 1,6 GB/s Datenrate schafft man dann 410-GB/s-Bandbreite, was in der Theorie die Werte einer GeForce GTX 1070 bzw. GTX 1080 mit GDDR5 bzw. GDDR5X deutlich übertrifft.
Optik, Haptik und Anschlüsse
Die ca. 1064 Gramm schwere Karte (14 Gramm mehr als die Frontier Edition) ist 26,8 cm lang (ab Außenkante Slot-Blende bis Ende Gehäuse), 10,5 cm hoch (ab Oberkante Mainboard-Slot bis Oberkante Gehäuse) und 3,8 cm tief. Damit ist es eine echte Dual-Slot-Karte, auch wenn die Backplate noch einmal ca. 0,4 cm auf der Rückseite benötigt.
Gehäuseabdeckung und Backplate sind aus schwarz eloxiertem Aluminium, welches sich wertig und kühl anfasst. Die Oberflächenstruktur des Deckels wurde einfach per Kaltverformung vor dem Eloxieren realisiert. Alle Schrauben sind mattschwarz lackiert. Nur das aufgedruckte, rote Radeon-Logo an der Front hebt sich farblich deutlich ab.
Die Oberseite ist geprägt von den beiden 8-Pin PCIe-Spannunsgversorgungs-Anschlüssen, sowie dem beleuchteten, roten Radeon-Logo. Außerdem finden wir einen BIOS-Umschalter, der auf ein BIOS mit deutlich niedriger Leistungsaufnahme zugreifen lässt. Leiser, kühler und natürlich auch etwas langsamer. Zusammen mit den drei neuen Modi im Wattman “Turbo” (max. Power Limit), “Balanced” (Standardvorgabe) und “Power Save” (min. Power Limit) ergeben sich so mehrere Variationsmöglichkeiten, auf die wir später noch eingehen werden.
Das Kartenende ist geschlossen und am Rahmen findet man die bei Workstation-Karten üblichen Löcher fürs Mounting. Die mattschwarz pulverbeschichtete Slot-Blende beherbergt drei DP-Anschlüsse und einen HDMI-2.0. Auf einen DVI-I hat man aus strömungstechnischen Gründen cleverer Weise verzichtet, denn die Blende ist gleichzeitig ja der Auslass der warmen Abluft aus dem Kühlsystem.
Modell | Radeon Vega64 |
Radeon Vega56 |
Radeon R9 Fury X |
Geforce GTX 1080 |
Geforce GTX 1070 |
---|---|---|---|---|---|
GPU | Vega 10 XTX | Vega 10 XTX | Fiji XT | GP104 | GP104 |
Chipgröße | 484 mm² | 484 mm² | 596 mm² | 314 mm² | 314 mm² |
Transistoren | 12.5 Mrd. | 12.5 Mrd. | 8.9 Mrd. | 7,2 Mrd. | 7,2 Mrd. |
GPU-Basistakt/ Boost-Takt |
1247 MHz 1630 MHz |
1156 MHz 1471 MHz |
k.A. 1050 MHz |
1606 MHz 1733 MHz |
1506 MHz 1683 MHz |
Shader/SIMD | 4096/64 | 3584/56 | 4096/64 | 2560/20 | 1920/15 |
Textur-Einheiten/ROPS |
256/64 | 224/64 | 256/64 | 160/96 | 120/64 |
Speicheranbindung | 2048 Bit | 2048 Bit | 4096 Bit | 384 Bit | 352 Bit |
Speichertyp | HBM2 | HBM2 | HBM | GDDR5X | GDDR5 |
Speicherbandbreite |
483,8 GB/s | 410 GB/s | 512,0 GB/s | 320,3 GB/s | 256,3 GB/s |
Geschw. Grafikspeicher |
1,89 Gbps | 1,6 Gbps | 1,0 Gbps | 10,0 Gbps | 8,0 Gbps |
Speicherausbau |
8 GB | 8 GB | 4 GB | 8 GB | 8 GB |
DX12 Feature-Level | 12_1 | 12_1 | 12_0 | 12_1 | 12_1 |
PCIe-Buchsen | 2 × 8-Pin | 2 × 8-Pin | 2 × 8-Pin | 6 + 8-Pin | 8-Pin |
TBP | 295 Watt | 210 Watt | 275 Watt | <250 Watt | <150 Watt |
Testsystem und Messmethoden
Das neue Testsystem und die -methodik haben wir im Grundlagenartikel “So testen wir Grafikkarten, Stand Februar 2017” (Englisch: “How We Test Graphics Cards“) bereits sehr ausführlich beschrieben und verweisen deshalb der Einfachheit halber jetzt nur noch auf diese detaillierte Schilderung. Wer also alles noch einmal ganz genau nachlesen möchte, ist dazu gern eingeladen. Allerdings haben wir CPU und Kühlung erneut verbessert, um für diese schnelle Karte mögliche CPU-Flaschenhälse weitgehend auszuschließen.
Interessierten bietet die Zusammenfassung in Tabellenform schnell noch einen kurzen Überblick:
Testsysteme und Messräume | |
---|---|
Hardware: |
Intel Core i7-6900K @4,3 GHz MSI X99S XPower Gaming Titanium Corsair Vengeance DDR4-3200 1x 1 TByte Toshiba OCZ RD400 (M.2, System SSD) 2x 960 GByte Toshiba OCZ TR150 (Storage, Images) Be Quiet Dark Power Pro 11, 850-Watt-Netzteil |
Kühlung: |
Alphacool Eisblock XPX Alphacool Eiszeit 2000 Chiller 2x Be Quiet! Silent Wings 3 PWM (Closed Case Simulation) Thermal Grizzly Kryonaut (für Kühlerwechsel) |
Gehäuse: |
Lian Li PC-T70 mit Erweiterungskit und Modifikationen Modi: Open Benchtable, Closed Case |
Monitor: | Eizo EV3237-BK |
Leistungsaufnahme: |
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card) berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung direkte Spannungsmessung an den jeweiligen Zuführungen und am Netzteil 2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion 4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC) 4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz) 1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion |
Thermografie: |
Optris PI640, Infrarotkamera PI Connect Auswertungssoftware mit Profilen |
Akustik: |
NTI Audio M2211 (mit Kalibrierungsdatei) Steinberg UR12 (mit Phantomspeisung für die Mikrofone) Creative X7, Smaart v.7 eigener reflexionsarmer Messraum, 3,5 x 1,8 x 2,2 m (LxTxH) Axialmessungen, lotrecht zur Mitte der Schallquelle(n), Messabstand 50 cm Geräuschentwicklung in dBA (Slow) als RTA-Messung Frequenzspektrum als Grafik |
Treiber | Radeon: 17.20.1035 Quadro: R381 U2 (382.05) |
Betriebssystem | Windows 10 Pro (Creators Update, alle Updates) |
- 1 - Einführung und Übersicht
- 2 - Kühler und Package
- 3 - Platinendesign und Detailinformationen
- 4 - Mining, VR: Arizona Sunshine und Chronos
- 5 - VR: Dirt Rally, Robo Recall und Serious Sam
- 6 - Ashes of the Singularity: Escalation
- 7 - Battlefield 1
- 8 - Warhammer 40.000: Dawn of War
- 9 - Doom (2016)
- 10 - Tom Clancy's Ghost Recon Wildlands
- 11 - Hitman (2016)
- 12 - Metro Last Light (Redux)
- 13 - Tom Clancy's The Division
- 14 - The Witcher 3 Wild Hunt
- 15 - Leistungsaufnahme mit acht verschiedenen Settings
- 16 - Übertaktung, Untertaktung, Effizienz und Temperaturen
- 17 - Lüfterdrehzahlen und Lautstärke
- 18 - Zusammenfassung und Fazit
Kommentieren