Was ist ein Benchmark?
Ein Benchmark ist ein standardisierter Leistungstest, der die Performance eines Systems unter definierten Bedingungen misst und vergleichbar macht. Im Gaming-Kontext bedeutet das konkret: Wie viele Bilder pro Sekunde liefert eine Grafikkarte in einem bestimmten Spiel, unter welchen Einstellungen, und wie stabil bleibt diese Leistung über Zeit? Ohne Benchmarks wären Hardware-Vergleiche pure Spekulation.
Das Wort stammt aus der Vermessung — ein „Benchmark“ war ursprünglich eine eingravierte Markierung im Stein, von der aus Höhenunterschiede gemessen wurden. Im IT-Bereich hat sich der Begriff seit den 1970er-Jahren als Synonym für reproduzierbare Leistungsmessung etabliert.
Die wichtigsten Benchmark-Metriken im Überblick
FPS — Frames per Second
Die bekannteste Kenngröße ist die Bildrate, also wie viele Einzelbilder pro Sekunde die Grafikkarte berechnet und der Monitor darstellen kann. Höhere FPS bedeuten flüssigeres Spielgefühl — aber die Zahl allein sagt wenig aus, wenn sie stark schwankt. Deshalb unterscheidet man in der Praxis zwischen dem Durchschnitts-FPS, dem 1-Prozent-Low und dem 0,1-Prozent-Low.
- Durchschnitts-FPS: Der Mittelwert über den gesamten Testlauf. Gibt einen guten ersten Eindruck, verdeckt aber Ausreißer nach unten.
- 1% Low: Das schlechteste Prozent aller gemessenen Frames. Hier zeigt sich, ob eine GPU bei Explosionen oder schnellen Szenenwechseln einbricht.
- 0,1% Low: Die extremsten Einbrüche. Relevant, wenn man wissen will, ob ein System wirklich stotterfrei läuft.
Wer nur auf den Durchschnittswert schaut, erlebt möglicherweise eine GPU als „schnell“, die in der Praxis regelmäßig ruckelt. Ein System mit 80 FPS Durchschnitt und 55 FPS als 1% Low fühlt sich merklich glatter an als eines mit 100 FPS Durchschnitt und 20 FPS als 1% Low.
Frametimes — das unterschätzte Maß
Frametimes messen, wie viele Millisekunden zwischen zwei aufeinanderfolgenden Frames vergehen. Sie sind die präzisere Alternative zu reinen FPS-Angaben, weil sie Ungleichmäßigkeiten sichtbar machen, die in Durchschnittswerten verschwinden.
60 FPS entsprechen theoretisch einer konstanten Frametime von 16,67 Millisekunden. Wenn ein System im Schnitt 60 FPS liefert, aber einzelne Frames 40 ms oder länger brauchen, entsteht sichtbares Stottern — selbst wenn der FPS-Durchschnitt stabil wirkt. Dieses Phänomen nennt man Frame-Pacing-Problem. Frametime-Graphen, wie sie Tools wie CapFrameX oder PresentMon erzeugen, machen solche Probleme sofort sichtbar.
Für kompetitive Spieler und alle, die auf ein wirklich gleichmäßiges Spielgefühl Wert legen, sind Frametimes relevanter als der bloße FPS-Wert. Techniken wie Variable Refresh Rate (VRR) helfen dabei, Frametime-Schwankungen abzufedern und das Bild trotzdem synchron zum Monitor zu halten.
GPU-Auslastung und VRAM
Ein vollständiger Benchmark misst nicht nur Bildrate, sondern auch, wie stark die Grafikkarte tatsächlich ausgelastet wird. Eine GPU-Auslastung nahe 99 Prozent bedeutet: Die Grafikkarte arbeitet am Limit — das ist im Idealfall sogar erwünscht, weil es zeigt, dass der Prozessor kein Flaschenhals ist.
Daneben ist der VRAM-Verbrauch entscheidend. Moderne Spiele mit hochauflösenden Texturen und Ray Tracing können schnell 10 GB VRAM oder mehr beanspruchen. Überschreitet ein Spiel die verfügbare VRAM-Kapazität der Grafikkarte, muss das System auf langsameren Systemspeicher ausweichen — was in der Praxis erhebliche Leistungseinbrüche verursacht, die im Benchmark als Frametime-Spikes sichtbar werden.
CPU-Benchmarks: Wenn die GPU nicht der Flaschenhals ist
In bestimmten Szenarien ist nicht die Grafikkarte, sondern der Prozessor der limitierende Faktor — man spricht dann von einem CPU-Bottleneck. Das passiert typischerweise bei niedrigen Auflösungen wie 1080p, bei sehr starken GPUs oder in Spielen mit vielen gleichzeitigen KI-Einheiten und Physiksimulationen.
Ein CPU-Bottleneck ist im Benchmark erkennbar, wenn die GPU-Auslastung unter 90 Prozent fällt, obwohl die Bildrate nicht die erwarteten Höchstwerte erreicht. Professionelle Benchmarks messen daher immer beide Komponenten parallel und geben an, ob das System CPU- oder GPU-limitiert ist.
Synthetische Benchmarks vs. In-Game-Benchmarks
Es gibt zwei grundlegende Arten von Gaming-Benchmarks, die unterschiedliche Zwecke erfüllen:
Synthetische Benchmarks
Tools wie 3DMark, Unigine Superposition oder Heaven erzeugen künstliche, reproduzierbare Testszenarien, die nichts mit einem echten Spiel zu tun haben. Der Vorteil: maximale Vergleichbarkeit. Jeder testet exakt dieselbe Szene unter denselben Bedingungen. Der Nachteil: Sie spiegeln nicht die Praxis wider. Ein GPU, die in 3DMark exzellent abschneidet, kann in einem schlecht optimierten Spiel trotzdem Probleme haben.
In-Game-Benchmarks
Viele moderne Spiele — darunter Cyberpunk 2077, Horizon Zero Dawn oder Shadow of the Tomb Raider — bieten integrierte Benchmark-Modi, die eine definierte Spielszene automatisch abspielen und währenddessen die Performance messen. Sie sind näher an der Realität, aber weniger universell vergleichbar, weil jedes Spiel andere Anforderungen stellt.
Für aussagekräftige Hardware-Tests kombinieren seriöse Tester beide Methoden: synthetische Benchmarks für rohe Vergleichswerte, In-Game-Benchmarks für praxisnahe Einschätzung.
Benchmark-Tools: Was Spieler verwenden
Wer eigene Benchmarks durchführen möchte, greift typischerweise auf folgende Programme zurück:
- MSI Afterburner mit RivaTuner Statistics Server (RTSS): Kostenloser Klassiker für Echtzeit-Monitoring von FPS, Frametimes, GPU/CPU-Auslastung und Temperaturen direkt im Spieloverlay.
- CapFrameX: Speziell auf Frametime-Analyse ausgelegt. Besonders gut für die Auswertung von 1% und 0,1% Lows sowie für den Export und Vergleich von Messdaten.
- GPU-Z und HWiNFO64: Detaillierte Hardware-Informationen und Sensor-Logging. Gut, um Thermal Throttling (Leistungseinbrüche durch Überhitzung) zu identifizieren.
- 3DMark (Futuremark/UL Benchmarks): Industrie-Standard für synthetische GPU-Tests. Die kostenlose Basisversion enthält bereits mehrere aussagekräftige Tests.
Benchmark-Einstellungen: Worauf es bei Tests ankommt
Ein Benchmark-Ergebnis ist nur so gut wie die Bedingungen, unter denen er durchgeführt wurde. Wichtige Faktoren:
- Auflösung: Höhere Auflösungen belasten die GPU stärker. Ein Vergleich von 1080p-Werten mit 4K-Werten ist wenig aussagekräftig.
- Grafikeinstellungen: Ultra-Preset und Low-Preset unterscheiden sich dramatisch. Für faire Vergleiche müssen alle Einstellungen identisch sein.
- Upscaling: Technologien wie DLSS, FSR oder PSSR berechnen das Bild in niedrigerer Auflösung und skalieren es hoch — sie steigern die FPS erheblich, aber es ist kein „echtes“ Bild mehr. Benchmarks sollten klar angeben, ob Upscaling aktiv ist.
- Treiber-Version: GPU-Hersteller optimieren ihre Treiber regelmäßig für neue Spiele. Ein Benchmark mit veralteten Treibern kann verzerren.
- Testwiederholung: Einzelne Läufe können durch Hintergrundprozesse, Temperaturschwankungen oder Cache-Effekte verfälscht sein. Professionelle Tests führen jeden Durchlauf mehrmals durch.
Thermal Throttling: Wenn Hitze die Werte verfälscht
Ein häufig übersehener Faktor ist Thermal Throttling: Überschreitet eine GPU oder CPU eine kritische Temperatur, drosselt sie automatisch ihre Taktfrequenz, um Schaden zu vermeiden. Das senkt die Leistung und führt zu Frametime-Spikes — der Benchmark zeigt dann nicht das volle Potential der Hardware, sondern ein durch schlechte Kühlung begrenztes Ergebnis.
Wer Hardware testet, sollte immer auch Temperaturen und Taktraten mitloggen. Dauerhaft über 90°C liegende GPU-Temperaturen sind ein Warnsignal. Gute Benchmarks weisen explizit auf Thermal Throttling hin, wenn es auftritt.
Häufig gestellte Fragen zu Gaming-Benchmarks
Was ist ein guter FPS-Wert für Gaming?
Das hängt stark vom Spieltyp und Monitor ab. Als grobe Orientierung gilt: 30 FPS sind in Story-lastigen Konsolenspielen gängig, werden aber von vielen PC-Spielern als ruckelnd empfunden. 60 FPS gelten als Standard für flüssiges Spielgefühl. 120 FPS oder mehr sind besonders für kompetitive Shooter auf Hochfrequenz-Monitoren relevant, wo jede Millisekunde zählt.
Was bedeutet 1% Low in der Praxis?
Der 1% Low gibt an, welche Mindest-Framerate in den schlechtesten ein Prozent aller gemessenen Frames erreicht wurde. Er ist besonders aussagekräftig für das subjektive Spielgefühl: Ein niedriger 1% Low bedeutet sichtbares Stottern bei Explosionen oder schnellen Kamerafahrten — selbst wenn der Durchschnittswert hoch ist.
Ist ein synthetischer Benchmark realistisch?
Synthetische Benchmarks sind hervorragend für Hardware-Vergleiche, aber kein Abbild der Praxis. Für Kaufentscheidungen empfiehlt sich immer die Kombination aus synthetischen Tests und In-Game-Benchmarks aus Titeln, die man tatsächlich spielen möchte.
Was ist ein CPU-Bottleneck?
Ein CPU-Bottleneck liegt vor, wenn der Prozessor nicht schnell genug Daten für die Grafikkarte aufbereiten kann und diese dadurch unter ihrer eigentlichen Leistungsfähigkeit bleibt. Erkennbar ist das an einer GPU-Auslastung deutlich unter 99 Prozent trotz niedriger FPS-Werte.