Mit GPT-5.4 Thinking hat OpenAI Anfang März 2026 ein neues Modell für ChatGPT vorgestellt, das sich klar an anspruchsvollere Aufgaben richtet. Im Mittelpunkt stehen nicht lockere Kurzdialoge, sondern professionelle Wissensarbeit: komplexe Recherchen, längere Dokumente, Präsentationen, Tabellen, saubere Anweisungsbefolgung und Aufgaben, bei denen Struktur und Verlässlichkeit wichtiger sind als reine Geschwindigkeit.
Genau darin liegt der eigentliche Unterschied zu vielen kleineren Modellupdates. OpenAI beschreibt GPT-5.4 als das bisher leistungsfähigste und effizienteste Frontier-Modell für professionelle Arbeit. In ChatGPT erscheint es als GPT-5.4 Thinking, zusätzlich gibt es GPT-5.4 Pro für besonders anspruchsvolle Aufgaben.
Das Modell zeigt früher, wohin die Antwort läuft
Eine der praktischsten Neuerungen ist die sichtbare Vorplanung. GPT-5.4 Thinking kann in ChatGPT vor längeren oder komplexeren Antworten eine kurze Einleitung anzeigen, in der es seinen geplanten Ansatz skizziert. Nutzer können dadurch schon während der Bearbeitung eingreifen und die Richtung korrigieren, bevor das Ergebnis vollständig ausgegeben ist.
Das klingt zunächst unspektakulär, ist im Alltag aber nützlich. Viele KI-Antworten scheitern nicht daran, dass sie gar nichts liefern, sondern daran, dass sie zu früh auf die falsche Spur geraten. Wenn sich dieser Kurs schon während der Bearbeitung nachjustieren lässt, spart das oft zusätzliche Rückfragen und mehrere Korrekturschleifen. Diese Einordnung ist eine Schlussfolgerung aus den von OpenAI beschriebenen Funktionen.
Spürbare Fortschritte bei echter Wissensarbeit
OpenAI nennt mehrere Bereiche, in denen GPT-5.4 Thinking gegenüber früheren Thinking-Modellen klar besser geworden sein soll. Dazu zählen Tabellen erstellen und bearbeiten, Frontend-Code, Präsentationen, schwierige Mathematik, Dokumentenverständnis, Anweisungsbefolgung, Bildverständnis, Tool-Nutzung und Recherchen, bei denen Informationen aus vielen Quellen zusammengeführt werden müssen.
Diese Positionierung wird auch mit Benchmarks unterlegt. Auf GDPval, einem Benchmark für klar definierte Wissensarbeit über 44 Berufe hinweg, erreicht GPT-5.4 laut OpenAI 83,0 Prozent und liegt damit über GPT-5.2 mit 70,9 Prozent. Bei internen Aufgaben zum Spreadsheet-Modelling kommt GPT-5.4 auf 87,3 Prozent gegenüber 68,4 Prozent bei GPT-5.2. Bei Präsentationsbewertungen bevorzugten menschliche Tester die Ergebnisse von GPT-5.4 in 68,0 Prozent der Fälle gegenüber GPT-5.2. Benchmarks ersetzen keine eigene Qualitätsprüfung, zeigen aber deutlich, worauf OpenAI dieses Modell optimiert hat.
Längeres Nachdenken ohne so schnell den Faden zu verlieren
Ein weiterer Fortschritt betrifft die Ausdauer des Modells. Laut OpenAI kann GPT-5.4 Thinking bei harten Aufgaben länger denken, ohne so schnell aus dem Tritt zu geraten. Außerdem soll es besser im Blick behalten, was bereits erledigt wurde, damit wichtige Details seltener erneut wiederholt werden müssen.
Gerade bei langen Briefings, mehrteiligen Arbeitsaufträgen oder komplexen Analysen ist das entscheidend. Wer solche Aufgaben mit älteren Modellen bearbeitet hat, kennt das Problem: gute erste Ansätze, dann Wiederholungen, verlorene Vorgaben oder unnötige Umwege. GPT-5.4 Thinking soll hier robuster arbeiten und komplexe Aufgaben stabiler durchhalten.
Web-Recherche wird gezielter und belastbarer
Auch bei der Recherche im Web hebt OpenAI klare Verbesserungen hervor. GPT-5.4 soll Informationen hartnäckiger über mehrere Suchrunden hinweg verfolgen, relevantere Quellen identifizieren und schwierige Fragen besser beantworten, wenn die Antwort nicht auf einer einzigen Seite zu finden ist. Auf dem Benchmark BrowseComp springt GPT-5.4 laut OpenAI um 17 Prozentpunkte gegenüber GPT-5.2 nach oben.
Für die Praxis ist das besonders interessant, wenn Sie mit Marktinformationen, technischen Details, Wettbewerbsvergleichen oder anderen Themen arbeiten, bei denen sich relevante Informationen erst aus mehreren Quellen zusammensetzen. Genau dort trennt sich oft der Unterschied zwischen einer schnellen Standardantwort und einer wirklich nützlichen Recherche.
Besser im Zusammenspiel mit Tools und komplexen Workflows
OpenAI beschreibt GPT-5.4 außerdem als stärker im Umgang mit Tools, Softwareumgebungen und längeren Abläufen. In der Produktankündigung heißt es, GPT-5.4 sei das erste allgemeine Modell des Unternehmens mit nativen Computer-Use-Fähigkeiten auf Spitzenniveau. In API- und Codex-Szenarien unterstützt es laut OpenAI bis zu eine Million Tokens Kontext. Gleichzeitig soll es Werkzeuge gezielter finden und effizienter einsetzen.
Für normale ChatGPT-Nutzung ist weniger die technische Zahl entscheidend als die praktische Folge: Das Modell soll mehrstufige Aufgaben sauberer planen, Werkzeuge gezielter einsetzen und längere Arbeitsprozesse zuverlässiger bearbeiten. Gerade bei Dokumenten, Tabellen, Dateianalysen und komplexen Aufgabenketten dürfte dieser Fortschritt am ehesten spürbar werden.
Weniger Fehler und aufgeräumtere Ergebnisse
Ein weiterer wichtiger Punkt ist die Qualität der Antworten selbst. OpenAI nennt GPT-5.4 das bisher faktentreueste Modell des Unternehmens. Auf einem internen Datensatz mit Prompts, bei denen Nutzer zuvor sachliche Fehler markiert hatten, waren einzelne Aussagen laut OpenAI um 33 Prozent seltener falsch als bei GPT-5.2. Vollständige Antworten enthielten 18 Prozent seltener überhaupt Fehler.
Zusätzlich beschreibt OpenAI die Ausgaben von GPT-5.4 Thinking als gestraffter, klarer formatiert und mit weniger unnötigem Überschriftenballast. Das klingt nebensächlich, spart in der Praxis aber Zeit, weil Antworten seltener erst aufgeräumt werden müssen, bevor sie intern weitergegeben oder direkt weiterverarbeitet werden können.
Wie sich GPT-5.4 Thinking in ChatGPT einordnet
Laut OpenAI ist GPT-5.3 Instant für eingeloggte Nutzer der Standard. Das System „Auto“ entscheidet je nach Aufgabe, ob GPT-5.3 Instant oder GPT-5.4 Thinking verwendet wird. Wer gezielt tieferes Reasoning möchte, kann im Model Picker direkt „Thinking“ auswählen. Zusätzlich gibt es „Pro“ für noch anspruchsvollere Aufgaben.
Bei der Verfügbarkeit gibt es Unterschiede nach Tarif. Laut Help Center ist GPT-5.3 für alle ChatGPT-Tiers verfügbar. Bezahlte Tarife wie Plus, Pro und Business erhalten Zugriff auf den Model Picker und können GPT-5.4 Thinking manuell auswählen. GPT-5.4 Pro ist nur für Pro, Business, Enterprise und Edu vorgesehen. Für Enterprise- und Edu-Workspaces sind GPT-5.3 Instant sowie GPT-5.4 Thinking und Pro laut Help Center standardmäßig deaktiviert und müssen von Admins per Early Model Access freigeschaltet werden.
Fazit
GPT-5.4 Thinking ist nicht einfach nur ein kleines Feintuning. Das Modell wurde sichtbar auf echte Arbeitsaufgaben ausgerichtet: bessere Vorplanung, stabileres Denken über längere Aufgaben hinweg, stärkere Web-Recherche, saubereres Arbeiten mit Tools und hochwertigere Ergebnisse bei typischen Formaten wie Dokumenten, Tabellen und Präsentationen.
Für alle, die ChatGPT ernsthaft im Arbeitsalltag einsetzen, ist genau das die interessante Nachricht. GPT-5.4 Thinking wirkt weniger wie ein Modell für schnelle Demos und stärker wie ein Werkzeug für anspruchsvollere Wissensarbeit. Und genau daran wird sich sein Nutzen im Alltag letztlich messen lassen.
Quellen
Stand der Quellenprüfung: 7. März 2026.