Mit GPT‑5, Codex und einer optimierten Agenten‑Architektur kann Software heute in Echtzeit (Inference‑Speed) generiert und bereitgestellt werden, wodurch das manuelle Durchsehen von Code entfällt und die Entwicklung beschleunigt wird.
Mit GPT‑5, Codex und einer optimierten Agenten‑Architektur kann Software heute in Echtzeit (Inference‑Speed) generiert und bereitgestellt werden, wodurch das manuelle Durchsehen von Code entfällt und die Entwicklung beschleunigt wird. Peter Steinberger berichtet, dass die Qualität der KI‑Code‑Generierung seit Mai wesentlich verbessert wurde; er arbeitet jetzt mit „Influbution‑Speed“, um Code in Echtzeit auszuführen. Die neueste Generation GPT‑5 (insbesondere 5.2) hat die Fähigkeit, umfangreiche Refactorings und große Features in einem Durchlauf zu erledigen, was vorher mit älteren Modellen wie Opus und vorherigen Codex‑Versionen nicht möglich war. Während Codex einen ausführlichen Voranlass des Lesens von Code (10–15 Minuten) durchführt, bevor er schreibt – ein Ansatz, der zwar langsamer wirken kann, dafür aber Fehlermeldungen und ineffiziente Lösungen reduziert – ist Opus schneller, aber häufig unvollständig bei größeren Aufgaben. „Plan mode“ war eine ältere Methode zur Steuerung von Modellen; heute reicht ein Gesprächsansatz („start a conversation with the model“, „build“, „write plan to docs“) wegen der verbesserten Prompt‑Folgefähigkeiten. Peter entwickelte die „Oracle“-CLI, um GPT‑5 Pro in wiederverwendbaren Sessions zu nutzen. Diese CLI ermöglicht ein schnelles Ansteuern der Pro‑Version, das Hochladen von Dateien und die Verwaltung von Antworten. Durch Oracle konnte er bisher täglich mehrere Anfragen ausführen, jetzt jedoch nur noch ein paar mal pro Woche, weil GPT‑5.2 bereits die meisten Aufgaben sofort löst. Der Wissenscut‑Off von GPT‑5.2 erstreckt sich bis Ende August 2025, deutlich später als bei Opus (März 2024), was Zugang zu aktuellen Technologien und Bibliotheken bedeutet. Auf der Programmiersprachen‑Ebene favorisiert Steinberger TypeScript für Web‑Applikationen, Go für CLIs und Swift für macOS/iOS‑Apps, wobei er das traditionelle Xcode‑Projekt‑System weitgehend vermeidet – Swifts Build‑Infrastruktur und Code‑generatoren reichen für die meisten Fälle. Beispielprojekt „VibeTunnel“: Ein Terminal‑Multiplexer, der initial in TypeScript entwickelt wurde, konnte kürzlich mit Codex in einer einzigen Sitzung in Zig konvertiert werden, was 5 Stunden und mehrere Komprimierungen brauchte, aber dennoch funktionierten. Als aktuelles großes Projekt arbeitet er an „Clawdis“, einem AI‑Assistenten, der vollen Zugriff auf sämtliche Computer‑, Messaging‑ und Smart‑Home‑Daten hat, einschließlich Kamera‑ und Lichtssteuerung. Clawdis interagiert per Befehlsschnittstelle, besitzt eine eigene Stimme und kann das Bett-Temperatursystem steuern. Workflow: Mehrere Projekte gleichzeitig (3–8 je nach Komplexität), wobei Hauptprojekte oft mehrere Satellitenprojekte aufweisen. Kontextwechsel ist belastend, daher arbeitet er bevorzugt zu Hause in Ruhe. Nutzung von Opus bleibt bestehen, da es für allgemeine Aufgaben und Automatisierung besonders angenehm ist; jedoch ist für die Kern‑Agenten‑Arbeit GPT‑5 vorzuziehen. Peter betont, dass die Konkurrenz (z. B. Anthropic) wichtig für Fortschritt ist, und erwartet eine mögliche neue Generation von Opus‑Modellen.
Quelle: https://steipete.me/posts/2025/shipping-at-inference-speed
