Codex Agent steuert Apps und Workflows am Mac

Codex Update macht den Mac zum Agenten

Laut OpenAI wird Codex mit dem Update vom 16. April 2026 vom reinen Coding Helfer zum durchgängigen Arbeitsassistenten: Der Agent kann am Mac selbst klicken und tippen, mehr Tools per Plugins einbinden, Bilder generieren, Vorlieben merken und wiederkehrende Aufgaben über Tage weiterlaufen lassen. Ziel ist ein einziger Workspace, der Code, Reviews, Tools und Routinearbeit zusammenzieht.

Übersicht:

Wenn Codex den Mac mitbedient

Das Kernfeature dieses Releases ist laut OpenAI „Computer use“ im Hintergrund: Codex kann Apps auf dem eigenen Rechner bedienen, indem es Inhalte sieht, klickt und Text eingibt. Das erweitert den Agenten auf Workflows, die sonst an fehlenden APIs scheitern, zum Beispiel bei UI Tests, Tooling mit GUI oder schnellen Frontend Iterationen.

Praktisch gedacht ist das wie ein zweiter Cursor, der Aufgaben abarbeitet, während parallel weitergearbeitet wird. Laut OpenAI können mehrere Agenten gleichzeitig auf dem Mac laufen, ohne die eigene Arbeit in anderen Apps zu stören.

Browser als Steuerzentrale für Webarbeit

Zusätzlich beginnt Codex laut OpenAI, nativ mit dem Web zu arbeiten. Dafür gibt es einen In App Browser, in dem sich direkt auf der Seite Kommentare als präzise Anweisungen platzieren lassen. Kurzfristig zielt das vor allem auf Frontend und Game Dev, langfristig soll der Agent den Browser umfassender steuern können.

Bilder im selben Loop wie Code und Screenshots

Für visuelle Arbeit greift Codex laut OpenAI auf GPT Image 1.5 zu, um Bilder zu erzeugen und iterativ zu verbessern. In Kombination mit Screenshots und Code wird daraus ein enger Kreislauf aus Entwurf, Umsetzung und Abgleich, etwa für Mockups, UI Assets oder Spielgrafiken. Details zum Modell stehen im API Handbuch zu GPT Image 1.5.

Wie PRs, Terminals und Dateien in einem Cockpit landen

Das Update zielt nicht nur auf „mehr können“, sondern auf „weniger wechseln“. Laut OpenAI bekommt die Codex App tiefere Unterstützung für typische Entwicklerabläufe, damit Schreiben, Prüfen, Reviewen und Kollaborieren in einem Arbeitsraum zusammenlaufen.

Was sich im Alltag sofort bemerkbar macht

  • GitHub Reviews: Kommentare aus Reviews können gezielt abgearbeitet werden, statt als lose Liste im Browser zu hängen.
  • Mehrere Terminals: Mehrere Terminal Tabs erlauben parallele Runs, etwa Tests, Build, Lint, Dev Server.
  • SSH Devboxes: Remote Devboxes per SSH sind laut OpenAI als Alpha integriert, hilfreich für Team Umgebungen oder reproduzierbare Setups.
  • Datei Previews: Dateien lassen sich in der Sidebar mit Vorschau öffnen, darunter PDFs, Tabellen, Slides und Dokumente.
  • Summary Pane: Ein Bereich fasst Pläne, Quellen und Artefakte des Agenten zusammen, damit Entscheidungen nachvollziehbar bleiben.

Praxisbeispiel für ein Frontend Team

Ein Team baut eine neue Checkout Seite. Codex bekommt die Aufgabe, die lokale App zu starten, in mehreren Terminal Tabs Tests und Build laufen zu lassen, im In App Browser Layoutfehler zu markieren und passende UI Assets per Bildgenerierung zu iterieren. Danach erstellt der Agent einen PR Vorschlag, reagiert auf Review Kommentare und liefert eine kurze Statusübersicht im Summary Pane, inklusive Links zu den erzeugten Artefakten.

Klare Entscheidungsregel für „Computer use“

Wenn eine Aufgabe über eine stabile API und klare Eingaben lösbar ist, sollten Integrationen und Plugins bevorzugt werden. „Computer use“ ist die bessere Wahl, wenn ein Tool nur über GUI bedienbar ist, wenn visuelle Kontrolle zählt oder wenn ein Workflow viele kleine Klickschritte hat, die als API Aufwand unverhältnismäßig wären.

Wie Routinearbeit über Tage weiterläuft

Der zweite große Block dieses Updates ist „Carry work forward“. Laut OpenAI können Automationen bestehende Threads wiederverwenden, Kontext behalten und sogar zukünftige Arbeit einplanen, der Agent „wacht“ dann später auf und macht weiter, auch über Tage oder Wochen.

Wiederholbare Arbeit wird ein eigener Arbeitsstrom

  • Thread Recycling: Statt jedes Mal neu zu erklären, läuft Arbeit in wiederverwendbaren Gesprächssträngen weiter.
  • Geplante Aufgaben: Aufgaben können terminiert werden, damit der Agent später eigenständig fortsetzt.
  • Team Routine: Laut OpenAI nutzen Teams Automationen unter anderem, um offene PRs zu landen oder Follow ups in Tools wie Slack, Gmail und Notion nachzuhalten.

Memory Vorschau für Präferenzen und Korrekturen

OpenAI kündigt außerdem eine Vorschau auf „Memory“ an. Codex kann damit hilfreiche Informationen aus früherer Arbeit behalten, etwa Vorlieben, Korrekturen und mühsam zusammengetragene Fakten, sodass künftige Aufgaben schneller und konsistenter laufen.

Zusätzlich schlägt Codex laut OpenAI proaktiv nächste sinnvolle Schritte vor. Als Beispiel nennt OpenAI, dass Codex offene Kommentare in Google Docs erkennt, Kontext aus Slack, Notion und Code holt und daraus eine priorisierte To do Liste baut.

Wer bekommt welche Funktionen ab wann

Laut OpenAI rollen die Updates ab dem 16. April 2026 für Nutzer der Codex Desktop App aus, sofern sie mit ChatGPT angemeldet sind. Personalisierung, dazu zählen kontextbasierte Vorschläge und Memory, soll „bald“ für Enterprise, Edu sowie für Nutzer in der EU und im Vereinigten Königreich folgen.

„Computer use“ startet laut OpenAI zunächst auf macOS und soll später ebenfalls in der EU und im Vereinigten Königreich ausgerollt werden. Einstiegspunkte sind die Produktankündigung Codex for (almost) everything sowie die Übersichtsseite Codex. Hintergrund zur App gibt es in Introducing the Codex app.

Warum sich der Markt gerade neu sortiert

Die Marktverschiebung ist weniger „besseres Autocomplete“, sondern ein breiterer Anspruch: Der Agent wird zur Arbeitsoberfläche für Softwareentwicklung, inklusive Kontext, Aktionen und Langläufern. Ein nützliches Mini Modell dafür ist der Dreiklang Zugriff, Kontext, Taktung, also Bildschirm und Apps bedienen, über Plugins und Quellen verstehen, Aufgaben zeitlich weitertragen.

Der Hebel liegt in der Kombination: Plugins und Integrationen liefern Kontext und Aktionen über Tools, „Computer use“ schließt die Lücke zu nicht integrierten Apps, Automationen und Memory machen daraus Dauerbetrieb. OpenAI nennt in diesem Release außerdem mehr als 90 zusätzliche Plugins, darunter Atlassian Rovo für JIRA, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render und Superpowers.

Wer tiefer in das Ökosystem rund um agentische Workflows einsteigen will, kann als Anschlusslektüre das OpenAI Update The next evolution of the Agents SDK sowie die Team Pricing Meldung Codex now offers pay as you go pricing for teams nutzen.


Beitrag veröffentlicht

in

von