Die Codex App von OpenAI verlagert Softwareentwicklung von reiner Code-Vervollständigung hin zu agentenbasierten Workflows, in denen ein KI-Modell mehrstündige Aufgaben eigenständig erledigt. Laut Stack Overflow Developer Survey nutzen bereits 62 Prozent der Entwickler weltweit KI-Coding-Tools - die Codex App treibt diese Entwicklung in Richtung autonomer Agenten. Statt Zeile für Zeile vorzuschlagen, übernimmt das Tool ein ganzes Ticket. Es liest den Kontext, schreibt Code, führt Tests in einer Sandbox aus und legt am Ende einen Pull Request an. Für Entwicklerteams im deutschen Mittelstand ist die Anwendung damit der erste reife Vertreter einer neuen Werkzeugkategorie. Klare Vorteile zeigen sich bei Refactoring, Test-Generierung und Migration. Gleichzeitig stellt der Coding-Agent Anforderungen an DSGVO, Betriebsrat und Code-Review-Disziplin. Dieser Praxis-Guide zeigt, was die Codex App leistet, wie sie eingerichtet wird und wann sich der Einsatz im Unternehmen wirklich lohnt.
Kennzahlen auf einen Blick
Kennzahl Wert KI-Nutzung in deutschen Unternehmen 27 % (Bitkom 2024) Entwickler weltweit, die KI-Coding-Tools einsetzen 62 % (Stack Overflow Developer Survey 2024) Anteil KI-generierten Codes bei Microsoft rund 30 % (Satya Nadella, April 2025) Erwartete Adoption von KI-Coding-Assistenten bis 2028 75 % (Gartner 2024) Datenschutz als größte KI-Hürde im Mittelstand 56 % (Bitkom 2024) Unbesetzte IT-Stellen in Deutschland rund 149.000 (IW Köln 2024) Quellen: Bitkom Research 2024, Stack Overflow Developer Survey 2024, Gartner Forecast 2024, IW Köln MINT-Frühjahrsreport 2024.
Was ist die Codex App von OpenAI?
Die Codex App ist OpenAIs cloudbasierter Software-Engineering-Agent, der auf Basis des GPT-5-Codex-Modells eigenständig Code schreibt, refaktoriert, testet und Pull Requests erstellt. Sie umfasst drei Bausteine: das Web-Interface unter chatgpt.com/codex, die Codex CLI für das lokale Terminal und die native Anwendung für macOS und Windows. Hinzu kommen IDE-Erweiterungen für Visual Studio Code, Cursor und Windsurf sowie Anbindungen an Slack und GitHub. Beide Apps - die Desktop-Variante und die mobile Begleit-App in ChatGPT - teilen denselben Backend-Stack. Damit deckt das Tool den kompletten Entwicklungsalltag ab - vom kurzen Bugfix im Editor bis zum mehrstündigen Refactoring in der Cloud.
Codex App, Codex CLI und Codex Cloud im Zusammenspiel
Die drei Komponenten teilen Login, Kontext und Threads. Wer in der Anwendung eine Aufgabe startet, kann sie in der CLI weiterführen oder im Browser prüfen. Die Codex CLI läuft lokal auf dem eigenen Rechner und arbeitet direkt im Git-Repository. Codex Cloud übernimmt lange Tasks asynchron auf OpenAI-Infrastruktur, sodass mehrere Agenten parallel an Branches arbeiten. Beide Apps - die Desktop-Variante und das Web-Pendant - orchestrieren ihre Aufgaben in einer Multi-Thread-Sidebar, kombiniert mit Git-Worktrees, einem In-App-Browser und einem Review-Pane für Diffs.
Welches Modell steckt im Hintergrund?
Im Hintergrund arbeitet seit September 2025 GPT-5-Codex, eine für agentisches Coding feinabgestimmte Variante von GPT-5. Sie kann laut OpenAI bis zu sieben Stunden autonom an einer Aufgabe arbeiten und erreicht 74,5 Prozent auf SWE-bench Verified. Die im April 2026 nachgelegte Version GPT-5.3-Codex ist rund 25 Prozent schneller als ihr Vorgänger und erzielt 77,3 Prozent auf Terminal-Bench 2.0. Zum Vergleich: Anthropics Claude Opus 4.6 liegt im selben Benchmark bei 65,4 Prozent (heise.de). Die Modellwahl passiert weitgehend automatisch, lokal kann zusätzlich codex-mini-latest für schnelle Antworten genutzt werden. Externe Modelle anderer Anbieter werden Stand 2026 nicht unterstützt - ein Punkt, den Teams bei der Frage nach Vendor Lock-in mitdenken sollten.
Wofür eignet sich die Codex App im Unternehmensalltag?
Der Coding-Agent spielt seine Stärke vor allem dort aus, wo Aufgaben klar beschreibbar, aber mechanisch aufwendig sind. Refactoring großer Codebasen, Migration auf neue Frameworks, Erweiterung von Test-Suiten und Vorbereitung von Code-Reviews sind die typischen Use Cases. McKinsey misst bei diesen Routineaufgaben Zeitersparnisse von 35 bis 55 Prozent. Bei komplexen, schlecht dokumentierten Aufgaben sinkt der Effekt schnell unter zehn Prozent - ein Befund, der sich mit Praxiserfahrungen aus Mittelstandsprojekten deckt.
Die wichtigsten Einsatzfelder im Überblick:
- Refactoring von Legacy-Code: Module modernisieren, Abhängigkeiten aufbrechen, technische Schulden abbauen.
- Test-Generierung: Unit-, Integrations- und End-to-End-Tests für schwach abgedeckte Bereiche.
- Migration: Framework-Upgrades wie Java 8 auf 17 oder Angular-Major-Wechsel automatisiert vorbereiten.
- Bugfixing: Issues aus Tracker oder Slack übernehmen, Fehler reproduzieren, Branch mit Fix pushen.
- Code-Review: Pull Requests gegen Spezifikation und Tests prüfen, irrelevante Kommentare reduzieren.
- Dokumentation: READMEs, API-Beschreibungen und Architekturdiagramme aus dem Quellcode erzeugen.
- Prototyping: Kleine interne Tools, Dashboards oder Proof-of-Concepts auf Basis eines Prompts.
Codex App vs. GitHub Copilot, Claude Code und Cursor
Die Codex App ist nicht das einzige KI-Coding-Tool am Markt - aber sie verfolgt einen anderen Ansatz als die meisten Konkurrenten. GitHub Copilot bleibt im Editor und schlägt Inline-Code vor. Claude Code von Anthropic ist ein terminalzentrierter Agent mit ähnlicher Philosophie wie die Codex CLI. Cursor verlegt das gesamte IDE-Erlebnis in eine KI-native Oberfläche. Das OpenAI-Pendant geht einen Schritt weiter und stellt die parallele Orchestrierung mehrerer Agenten in den Mittelpunkt.
| Tool | Modell-Basis | Einstiegspreis | Stärke | Typische Schwäche |
|---|---|---|---|---|
| Codex App | GPT-5.3-Codex | ChatGPT Plus ab 20 USD pro Monat | Multi-Agent-Workflows, Cloud-Sandbox, Desktop-App | Externe Modelle nicht wählbar |
| GitHub Copilot | GPT-4.1, Claude, Gemini | 10 USD pro Nutzer und Monat | Reife IDE-Integration, Microsoft-Stack | Schwacher Agentic-Modus |
| Claude Code | Claude Opus 4.6 | Anthropic Pro ab 20 USD pro Monat | Sehr gutes Refactoring, transparente Tool-Use-Logs | Kein dediziertes Desktop-UI |
| Cursor | Auswählbar (Claude, GPT, Gemini) | Pro ab 20 USD pro Monat | Modellfreiheit, IDE-natives Pair Programming | Bindung an Cursor-Editor |
Für reine Inline-Vervollständigung im Microsoft-Stack ist Copilot weiterhin die pragmatische Wahl. Wer dagegen autonome, mehrstündige Tasks sucht, ist mit der Codex App oder Claude Code besser bedient. Für einen vertieften Vergleich der Desktop- und Open-Source-Pendants lohnt sich ein Blick in unseren Beitrag zur Codex Alternative und in den Überblick zu OpenCode.
Wie installiert man die Codex App?
Die Installation ist innerhalb weniger Minuten erledigt. OpenAI bietet vier Wege für den Zugriff auf seine Coding-Apps: die native Anwendung für macOS und Windows, die Codex CLI über npm oder Homebrew, die IDE-Erweiterung im VS-Code-Marketplace und das Codex-Web-Interface in ChatGPT. Linux ist Stand April 2026 noch über eine Warteliste angekündigt, die CLI läuft aber nativ auf jeder gängigen Distribution. Voraussetzung für alle Wege ist ein OpenAI-Konto - alternativ ein API-Schlüssel, der dann nach Tokens abgerechnet wird.
Die fünf Schritte für ein produktives Setup:
- ChatGPT-Plan prüfen: Plus, Pro, Business, Edu oder Enterprise aktivieren oder API-Key bereitlegen.
- Codex CLI installieren:
npm install -g @openai/codexoderbrew install --cask codexausführen. - Repository verbinden: Im Projektordner
codexstarten und mit ChatGPT-Login authentifizieren. - Sandbox konfigurieren: Modus auf
workspace-writesetzen und Approval-Verhalten wählen. - Ersten Task starten: Mit einem klaren Prompt wie “Erweitere die Tests für das Auth-Modul auf 80 Prozent Coverage” beginnen.
Schritt 1: ChatGPT-Plan prüfen
Das Tool ist als Anwendung kostenlos, die Nutzung erfordert aber einen aktiven ChatGPT-Plan. Plus deckt einzelne Entwickler ab, Pro mit unbegrenzten Tasks lohnt sich für Power-User, Business und Enterprise sind Pflicht, sobald mehrere Mitarbeiter koordiniert arbeiten oder Datenschutzanforderungen eine Rolle spielen. Wer keinen Plan abschließen will, hinterlegt einen API-Key und zahlt nach Tokens. In diesem Modus stehen einige Cloud-Funktionen wie persistente Threads allerdings nur eingeschränkt zur Verfügung.
Schritt 2: Codex CLI installieren
Die Codex CLI lässt sich mit einem einzigen Befehl global installieren. Auf macOS und Linux funktioniert npm install -g @openai/codex zuverlässig, auf macOS gibt es zusätzlich das Homebrew-Paket. Unter Windows arbeitet die CLI seit Anfang 2026 nativ; alternativ läuft sie über das Windows Subsystem for Linux. Die Binaries für alle Plattformen liegen außerdem als signierte Releases auf GitHub. Nach der Installation prüfen Nutzer mit codex --version, ob alles korrekt eingerichtet ist.
Schritt 3: Repository verbinden
Der Befehl codex im Projektordner startet die App. Beim ersten Aufruf führt sie durch den Login per ChatGPT-Konto und verknüpft das Repository. Eine Datei namens AGENTS.md im Projektroot beschreibt Konventionen, Frameworks, Teststrategie und Codestil. Sie ist das Pendant zu CLAUDE.md bei Claude Code oder zu .cursorrules bei Cursor. Eine gut gepflegte AGENTS.md verbessert die Ergebnisqualität spürbar, weil weniger generischer Code produziert wird. Wer hier Zeit ins Prompt Engineering investiert, holt deutlich mehr aus dem Modell heraus.
Schritt 4: Sandbox konfigurieren
Die Codex CLI kennt drei Sandbox-Modi: read-only für reine Code-Audits, workspace-write für Änderungen am aktuellen Projekt und danger-full-access für völligen Systemzugriff. Letzterer gehört ausschließlich in dedizierte Container oder Cloud-VMs. Ergänzt wird die Sandbox durch vier Approval-Modi - von on-request mit Rückfrage bei jeder Aktion bis zu never für voll autonomes Arbeiten. Eine sichere Standardkombination im Tagesgeschäft: --sandbox workspace-write --ask-for-approval on-failure.
Schritt 5: Ersten Task starten
Der erste produktive Task sollte klar umrissen, fachlich klein und technisch nachvollziehbar sein. Gut geeignet sind Beispiele wie “Erstelle Unit-Tests für das Modul payment.ts mit 80 Prozent Coverage” oder “Refaktoriere die Funktion calculateInvoice in eine reine Funktion und ergänze Tests”. Der Agent liest den Kontext, formuliert einen Plan, führt Änderungen aus und legt einen Branch an. Im Review-Pane lässt sich anschließend prüfen, welche Diffs entstanden sind, bevor der Pull Request gemergt wird.
Was kostet die Codex App?
Die Preisstruktur folgt den ChatGPT-Plänen und ist damit transparent kalkulierbar. ChatGPT Plus liegt bei 20 US-Dollar pro Monat und reicht für einzelne Entwickler, die überwiegend lokal arbeiten. Pro für 200 US-Dollar pro Monat hebt die Limits drastisch an und ist für Power-User mit langen Cloud-Tasks ausgelegt. Business beginnt bei rund 25 US-Dollar pro Nutzer und Monat und liefert Admin-Funktionen, Single Sign-on und Auftragsverarbeitungsvertrag. Enterprise und Edu werden individuell verhandelt und enthalten erweiterte Datenschutz- und Compliance-Optionen.
| Plan | Preis (USD) | Geeignet für | Codex-Limits |
|---|---|---|---|
| Plus | 20 pro Monat | einzelne Entwickler | Standard-Limits, Cloud-Tasks möglich |
| Pro | 200 pro Monat | Power-User mit langen Tasks | praktisch unbegrenzt, mehrere parallele Agenten |
| Business | ab 25 pro Nutzer und Monat | Teams ab fünf Personen | Admin-Tools, AVV, Trainings-Opt-out |
| Enterprise | individuell | mittlere und große Mittelständler | SSO, Audit-Logs, erweiterte DSGVO-Optionen |
OpenAI hat zum Launch der nativen Anwendung die Limits aller bezahlten Pläne verdoppelt - ein Hinweis darauf, dass das Unternehmen das Coding-Produkt als zentrale Säule des kommerziellen Geschäfts versteht. Token-Limits und Kontextfenster sind dabei modellabhängig und werden in den Account-Einstellungen angezeigt. Wer die Tokens lieber direkt abrechnet, nutzt den API-Key-Login. In dem Fall fallen die üblichen GPT-5-Codex-Tarife pro Token an.
Wie unterscheidet sich die Codex App von ChatGPT?
Die Codex App und ChatGPT teilen das Modell, aber nicht den Zweck. ChatGPT ist ein generalistischer Assistent für Text, Recherche, Bildgenerierung und einfache Code-Snippets im Browser. Die Codex App ist ein spezialisierter Coding-Agent, der direkt am Quellcode arbeitet, Tests in einer Sandbox ausführt und Pull Requests erzeugt. Sie hat Zugriff auf das Git-Repository, kennt Worktrees, kann Dateien anlegen und löschen und persistiert Threads über Tage. ChatGPT bleibt das richtige Werkzeug für ad-hoc-Fragen, für ernsthafte Software-Engineering-Aufgaben ist die Codex App das passende Format. Wer den breiteren Agenten-Kontext verstehen will, findet im Beitrag Agentic AI erklärt eine fundierte Einordnung.
Reifegradmodell: Wo steht Ihr Team mit KI-gestützter Entwicklung?
Bevor ein Team die Codex App produktiv nutzt, lohnt sich eine ehrliche Standortbestimmung. Das folgende Reifegradmodell beschreibt, welche Stufe der KI-Unterstützung typischerweise im deutschen Mittelstand vorzufinden ist und wo die Codex App sinnvoll andockt.
| Stufe | Bezeichnung | Typische Merkmale | Empfehlung |
|---|---|---|---|
| 0 | Manuell | kein KI-Tool, klassische IDE | Mit Code-Completion starten |
| 1 | Inline-Assistenz | GitHub Copilot oder vergleichbar im Editor | Chat-Pairing für komplexere Aufgaben einführen |
| 2 | Chat-gestützt | ChatGPT oder Claude für Recherche und Snippets | Erste agentenbasierte Tasks pilotieren |
| 3 | Agentic Coding | Codex App, Claude Code, Cursor-Agent für einzelne Tasks | Workflows standardisieren, AGENTS.md pflegen |
| 4 | Multi-Agent-Pipeline | Codex Cloud + CI/CD, mehrere parallele Agenten | Governance, KPI und Audit etablieren |
Die Mehrzahl deutscher Entwicklungsteams steht laut Bitkom-Studie 2024 zwischen Stufe 1 und 2. Die Codex App ist der Hebel, um Stufe 3 zu erreichen, ohne das Tooling komplett umzubauen. Vor dem Sprung auf Stufe 4 gehört ein Governance-Konzept auf den Tisch - inklusive Code-Owner-Regeln, automatischer Sicherheitsprüfung und einer klaren Eskalationsmatrix.
Praxis: Codex App im Mittelstand einführen
Theorie ist hilfreich, aber erst der konkrete Roll-out zeigt, ob die Codex App im Unternehmen liefert. Die folgenden zwei Bausteine - ein Praxisbeispiel und ein 30-Tage-Plan - geben einen praktischen Rahmen für den Einstieg.
Praxisbeispiel: Migration im mittelständischen Maschinenbau
Ein mittelständischer Maschinenbauer mit rund 60 Entwicklern stand vor der Aufgabe, ein altes PHP-Backend zur Auftragsverwaltung auf TypeScript zu portieren. Geschätzter Aufwand klassisch: drei Personenmonate, geplant über zwei Quartale. Mit dem Coding-Agenten und einer sauber gepflegten AGENTS.md übernahm ein Cloud-Worker zunächst die Strukturanalyse und legte einen Migrationsplan an. In drei Wochen hatte das Team eine lauffähige Erstversion mit 78 Prozent Test-Coverage.
Ergebnis nach drei Wochen:
- 14.000 Zeilen Legacy-PHP migriert
- 78 Prozent automatische Test-Coverage erreicht
- rund 40 Prozent Aufwand gegenüber klassischer Migration eingespart
- keine Eskalation an externe Entwicklungsdienstleister nötig
Wichtig für den Erfolg: Jede KI-Änderung wurde durch zwei menschliche Reviewer freigegeben, sicherheitskritische Module liefen ausschließlich im Sandbox-Modus, und sensible Konfigurationsdateien standen auf der .codexignore-Liste. Ohne diese Disziplin hätten die in mehreren Studien dokumentierten Qualitätsprobleme - GitClear hat eine Verdoppelung des sogenannten Code Churn seit Copilot-Einführung gemessen - schnell jede Zeitersparnis aufgefressen.
30-Tage-Plan für den Einstieg
Ein realistischer Einstieg dauert vier Wochen. In Woche eins richten zwei oder drei Entwickler die Codex App lokal ein, schreiben eine erste AGENTS.md und übernehmen einfache Bugfix-Tickets im read-only-Modus. Woche zwei schaltet workspace-write frei, setzt SAST-Pipelines auf und definiert Code-Owner-Regeln. In Woche drei werden Pilot-Tasks größer: Test-Erweiterungen, Dokumentationsläufe und ein erstes Refactoring. Woche vier liefert die Bilanz - mit harten KPIs wie Pull-Request-Durchlaufzeit, Test-Coverage und Anteil von der KI vorbereiteter Änderungen.
Diese Phase ist auch der richtige Zeitpunkt, den Betriebsrat einzubinden, eine Betriebsvereinbarung zu entwerfen und den AVV mit OpenAI zu unterzeichnen. Erst danach folgt der breitere Roll-out auf weitere Teams - mit klaren Erwartungen: Das Werkzeug ersetzt keine Entwickler, sondern verschiebt deren Arbeit von tippintensiven Aufgaben hin zu Architektur, Review und Domänenwissen.
DSGVO, EU AI Act und Betriebsrat: Was müssen Geschäftsführer wissen?
Die Codex App nutzt OpenAI-Infrastruktur in den USA. Damit gelten dieselben Datenschutzregeln wie für ChatGPT Business und Enterprise. Datenschutz ist laut Bitkom-Studie 2024 für 56 Prozent der deutschen Unternehmen das größte Hindernis beim KI-Einsatz - und genau hier liegt der häufigste Stolperstein bei der Codex-Einführung. Drei Themen müssen vor dem Roll-out geklärt sein.
Auftragsverarbeitung und Trainings-Opt-out
Für ChatGPT Business, Enterprise und Edu stellt OpenAI einen Auftragsverarbeitungsvertrag bereit. In diesen Plänen werden Eingaben standardmäßig nicht zum Modelltraining verwendet. Plus und Pro decken den geschäftlichen Einsatz nur eingeschränkt ab, weil hier kein automatischer AVV vorgesehen ist. Wer die Codex App produktiv mit Kundendaten oder Geschäftsgeheimnissen nutzt, sollte den Business- oder Enterprise-Plan wählen und das Datenschutz-Setup zentral verwalten. Eine vertiefte Übersicht liefert der Beitrag zu DSGVO-konformen KI-Tools.
Pflichten aus dem EU AI Act
Der EU AI Act stuft Coding-Assistenten in der Regel als General-Purpose-AI mit begrenztem Risiko ein. Pflichten ergeben sich aber, sobald die Codex App Code für Hochrisiko-Systeme erzeugt - etwa in Medizintechnik, kritischer Infrastruktur oder Personalauswahl. In diesen Bereichen gelten Dokumentations-, Transparenz- und Aufsichtspflichten. Für eine umfassende Einordnung lohnt sich der Blick in den EU AI Act im Unternehmen. Auch die Software-Lieferkette gewinnt an Gewicht: Eine Software Bill of Materials sollte KI-Beiträge markieren.
Mitbestimmung und Betriebsrat
Sobald die Codex App eigenständig Code generiert, der später in Produktivsysteme einfließt, fällt sie unter die Mitbestimmungspflicht nach Paragraf 87 BetrVG. Betriebsräte dürfen Auswahl, Konfiguration und Nutzung mitgestalten. Geschäftsführer im Mittelstand binden den Betriebsrat daher frühzeitig ein - idealerweise mit einer kurzen Betriebsvereinbarung, die Sandbox-Modus, Daten, Zugriffsrechte und Audit-Logs regelt.
Wie sicher ist die Codex App für Unternehmenscode?
Das Tool ist sicher, wenn es diszipliniert eingesetzt wird. Drei Mechanismen tragen entscheidend bei: Sandbox-Modi, Approval-Regeln und Code-Reviews. Eine Stanford-Studie zeigt, dass Entwickler mit KI-Assistenz dazu neigen, ihren Code als sicherer einzuschätzen, als er ist. Snyk berichtet im AI Code Security Report 2024, dass 56 Prozent der Entwickler regelmäßig auf Sicherheitsprobleme im KI-Output stoßen. Das spricht nicht gegen den Coding-Agenten, sondern für eine klare Review- und Test-Pipeline.
Drei Hebel, die das Risiko klein halten:
- Sandbox standardmäßig aktiv:
read-onlyoderworkspace-writeals Default,danger-full-accessausschließlich in isolierten Containern. - Statische Code-Analyse in CI: SAST-Werkzeuge wie Semgrep oder Snyk prüfen jeden KI-generierten Pull Request automatisch.
- Vier-Augen-Review: Jede Änderung wird von einem Menschen freigegeben, kritische Pfade von zwei. Audit-Logs werden in Git und Codex-Threads aufbewahrt.
Wer die Codex-Anwendung in eine breitere Agenten-Strategie einbetten möchte, findet im Beitrag zum KI-Agent erstellen sowie zur Anbindung über MCP-Server weiterführende Bausteine.
Fazit: Wann lohnt sich der Einsatz der Codex App?
Die Codex App lohnt sich für jedes Entwicklungsteam, das Routinearbeit reduzieren und sich auf Architektur und Fachlogik konzentrieren will. Sie spielt ihre Stärken bei Refactoring, Test-Generierung und Migration aus, wo dokumentierte Zeitersparnisse zwischen 35 und 55 Prozent liegen. Sie ist nicht die richtige Wahl, wenn Datenschutz nicht geklärt ist, der Betriebsrat nicht eingebunden wurde oder die Code-Review-Disziplin schwach ist. Mit Business- oder Enterprise-Plan, sauberem AVV, klaren Sandbox-Regeln und automatischer Sicherheitsprüfung wird die Codex App zu einem belastbaren Baustein in der Werkzeugkiste deutscher Mittelständler - und schließt einen Teil der Fachkräftelücke, die das IW Köln auf rund 149.000 unbesetzte IT-Stellen beziffert.
Sie möchten die Codex App in Ihrem Unternehmen einsetzen oder eine passende KI-Coding-Strategie aufsetzen? Sprechen Sie uns an - wir beraten Sie unverbindlich.
Häufige Fragen
Was ist die Codex App?
Die Codex App ist OpenAIs cloudbasierter Software-Engineering-Agent. Sie schreibt, refaktoriert und testet Code, führt Pull Requests aus und besteht aus drei Komponenten: einer Desktop-Anwendung für macOS und Windows, der Codex CLI fürs Terminal sowie dem Web-Interface unter chatgpt.com/codex. Im Hintergrund arbeitet das Modell GPT-5-Codex, eine für Coding-Aufgaben feinabgestimmte Variante von GPT-5.
Ist die Codex App kostenlos?
Die Codex App selbst ist kostenfrei verfügbar, für die produktive Nutzung wird aber ein aktiver ChatGPT-Plan benötigt. ChatGPT Plus startet bei 20 US-Dollar pro Monat, Pro liegt bei 200 US-Dollar, Business beginnt bei rund 25 US-Dollar pro Nutzer und Monat. Alternativ ist der Login per OpenAI-API-Key möglich, dann fällt eine tokenbasierte Abrechnung an.
Auf welchen Betriebssystemen läuft die Codex App?
Die native Anwendung gibt es für macOS - Apple Silicon und Intel - sowie für Windows, dort auch über den Microsoft Store. Linux ist Stand 2026 nur über eine Warteliste angekündigt, die Codex CLI läuft aber nativ auf jeder gängigen Linux-Distribution. Mobile Begleitfunktionen sind in der ChatGPT-App für iOS und Android verfügbar.
Wie unterscheidet sich die Codex App von der Codex CLI?
Die Desktop-Anwendung ist eine grafische Oberfläche mit Multi-Thread-Sidebar, Worktree-Verwaltung, integriertem Browser und Review-Pane für Diffs. Die Codex CLI ist ein leichtgewichtiger Coding-Agent fürs Terminal, der per `npm install -g @openai/codex` installiert wird. Beide nutzen denselben Login und greifen auf dieselben Cloud-Threads zu, sodass sich Aufgaben fließend zwischen den Welten wechseln lassen.
Wie installiere ich Codex CLI?
Die Codex CLI lässt sich global per `npm install -g @openai/codex` installieren, alternativ über Homebrew mit `brew install --cask codex`. Für alle Plattformen liegen außerdem signierte Binaries in den GitHub-Releases. Nach der Installation startet `codex` im Projektordner den Anmeldeprozess, idealerweise per Sign-in mit ChatGPT.
Welche Modelle nutzt die Codex App?
Die Codex App läuft auf der hauseigenen Codex-Modellfamilie von OpenAI. Aktuell ist GPT-5.3-Codex der Standard, ergänzt um die schnelle Variante codex-mini-latest für einfache Tasks. Externe Modelle anderer Anbieter werden in der App Stand 2026 nicht unterstützt, in der CLI sind über benutzerdefinierte Endpunkte begrenzte Erweiterungen möglich.
Ist die Codex App DSGVO-konform?
Die Codex App ist DSGVO-konform nutzbar, wenn der passende Plan gewählt wird. ChatGPT Business, Enterprise und Edu enthalten einen Auftragsverarbeitungsvertrag, Daten fließen standardmäßig nicht ins Modelltraining. In Plus und Pro fehlt der automatische AVV, weshalb diese Pläne für den geschäftlichen Einsatz mit personenbezogenen Daten nicht ausreichen. Mitbestimmung nach Paragraf 87 BetrVG ist beim Roll-out zu beachten.
Codex App vs. GitHub Copilot - was ist besser?
GitHub Copilot ist ein Inline-Vervollständiger, der direkt im Editor Vorschläge liefert und besonders im Microsoft-Stack reibungslos läuft. Die Codex App ist ein autonomer Agent, der ganze Tickets übernimmt, mehrstündig arbeitet und Pull Requests anlegt. Für schnelle Tipparbeit ist Copilot praktisch, für Refactoring und Migration großer Codebasen ist die Codex App das passendere Werkzeug.
Was kann die Codex App im Vergleich zu ChatGPT?
ChatGPT ist ein Generalist für Text, Recherche und einfache Code-Snippets, die Codex App ist ein spezialisierter Agent mit Zugriff auf Git-Repositories, Worktrees, Tests und Pull Requests. Sie persistiert Threads über Tage und arbeitet in einer Sandbox auf realen Dateien, während ChatGPT keine direkte Verbindung zu lokalen Projekten hat. Beide Werkzeuge teilen das Modell, aber nicht den Zweck.
Welche Sicherheitsmodi bietet die Codex App?
Die Codex CLI kennt drei Sandbox-Modi: `read-only` für reine Audits, `workspace-write` für Änderungen am aktuellen Projekt und `danger-full-access` für völlige Systemfreigabe. Letzterer gehört ausschließlich in Container oder VMs. Ergänzend stehen vier Approval-Modi zur Verfügung, von Rückfrage bei jeder Aktion bis zu vollautonomem Arbeiten - sinnvolle Praxiskombination ist `workspace-write` plus `on-failure`.
Kann die Codex App eigenständig committen und pushen?
Ja, die Codex App kann Branches anlegen, committen, pushen und Pull Requests erstellen. Welche Aktionen autonom erlaubt sind, regeln Sandbox- und Approval-Modus. Im sicheren Standardbetrieb fragt die Anwendung bei kritischen Schritten zurück, im autonomen Modus laufen lange Tasks ohne Eingriff durch. Für Unternehmen empfiehlt sich ein Vier-Augen-Review jedes generierten Pull Requests.
Wie sicher ist KI-generierter Code aus der Codex App?
KI-generierter Code aus der Codex App ist nicht automatisch sicher. Eine Stanford-Studie zeigt, dass Entwickler ihren mit KI erzeugten Code häufig sicherer einschätzen, als er ist. Snyk berichtet, dass 56 Prozent der Entwickler regelmäßig auf Sicherheitsprobleme im KI-Output stoßen. Pflicht im Unternehmen sind daher statische Code-Analyse in der CI-Pipeline, automatisierte Tests und disziplinierte Code-Reviews.
Sie möchten KI in Ihrem Unternehmen einsetzen? Sprechen Sie uns an - wir beraten Sie unverbindlich.