OpenAI vydala GPT-5-Codex, specializovanou verzi svého nejnovějšího modelu GPT-5, která je optimalizovaná pro takzvané “autonomní programování” (agentic coding). Model se stal výchozím enginem pro cloudové úkoly a kontrolu kódu v produktu Codex společnosti OpenAI od 15. září 2025. GPT-5-Codex dokáže pracovat na programátorských úkolech od několika sekund až po sedm hodin samostatně, což výrazně rozšiřuje možnosti automatizace v softwarovém vývoji.
Klíčovou vlastností GPT-5-Codex je dynamické řízení času “přemýšlení”, které umožňuje modelu rozhodnout se v průběhu úkolu, kolik výpočetní síly a času potřebuje na konkrétní problém. Na rozdíl od směrovače (router) v GPT-5, který rozhoduje o přidělení zdrojů na začátku, GPT-5-Codex může přizpůsobit svůj přístup v reálném čase během řešení úkolu. Alexander Embiricos, vedoucí produktu Codex v OpenAI, označil tuto vlastnost za hlavní výhodu oproti směrovačovému přístupu.
Trénink na reálných programátorských úkolech
GPT-5-Codex byl trénován na složitých, reálných inženýrských úkolech včetně budování celých projektů od základu, přidávání funkcí a testů, ladění chyb, provádění rozsáhlých refaktoringů a kontroly kódu. Model je lépe řiditelný, lépe dodržuje pokyny v souborech AGENTS.md a produkuje kvalitnější kód bez nutnosti dlouhých instrukcí ohledně stylu nebo čistoty kódu.
Výkon a benchmark výsledky
V benchmarku SWE-bench Verified, který obsahuje úkoly založené na reálném softwarovém inženýrství, dosahuje GPT-5-Codex skóre 74,9 %, což představuje zlepšení oproti předchozím verzím. V benchmarku pro refaktoring kódu se výkon zvýšil z 33,9 % u GPT-5 na 51,3 % u GPT-5-Codex. Model také vykazuje významné zlepšení v hodnoceních lidských preferencí při vytváření mobilních webových stránek.
Model byl také specificky trénován na provádění kontroly kódu a hledání kritických chyb. Během testování zkušení programátoři hodnotili komentáře modelu a zjistili, že GPT-5-Codex poskytuje méně nesprávných komentářů a více “vysoce impaktních” poznámek. Pro front-end úkoly se model ukázal jako spolehlivý partner - kromě vytváření estetických desktopových aplikací vykazuje GPT-5-Codex také významné zlepšení v hodnoceních lidských preferencí při vytváření mobilních webových stránek.
Integrace napříč platformami a nové funkce
GPT-5-Codex je integrován do všech platforem, kde je dostupný Codex: terminál přes Codex CLI, integrovaná vývojová prostředí (IDE) včetně VS Code a Cursor, webové rozhraní, GitHub a mobilní aplikace ChatGPT. Vývojáři mohou mezi těmito prostředími přepínat bez ztráty kontextu díky propojení s účty ChatGPT. Společnost přestavěla Codex CLI kolem “agentních” programátorských procesů, čímž z modelů udělala schopnější a spolehlivější partnery.
Nové funkce zahrnují možnost připojit a sdílet obrázky - snímky obrazovky, návrhy a diagramy - přímo v CLI pro vytvoření sdíleného kontextu ohledně designových rozhodnutí. Pro složitější práci nyní Codex sleduje pokrok pomocí seznamu úkolů a obsahuje nástroje jako webové vyhledávání a MCP (Model Context Protocol) pro připojení k externím systémům. Terminálové rozhraní bylo také vylepšeno - volání nástrojů a rozdíly v kódu jsou lépe formátovány a snadnější k sledování.
Pro uživatele ChatGPT Plus, Edu a Business je Codex určen pro několik zaměřených programátorských sessions týdně, zatímco uživatelé Pro mohou pokrýt celý pracovní týden napříč více projekty. Společnost plánuje zpřístupnit model také zákazníkům API v budoucnosti.
Pokročilé funkce a možnosti konfigurace
GPT-5-Codex nyní podporuje přístup k internetu během provádění úkolů, což umožňuje instalaci závislostí, aktualizaci balíčků a spouštění testů vyžadujících externí zdroje. Přístup k internetu je ve výchozím nastavení vypnutý a uživatelé Plus, Pro a Team ho mohou povolit pro konkrétní prostředí s podrobným ovládáním toho, k jakým doménám a HTTP metodám může Codex přistupovat.
Model umí nyní zobrazovat snímky obrazovky uživatelského rozhraní přímo v Codex web pro kontrolu front-end úkolů, což umožňuje iteraci nad designem bez nutnosti lokálního stažení větve. Codex také automaticky spouští standardní instalační příkazy pro běžné správce balíčků jako yarn, pnpm, npm, go mod, gradle, pip, poetry, uv a cargo v prostředích bez manuálních instalačních skriptů.
Významné zlepšení přineslo také cachování kontejnerů, které zrychluje spuštění nových úkolů o 90 %, snižuje medián času spuštění ze 48 sekund na 5 sekund. Uživatelé mohou volitelně nakonfigurovat maintenance skript pro aktualizaci prostředí z cachované stavu pro přípravu na nové úkoly.
Konkurence na trhu AI nástrojů pro programování
Vydání GPT-5-Codex je součástí snahy OpenAI učinit Codex konkurenceschopnějším vůči dalším AI programátorským nástrojům. Trh s nástroji pro automatizované programování se v posledním roce výrazně rozšířil díky intenzivní poptávce uživatelů. Konkurenční nástroj Cursor od společnosti Anysphere překročil 500 milionů dolarů ročních opakujících se příjmů (ARR) na začátku roku 2025, zatímco podobný kódový editor Windsurf se stal předmětem chaotického pokusu o akvizici za 3 miliardy dolarů, při kterém se jeho tým rozdělil mezi Google a Cognition.
Mezi další konkurenty patří Claude Code od společnosti Anthropic a Microsoft GitHub Copilot. Podle společnosti Cursor je GPT-5-Codex “nejchytřejší model, který kdy používali” a “pozoruhodně inteligentní, snadno řiditelný a má dokonce osobnost, kterou u jiných modelů neviděli.” Windsurf sdílel, že GPT-5-Codex je nejlepší na jejich hodnoceních a “má poloviční míru chyb při volání nástrojů oproti jiným předním modelům.”
OpenAI se snaží diferencovat svůj produkt schopností provádět dlouhodobé, komplexní úkoly autonomně, což je oblast, kde tradiční AI asistenti pro programování často selhávají.
Bezpečnostní aspekty a omezení přístupu
Konzistentně s přístupem k GPT-5 klasifikovala OpenAI model GPT-5-Codex jako “vysoké schopnosti” v biologických a chemických doménách a implementovala bezpečnostní opatření k minimalizaci souvisejících rizik. Model využívá specializované bezpečnostní trénování pro škodlivé úkoly a ochranu proti prompt injekčním útokům.
Na úrovni produktu jsou implementována opatření jako sandboxing agentů a konfigurovatelný přístup k síti. Výchozí konfigurace jsou úmyslně navrženy jako co nejbezpečnější a nejspolehlivější, poskytují robustní základnu pro zmírnění rizik. Agent běží v kontejnerizovaném prostředí, které mu ve výchozím nastavení brání v interakci s hostitelským systémem uživatele nebo dalšími citlivými komponentami.
Společnost doporučuje používat Codex pro kontrolu kódu jako doplňkového recenzenta, nikoli jako náhradu lidských recenzí. Přestože kontrola kódu v Codexu pomáhá snížit riziko nasazení nebezpečných problémů do produkce, OpenAI zdůrazňuje, že by měl být používán jako dodatečný recenzent.
GPT-5-Codex představuje další krok v automatizaci softwarového vývoje, kde AI agenti mohou převzít stále složitější úkoly a pracovat více autonomně. Dlouhodobá schopnost modelu pracovat na úkolech až sedm hodin otevírá možnosti pro automatizaci rozsáhlých refaktoringů, migrace kódu nebo implementace komplexních funkcí, které dříve vyžadovaly výhradně lidské programátory.
Model již našel praktické uplaštění - technický vedoucí v Cisco Meraki uvedl, že nástroj pomohl jeho týmu zcela outsourcovat refaktoring a generování testů, což jim umožnilo splnit harmonogram vydání bez dodatečného rizika. Zároveň je GPT-5-Codex již používán interně v OpenAI pro různé programátorské úkoly.
Více informací o GPT-5-Codex je dostupné na oficiální stránce OpenAI věnované vylepšením produktu Codex a v dokumentaci pro vývojáře.
|