Patrick Zandl's Blog: Marigold.cz - OpenAI pÅedstavuje Codex - agenta pro vÃ½voj software

AI novinky k 15.5.2025 Claude Opus 4 a Claude Sonnet 4 pod d...

OpenAI pÅedstavuje Codex - agenta pro vÃ½voj software

OpenAI pÅedstavila âvÃ½zkumnou preview verziâ novÃ©ho nÃ¡stroje nazvanÃ©ho Codex. Tedy nejde o totÃ¡lnÃ novinku, Codex jiÅ¾ byl pÅedsaven jako aplikace Codex CLI pro pÅÃkazovou ÅÃ¡dku, nynÃ jde ale o kompletnÄjÅ¡Ã webovÃ© rozhranÃ. AÄkoliv nedosahuje komplexnosti sluÅ¾eb jako Lovable, jde o zajÃmavÃ©ho agenta pro vÃ½voj software.

HlavnÃ vÃ½hodou Codexu mÃ¡ bÃ½t schopnost paralelnÄ pracovat na mnoha Ãºkolech. PodÃvejme se detailnÄ na to, co tento nÃ¡stroj pÅinÃ¡Å¡Ã, jakÃ© jsou jeho moÅ¾nosti a omezenÃ.

Co je Codex?

Codex je cloudovÃ½ software zaloÅ¾enÃ½ na modelu codex-1, coÅ¾ je verze modelu OpenAI o3 optimalizovanÃ¡ pro softwarovÃ© inÅ¾enÃ½rstvÃ. Podle dokumentace byl tento model trÃ©novÃ¡n pomocÃ reinforcement learning na reÃ¡lnÃ½ch Ãºkolech kÃ³dovÃ¡nÃ v rÅ¯znÃ½ch prostÅedÃch. HlavnÃm cÃlem bylo generovat kÃ³d, kterÃ½ napodobuje lidskÃ½ styl psanÃ, pÅesnÄ dodrÅ¾uje instrukce a dokÃ¡Å¾e iterativnÄ spouÅ¡tÄt testy, dokud nedosÃ¡hne ÃºspÄÅ¡nÃ©ho vÃ½sledku.

[image error]

Dostupnost a rozÅ¡ÃÅenÃ

V souÄasnÃ© dobÄ je Codex dostupnÃ½ pro uÅ¾ivatele ChatGPT Pro, ChatGPT Enterprise a ChatGPT Team. OpenAI plÃ¡nuje v budoucnu rozÅ¡ÃÅit dostupnost i pro uÅ¾ivatele ChatGPT Plus a ChatGPT Edu. BÄhem vÃ½zkumnÃ© preview fÃ¡ze majÃ uÅ¾ivatelÃ© k dispozici âvelkorysÃ½ pÅÃstup bez dodateÄnÃ½ch nÃ¡kladÅ¯â po dobu nÄkolika tÃ½dnÅ¯. NÃ¡slednÄ OpenAI plÃ¡nuje zavÃ©st cenovou politiku s moÅ¾nostÃ dokoupit dodateÄnÃ© vyuÅ¾itÃ podle potÅeby.

Jak Codex funguje

PÅÃstup k Codexu je moÅ¾nÃ½ pÅes postrannÃ panel v ChatGPT. UÅ¾ivatelÃ© mohou zadat novÃ© Ãºkoly kÃ³dovÃ¡nÃ zadÃ¡nÃm promptu a kliknutÃm na tlaÄÃtko âCodeâ. Pro dotazy na kÃ³dovou zÃ¡kladnu lze pouÅ¾Ãt tlaÄÃtko âAskâ.

KaÅ¾dÃ½ Ãºkol je zpracovÃ¡vÃ¡n nezÃ¡visle v samostatnÃ©m izolovanÃ©m prostÅedÃ, kterÃ© je pÅedem naplnÄno kÃ³dovou zÃ¡kladnou uÅ¾ivatele. Codex mÅ¯Å¾e ÄÃst a upravovat soubory, spouÅ¡tÄt pÅÃkazy vÄetnÄ testÅ¯, lintu a kontroly typÅ¯. UÅ¾ivatel mÅ¯Å¾e sledovat postup v reÃ¡lnÃ©m Äase. DokonÄenÃ Ãºkolu typicky trvÃ¡ mezi 1 a 30 minutami v zÃ¡vislosti na sloÅ¾itosti. Po dokonÄenÃ Ãºkolu Codex provede commit svÃ½ch zmÄn ve svÃ©m prostÅedÃ a poskytne ovÄÅitelnÃ© dÅ¯kazy o svÃ½ch akcÃch prostÅednictvÃm citacÃ terminÃ¡lovÃ½ch logÅ¯ a vÃ½stupÅ¯ testÅ¯.

UÅ¾ivatel pak mÅ¯Å¾e zkontrolovat vÃ½sledky, poÅ¾Ã¡dat o dalÅ¡Ã revize, otevÅÃt GitHub pull request nebo pÅÃmo integrovat zmÄny do svÃ©ho lokÃ¡lnÃho prostÅedÃ.

AGENTS.md soubory

ZajÃmavÃ½m prvkem je moÅ¾nost ÅÃdit Codex pomocÃ AGENTS.md souborÅ¯ umÃstÄnÃ½ch v repozitÃ¡Åi. Tyto textovÃ© soubory, podobnÄ jako README.md, umoÅ¾ÅujÃ informovat Codex o tom, jak se orientovat v kÃ³dovÃ© zÃ¡kladnÄ, jakÃ© pÅÃkazy spouÅ¡tÄt pro testovÃ¡nÃ a jak nejlÃ©pe dodrÅ¾ovat standardnÃ postupy projektu. Podle OpenAI codex-1 vykazuje dobrÃ© vÃ½sledky i bez tÄchto souborÅ¯, ale jejich pÅÃtomnost mÅ¯Å¾e zlepÅ¡it efektivitu prÃ¡ce.

VÃ½konnost a hodnocenÃ

OpenAI poskytla nÄkolik mÄÅÃtek vÃ½konnosti codex-1:

Na benchmarku SWE-Bench Verified dosahuje codex-1 pÅesnosti kolem 70-75%, coÅ¾ je vÃ½znamnÄ vÃce neÅ¾ o3-high (kolem 65-70%) Na internÃch SWE Ãºkolech OpenAI dosahuje codex-1 pÅibliÅ¾nÄ 75% ÃºspÄÅ¡nosti, ve srovnÃ¡nÃ s o4-mini-high (70%), o3-high (67%) a o1-high (11%)

[image error]

BezpeÄnost a zajiÅ¡tÄnÃ dÅ¯vÄryhodnosti

OpenAI zmiÅuje nÄkolik bezpeÄnostnÃch opatÅenÃ implementovanÃ½ch v Codexu. Jde pÅedevÅ¡Ãm o transparentnost, kdy uÅ¾ivatelÃ© mohou verifikovat vÃ½stupy prostÅednictvÃm citacÃ, terminÃ¡lovÃ½ch logÅ¯ a vÃ½sledkÅ¯ testÅ¯. PÅi nejistotÄ nebo selhÃ¡nÃ testÅ¯ agent explicitnÄ komunikuje tyto problÃ©my. Codex operuje v zabezpeÄenÃ©m izolovanÃ©m kontejneru v cloudu a bÄhem provÃ¡dÄnÃ Ãºkolu mÃ¡ zakÃ¡zÃ¡n pÅÃstup k internetu - interaguje pouze s kÃ³dem poskytnutÃ½m pÅes GitHub repozitÃ¡Åe a pÅedinstalovanÃ© zÃ¡vislosti.

PÅesto OpenAI zdÅ¯razÅuje, Å¾e je stÃ¡le nezbytnÃ©, aby uÅ¾ivatelÃ© manuÃ¡lnÄ kontrolovali a validovali veÅ¡kerÃ½ agentem generovanÃ½ kÃ³d pÅed integracÃ a spuÅ¡tÄnÃm.

Prevence zneuÅ¾itÃ

OpenAI uvÃ¡dÃ, Å¾e implementovali opatÅenÃ proti zneuÅ¾itÃ tohoto nÃ¡stroje pro vÃ½voj Å¡kodlivÃ©ho softwaru:

Codex byl trÃ©novÃ¡n k identifikaci a odmÃtnutÃ poÅ¾adavkÅ¯ zamÄÅenÃ½ch na vÃ½voj Å¡kodlivÃ©ho softwaru SouÄasnÄ by mÄl rozliÅ¡ovat a podporovat legitimnÃ Ãºkoly OpenAI zdokonalila svÃ© politiky a zaÄlenila pÅÃsnÃ¡ bezpeÄnostnÃ hodnocenÃ

Jako dodatek k dokumentaci o3 System Card byla publikovÃ¡na aktualizace odrÃ¡Å¾ejÃcÃ tato hodnocenÃ.

BÄÅ¾nÃ© pÅÃpady pouÅ¾itÃ

TechnickÃ© tÃ½my OpenAI jiÅ¾ pouÅ¾ÃvajÃ Codex jako souÄÃ¡st svÃ©ho kaÅ¾dodennÃho pracovnÃho postupu. NejÄastÄji se pouÅ¾ÃvÃ¡ pro refaktorizaci kÃ³du, pÅejmenovÃ¡nÃ promÄnnÃ½ch a funkcÃ, psanÃ testÅ¯, vytvÃ¡ÅenÃ zÃ¡kladÅ¯ novÃ½ch funkcÃ, propojovÃ¡nÃ komponent, opravy chyb a tvorbu dokumentace.

VÃ½vojÃ¡Åi OpenAI si dÃky tomuto nÃ¡stroji vytvÃ¡ÅejÃ novÃ© pracovnÃ nÃ¡vyky jako tÅÃdÄnÃ problÃ©mÅ¯ v pohotovostnÃ sluÅ¾bÄ, plÃ¡novÃ¡nÃ ÃºkolÅ¯ na zaÄÃ¡tku dne a delegace prÃ¡ce na pozadÃ. Mezi externÃ testovacÃ organizace patÅÃ Cisco, Temporal, Superhuman a Kodiak.

[image error]

Aktualizace Codex CLI

SouÄasnÄ s uvedenÃm Codexu OpenAI vydÃ¡vÃ¡ menÅ¡Ã verzi codex-1, kterÃ¡ je verzÃ o4-mini optimalizovanou specificky pro Codex CLI. Tento model podporuje rychlejÅ¡Ã pracovnÃ postupy v CLI a je optimalizovÃ¡n pro dotazy a Ãºpravy kÃ³du s nÃzkou latencÃ.

Model je dostupnÃ½ jako vÃ½chozÃ v Codex CLI a v API jako codex-mini-latest. CenovÄ je nastaven na:

$1.50 za 1M vstupnÃch [[tokenÅ¯](/ai/tokeny-versus-slova/)](/ai/[tokeny](/ai/tokeny-versus-slova/)-versus-slova/) $6 za 1M vÃ½stupnÃch tokenÅ¯ 75% sleva pÅi cachovÃ¡nÃ promptÅ¯OmezenÃ a budoucÃ vÃ½voj

Codex je stÃ¡le v ranÃ© fÃ¡zi vÃ½voje a mÃ¡ nÄkolik omezenÃ. ChybÃ mu moÅ¾nost vstupÅ¯ formou obrÃ¡zkÅ¯ pro frontend prÃ¡ci, nenÃ moÅ¾nÃ© korigovat agenta bÄhem jeho prÃ¡ce a delegovÃ¡nÃ Ãºkolu vzdÃ¡lenÃ©mu agentovi trvÃ¡ dÃ©le neÅ¾ interaktivnÃ Ãºpravy.

OpenAI plÃ¡nuje v budoucnu zavÃ©st interaktivnÄjÅ¡Ã a flexibilnÄjÅ¡Ã pracovnÃ postupy, umoÅ¾nit poskytovÃ¡nÃ pokynÅ¯ v prÅ¯bÄhu Ãºkolu, spolupracovat na strategiÃch implementace a posÃlat proaktivnÃ aktualizace o pokroku. DÃ¡le chce vytvoÅit hlubÅ¡Ã integrace s nÃ¡stroji jako GitHub, Codex CLI, ChatGPT Desktop nebo systÃ©my pro sledovÃ¡nÃ problÃ©mÅ¯ a CI.

TechnickÃ© parametry modelu codex-mini-latest

Codex-mini-latest je doladÄnÃ¡ verze o4-mini specificky urÄenÃ¡ pro pouÅ¾itÃ v Codex CLI:

200K kontextovÃ© okno 100K max vÃ½stupnÃch tokenÅ¯ Podpora âreasoning tokensâNÄco mÃ¡lo osobnÃ zkuÅ¡enosti

ZkuÅ¡enosti jsou zatÃm krÃ¡tkÃ©. ZatÃm se ukazuje, Å¾e Codex dokÃ¡Å¾e dosti spolehlivÄ opravovat chyby, coÅ¾ by mohlo vÃ©st k plnÄ automatizovanÃ©mu procesu oprav a uÅ¡etÅit znaÄnÃ© mnoÅ¾stvÃ Äasu. UÅ¾ivatelskÃ© rozhranÃ je pohodlnÄjÅ¡Ã, neÅ¾ Codex CLI v pÅÃkazovÃ© ÅÃ¡dce, je to o dost intuitivnÄjÅ¡Ã a vÅ¯bec mi nechybÃ pÅehrÅ¡el oken Cursoru. JenÅ¾e Cursor zatÃm takÃ© neodinstalujuâ¦

Codex nenÃ jen pasivnÃ nÃ¡stroj. AktivnÄ se zapojuje do pracovnÃho procesu. UmÃ ÄÃst a upravovat soubory a spouÅ¡tÄt rÅ¯znÃ© pÅÃkazy, vÄetnÄ testovacÃch nÃ¡strojÅ¯, linterÅ¯ a kontroly typÅ¯. Tyto funkce pomÃ¡hajÃ zajistit kvalitu kÃ³du a odhalit potenciÃ¡lnÃ problÃ©my v ranÃ© fÃ¡zi vÃ½voje. TestovacÃ nÃ¡stroj funguje jako kontrola funkÄnosti, lint jako nÃ¡stroj pro hygienu a styl kÃ³du a kontrola typÅ¯ zajiÅ¡Å¥uje sprÃ¡vnÃ© pouÅ¾ÃvÃ¡nÃ promÄnnÃ½ch.

DokonÄenÃ Ãºkolu s pomocÃ Codex obvykle trvÃ¡ od 1 do 30 minut (ano, obÄas je to dlouhÃ½, ÄekÃ¡te zÅejmÄ v nÄjakÃ© frontÄ a viditelnÄ se nic nedÄje!). Pro zajiÅ¡tÄnÃ transparentnosti a dÅ¯vÄryhodnosti poskytuje Codex ovÄÅitelnÃ© dÅ¯kazy o svÃ½ch akcÃch prostÅednictvÃm citacÃ z terminÃ¡lovÃ½ch protokolÅ¯ a vÃ½stupÅ¯ testÅ¯.

Flexibilita je dalÅ¡Ã dÅ¯leÅ¾itou vlastnostÃ Codex. Jeho prostÅedÃ lze do jistÃ© mÃry konfigurovat tak, aby co nejvÃce odpovÃdalo konkrÃ©tnÃmu vÃ½vojovÃ©mu prostÅedÃ uÅ¾ivatele. ChovÃ¡nÃ Codex lze dokonce ÅÃdit pomocÃ speciÃ¡lnÃho souboru agents.md umÃstÄnÃ©ho v ÃºloÅ¾iÅ¡ti kÃ³du.

TestovÃ¡nÃ ukÃ¡zalo, Å¾e Codex 1 dokÃ¡Å¾e pracovat s maximÃ¡lnÃ dÃ©lkou kontextu 192 000 tokenÅ¯ a dÅ¯slednÄ vytvÃ¡ÅÃ ÄistÅ¡Ã patche pÅipravenÃ© k okamÅ¾itÃ© integraci do standardnÃch pracovnÃch postupÅ¯. PÅÃstup Codex k psanÃ kÃ³du spoÄÃvÃ¡ v prÃ¡ci v malÃ½ch, cÃlenÃ½ch dÃ¡vkÃ¡ch, kterÃ© se zamÄÅujÃ na konkrÃ©tnÃ problÃ©my.

V praxi Codex umoÅ¾Åuje vÃ½vojÃ¡ÅÅ¯m efektivnÄ nastavit zÃ¡klady projektu a zamÄÅit se na implementaci aktuÃ¡lnÃch funkcÃ. CelkovÄ nÃ¡stroj mÄnÃ zpÅ¯sob prÃ¡ce vÃ½vojÃ¡ÅÅ¯, umoÅ¾Åuje jim pracovat tÃ©mÄÅ jako by byli svÃ½m vlastnÃm tÃ½mem nebo manaÅ¾erem tÃ½mu, s moÅ¾nostÃ zadÃ¡vat problÃ©my a vracet se k nim po urÄitÃ© dobÄ.

DalÅ¡Ãm zajÃmavÃ½m pouÅ¾itÃm by mohlo bÃ½t automatizovanÃ© opravovÃ¡nÃ issues v gitu, kdy si Codex stÃ¡hne issues, navrhne opravy a odeÅ¡le je zase do GITu, kde ÄekajÃ na kontrolu a merge.

ZÃ¡vÄr

Jak mÃ¡ Codex zapadat k probÃhajÃcÃ akvizici Windsurfu, budou to sobÄÅ¾nÃ© projekty, nebo se spojÃ? Je Codex budoucÃ lÃdr agentickÃ©ho programovÃ¡nÃ nebo jen dalÅ¡Ã âmy takyâ software bez pÅidanÃ© hodnoty? UvidÃmeâ¦ na to zatÃm Å¾Ã¡dnÃ© odpovÄdi nejsou,

Like • 0 comments • flag

Published on May 17, 2025 17:00

No comments have been added yet.

Marigold.cz

Patrick Zandl's profile
93 followers

OpenAI pÅedstavuje Codex - agenta pro vÃ½voj software

Marigold.cz

OpenAI pÅedstavuje Codex - agenta pro vÃ½voj software