GPT Image 2: Prvý "agentic" image model od OpenAI (apríl 2026)
OpenAI vydala 21. apríla 2026 GPT Image 2 — prvý image model s O-series reasoning, ktorý generuje obrázky až do 4K rozlíšenia, prijíma 16 referenčných obrázkov a renderuje text v ČN/JP/KR s takmer perfektnou presnosťou. Pozrime sa na schopnosti, ceny a porovnanie s konkurenciou.
Posledná aktualizácia: máj 2026
OpenAI vydala 21. apríla 2026 nový image model gpt-image-2 (snapshot
gpt-image-2-2026-04-21) spolu s consumer rebrandingom ChatGPT Images 2.0. Je to prvý OpenAI image model integrujúci O-series reasoning — pred generovaním obrázku model aktívne plánuje a "premýšľa" o kompozícii. OpenAI to označuje ako prvý agentic image generation model.
Pre marketérov, dizajnérov a developerov to znamená výrazný posun v kvalite generovaných vizuálov — najmä pri textoch v obrázku, presných ikonografii a viacjazyčných kompozíciách. V tomto článku rozoberieme, čo presne GPT Image 2 mení, koľko stojí a kedy ho vyberať namiesto konkurencie.
Čo je GPT Image 2
GPT Image 2 je multimodálny generatívny model od OpenAI, ktorý generuje a edituje obrázky na základe textových promptov a referenčných obrázkov. Hlavná architektonická zmena oproti predchodcovi (gpt-image-1) je integrácia reasoning vrstvy z O-series modelov — model si pred generovaním rozmyslí kompozíciu, štruktúru a detaily, namiesto toho, aby len "vykreslil" prompt v jednom kroku.
Podľa recenzie TechCrunch je toto reasoning vidieť najmä pri úlohách, kde tradičné image modely zlyhávajú: malý čitateľný text, ikonografia, hustá kompozícia, jemné štýlové obmedzenia. Model dodržuje detailné inštrukcie podstatne lepšie než predchodcovia.
Kľúčové schopnosti
| Funkcia | Detail |
|---|---|
| Rozlíšenie | Generovanie a editovanie v 1K, 2K aj 4K |
| Reference images | Až 16 referenčných obrázkov v jednom prompte |
| Multilingválny text | Renderuje text vrátane CN, JP, KR s takmer perfektnou presnosťou |
| Reasoning | O-series chain-of-thought pred generovaním (planning fáza) |
| Edit fidelity | Vždy spracováva referencie v high fidelity (väčšia presnosť, vyššia cena) |
| Kontext | Zachováva detaily medzi vstupom a výstupom (napr. tvár, logo, produkt) |
| Quality tiers | Low / Medium / High — výrazný rozdiel v cene aj kvalite |
Čo to znamená v praxi
- Marketingové kreatívy: bannery so správnym textom, sloganmi a logom — bez post-produkcie v Photoshope.
- Produktové vizuály: mockupy s reálnym produktom (cez referenčný obrázok) v rôznych prostrediach.
- Lokalizácia: jeden prompt vygeneruje obrázok s textom v 5 jazykoch — vrátane ázijských.
- UI mockupy: wireframy a vizualizácie aplikácií s čitateľnými labelmi a ikonami.
Ako sa líši od DALL-E 3 a gpt-image-1
| Vlastnosť | DALL-E 3 | gpt-image-1 | gpt-image-2 |
|---|---|---|---|
| Reasoning pre generovanie | Nie | Nie | Áno (O-series) |
| Maximálne rozlíšenie | 1024×1024 | 1024×1536 | 4K |
| Reference images | 0 | 1 | Až 16 |
| Renderovanie textu | Slabé | Dobré (EN) | Výborné (vr. CN/JP/KR) |
| API endpoint | v1/images/generations | v1/images/generations | v1/images/generations |
| Edit/inpaint | Áno | Áno | Áno + multi-reference |
| Status | Legacy | Stabilný | Najnovší |
Prístup a cena
OpenAI sprístupnila GPT Image 2 v dvoch režimoch: cez ChatGPT (consumer) a cez API (developer).
ChatGPT Images 2.0 (consumer)
- Free tier: obmedzený počet generovaní za deň, štandardná kvalita
- Plus / Pro / Codex: vyššie kvóty, prístup k pokročilým výstupom (4K, 16 referencií)
- Dostupné vo webovom rozhraní ChatGPT a v mobilnej aplikácii
API ceny (token-based)
Podľa analýzy WaveSpeedAI sú API ceny štruktúrované per-token, nie per-image:
| Položka | Cena (USD per million tokens) |
|---|---|
| Image input tokens | $8,00 |
| Image input tokens (cached) | $2,00 |
| Image output tokens | $30,00 |
| Text input tokens | $5,00 |
Praktické odhadované náklady na obrázok 1024×1024 (z OpenAI kalkulačky):
- Low quality: ~$0,006
- Medium quality: ~$0,053
- High quality: ~$0,211
Rozdiel low → high je 35-násobný. Edit operácie (s referenciami) bežia 2–3× drahšie ako baseline generovanie, pretože model spracováva referenčné obrázky vždy v high fidelity.
Model je dostupný aj cez Microsoft Azure Foundry a tretie strany ako fal.ai.
API príklad: zavolanie cez OpenAI SDK
Python (oficiálne openai SDK):
from openai import OpenAI
client = OpenAI()
result = client.images.generate(
model="gpt-image-2",
prompt="A clean dashboard for AI visibility tracking, dark mode, "
"showing visibility score, share of voice and a line chart. "
"Title: 'Optimalizácia pre AI'. Photorealistic.",
size="1024x1024",
quality="medium",
n=1,
)
print(result.data[0].url)
cURL ekvivalent:
curl https://api.openai.com/v1/images/generations \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "Modern SaaS landing page hero image, isometric style.",
"size": "1024x1024",
"quality": "high"
}'
Editovanie s viacerými referenciami
result = client.images.edit(
model="gpt-image-2",
image=[
open("logo.png", "rb"),
open("product.png", "rb"),
open("background.png", "rb"),
],
prompt="Compose a product banner: logo top-left, product centered "
"on the provided background. Add tagline 'Optimalizujte pre AI'.",
size="2048x1024",
quality="high",
)
Generujete content pre AI éru?
Skontrolujte, či vás AI vyhľadávače skutočne citujú. Optimalizácia pre AI sleduje vašu viditeľnosť v ChatGPT, Perplexity a Google AIO.
Vyskúšať zadarmo →Use-cases pre marketing a SEO
1. Cover obrázky pre blog (a GEO benefit)
AI Overviews v Google a ChatGPT search čoraz častejšie zobrazujú aj obrázky zo zdrojových stránok. Kvalitný cover image s relevantným textom a brand prvkami zvyšuje CTR z AI Overviews. GPT Image 2 dokáže vygenerovať obrázok s vaším názvom článku, dátumom a kategóriou priamo v kompozícii — bez post-produkcie.
2. Social media posty s konzistentným brandingom
16 reference images umožňuje "naliať" do modelu logo, fonty, paletu farieb a predchádzajúce posty. Model potom generuje nový post v rovnakom vizuálnom štýle. To je veľký posun oproti DALL-E 3, kde brandová konzistencia bola ručná práca.
3. Produktové mockupy a iterácie
Pre e-commerce: vyfoťte produkt, dajte ho do GPT Image 2 ako referenciu a generujte ho v rôznych prostrediach (na pláži, v interiéri, na stole). Pre SaaS: vygenerujte rôzne varianty hero sekcie, A/B testujte cez Vercel preview deploys.
4. Lokalizácia kreatívy
Multilingválna podpora textu v obrázkoch je game-changer pre medzinárodné kampane. Jeden prompt môže vygenerovať banner so sloganom v 5 jazykoch (vrátane CJK) — bez nutnosti vytvárať šablónu pre každý jazyk osobitne.
Limity a obmedzenia
- Content policy: blokuje generovanie skutočných osôb (politici, celebrity), explicitný obsah, násilie. Pre brand mascotky a fiktívne postavy zvyčajne funguje.
- Watermarking: všetky výstupy obsahujú C2PA metadáta identifikujúce model. Vizuálny watermark nie je default, ale je opcia v API.
- Latencia: high quality 4K obrázok generuje 15–40 sekúnd. Pre real-time UI to môže byť problém — zvážte fallback na medium pre prvý zobrazenie.
- Edit cost spike: každá iterácia s referenčnými obrázkami stojí 2–3× viac ako baseline. Pre A/B testing kompozícií si pripravte rozpočet.
- Subjektívne štýly: "ako Wes Anderson" alebo "vo štýle Studio Ghibli" funguje obmedzene a podlieha content policy.
GPT Image 2 vs. konkurencia
| Model | Silné stránky | Slabé stránky | Cena 1024×1024 (medium) |
|---|---|---|---|
| GPT Image 2 | Reasoning, multilingválny text, 16 referencií, 4K | Drahší pri editoch, latencia high quality | ~$0,053 |
| Midjourney v7 | Estetická kvalita, štýly, komunita | Subscription only, žiadne API, slabší text | ~$0,04 (v rámci predplatného) |
| Imagen 4 (Google) | Photorealizmus, integrácia s Vertex AI | Menej štýlov, menej referencií | ~$0,04 |
| Flux Pro 1.1 | Open weights varianty, rýchlosť | Slabší prompt adherence | ~$0,055 |
Praktické odporúčanie: GPT Image 2 vyberte, keď potrebujete text v obrázku, viacero referencií alebo multilingválne kreatívy. Midjourney stále vedie pre artistic kreatívy. Imagen 4 je najlepšia voľba, ak ste hlboko v Google ekosystéme. Flux pre rýchle prototypovanie a self-hosted scenáre.
Záver: rok 2026 ako bod obratu pre image generation
Reasoning v image modeloch je najväčšia architektonická zmena od príchodu diffusion modelov. GPT Image 2 demonštruje, že aj generovanie obrázkov má prospech z plánovacieho kroku — výsledky sú citeľne lepšie pri hustých kompozíciách, textoch a multireferenčných úlohách.
Pre marketérov a developerov je to dôvod prehodnotiť creative workflow. Pre SEO a GEO špecialistov je to pripomienka, že obrázky sú stále podceňovaný zdroj viditeľnosti — Google AI Overviews, Perplexity aj ChatGPT search ich zobrazujú a zvyšujú click-through. Pozrite si náš návod na GEO optimalizáciu, kde rozoberáme, ako z toho vyťažiť maximum.
Často kladené otázky (FAQ)
Koľko stojí GPT Image 2 cez API?
API je token-based: $8/M image input tokens, $30/M image output tokens. Praktické náklady na obrázok 1024×1024: low quality ~$0,006, medium ~$0,053, high ~$0,211. Editácia s referenciami beží 2–3× drahšie ako baseline generovanie. Detaily v oficiálnej cenovej dokumentácii OpenAI.
Funguje GPT Image 2 vo free tier ChatGPT?
Áno, ale s nižšími limitmi a štandardnou kvalitou. Pokročilé výstupy (4K rozlíšenie, viacero referencií, vysoká kvalita) sú vyhradené pre Plus, Pro a Codex predplatiteľov. Free tier je dobrý na vyskúšanie schopností; pre produktívne použitie odporúčame Plus alebo API.
Môžem komerčne použiť výstupy z GPT Image 2?
Áno. OpenAI v Usage Policies potvrdzuje, že používateľ vlastní výstup a môže ho komerčne použiť — pri dodržaní content policy. Všetky obrázky obsahujú C2PA metadáta o pôvode, ktoré je odporúčané zachovať pre transparentnosť.
Aký je rozdiel medzi gpt-image-2 a Sora 2?
gpt-image-2 generuje statické obrázky. Sora 2 (a novšie) je video model — generuje krátke video sekvencie. Architektonicky zdieľajú niektoré reasoning komponenty, ale použitie je iné: image pre statické vizuály (bannery, mockupy, sociálne posty), Sora pre dynamický obsah (reels, ads, short-form video).
Môžem GPT Image 2 self-hostnúť?
Nie. Model je proprietárny a dostupný len cez OpenAI API alebo Azure Foundry. Pre self-hosted alternatívu zvážte Flux Pro 1.1 (open weights pre menšie varianty), Stable Diffusion XL alebo Stable Diffusion 3.5 Large. Tieto však nemajú reasoning vrstvu a horšie pracujú s textom v obrázku.
Optimalizujte vizuály pre AI vyhľadávače
Cover obrázky a screenshoty sú podceňovaný GEO faktor. Sledujte, či vás AI cituje aj cez vizuálny obsah — vyskúšajte Optimalizáciu pre AI zadarmo.
Začať zadarmo →Odporúčame prečítať
Ing. Lukáš Szudár
Tím Optimalizácia pre AI pomáha firmám zvyšovať viditeľnosť v AI vyhľadávačoch. Monitorujeme Perplexity, ChatGPT, Google AIO, Gemini a Claude pre desiatky domén.
Sledujte, ako AI vyhľadávače citujú váš web
Vyskúšajte Optimalizáciu pre AI zadarmo