Späť na blog
AI nástroje1. mája 202610 min

GPT Image 2: Prvý "agentic" image model od OpenAI (apríl 2026)

OpenAI vydala 21. apríla 2026 GPT Image 2 — prvý image model s O-series reasoning, ktorý generuje obrázky až do 4K rozlíšenia, prijíma 16 referenčných obrázkov a renderuje text v ČN/JP/KR s takmer perfektnou presnosťou. Pozrime sa na schopnosti, ceny a porovnanie s konkurenciou.

GPT Image 2: Prvý "agentic" image model od OpenAI (apríl 2026)

Posledná aktualizácia: máj 2026

OpenAI vydala 21. apríla 2026 nový image model gpt-image-2 (snapshot gpt-image-2-2026-04-21) spolu s consumer rebrandingom ChatGPT Images 2.0. Je to prvý OpenAI image model integrujúci O-series reasoning — pred generovaním obrázku model aktívne plánuje a "premýšľa" o kompozícii. OpenAI to označuje ako prvý agentic image generation model.

Pre marketérov, dizajnérov a developerov to znamená výrazný posun v kvalite generovaných vizuálov — najmä pri textoch v obrázku, presných ikonografii a viacjazyčných kompozíciách. V tomto článku rozoberieme, čo presne GPT Image 2 mení, koľko stojí a kedy ho vyberať namiesto konkurencie.

Čo je GPT Image 2

GPT Image 2 je multimodálny generatívny model od OpenAI, ktorý generuje a edituje obrázky na základe textových promptov a referenčných obrázkov. Hlavná architektonická zmena oproti predchodcovi (gpt-image-1) je integrácia reasoning vrstvy z O-series modelov — model si pred generovaním rozmyslí kompozíciu, štruktúru a detaily, namiesto toho, aby len "vykreslil" prompt v jednom kroku.

Podľa recenzie TechCrunch je toto reasoning vidieť najmä pri úlohách, kde tradičné image modely zlyhávajú: malý čitateľný text, ikonografia, hustá kompozícia, jemné štýlové obmedzenia. Model dodržuje detailné inštrukcie podstatne lepšie než predchodcovia.

Kľúčové schopnosti

Funkcia Detail
RozlíšenieGenerovanie a editovanie v 1K, 2K aj 4K
Reference imagesAž 16 referenčných obrázkov v jednom prompte
Multilingválny textRenderuje text vrátane CN, JP, KR s takmer perfektnou presnosťou
ReasoningO-series chain-of-thought pred generovaním (planning fáza)
Edit fidelityVždy spracováva referencie v high fidelity (väčšia presnosť, vyššia cena)
KontextZachováva detaily medzi vstupom a výstupom (napr. tvár, logo, produkt)
Quality tiersLow / Medium / High — výrazný rozdiel v cene aj kvalite

Čo to znamená v praxi

  • Marketingové kreatívy: bannery so správnym textom, sloganmi a logom — bez post-produkcie v Photoshope.
  • Produktové vizuály: mockupy s reálnym produktom (cez referenčný obrázok) v rôznych prostrediach.
  • Lokalizácia: jeden prompt vygeneruje obrázok s textom v 5 jazykoch — vrátane ázijských.
  • UI mockupy: wireframy a vizualizácie aplikácií s čitateľnými labelmi a ikonami.

Ako sa líši od DALL-E 3 a gpt-image-1

Vlastnosť DALL-E 3 gpt-image-1 gpt-image-2
Reasoning pre generovanieNieNieÁno (O-series)
Maximálne rozlíšenie1024×10241024×15364K
Reference images01Až 16
Renderovanie textuSlabéDobré (EN)Výborné (vr. CN/JP/KR)
API endpointv1/images/generationsv1/images/generationsv1/images/generations
Edit/inpaintÁnoÁnoÁno + multi-reference
StatusLegacyStabilnýNajnovší

Prístup a cena

OpenAI sprístupnila GPT Image 2 v dvoch režimoch: cez ChatGPT (consumer) a cez API (developer).

ChatGPT Images 2.0 (consumer)

  • Free tier: obmedzený počet generovaní za deň, štandardná kvalita
  • Plus / Pro / Codex: vyššie kvóty, prístup k pokročilým výstupom (4K, 16 referencií)
  • Dostupné vo webovom rozhraní ChatGPT a v mobilnej aplikácii

API ceny (token-based)

Podľa analýzy WaveSpeedAI sú API ceny štruktúrované per-token, nie per-image:

PoložkaCena (USD per million tokens)
Image input tokens$8,00
Image input tokens (cached)$2,00
Image output tokens$30,00
Text input tokens$5,00

Praktické odhadované náklady na obrázok 1024×1024 (z OpenAI kalkulačky):

  • Low quality: ~$0,006
  • Medium quality: ~$0,053
  • High quality: ~$0,211

Rozdiel low → high je 35-násobný. Edit operácie (s referenciami) bežia 2–3× drahšie ako baseline generovanie, pretože model spracováva referenčné obrázky vždy v high fidelity.

Model je dostupný aj cez Microsoft Azure Foundry a tretie strany ako fal.ai.

API príklad: zavolanie cez OpenAI SDK

Python (oficiálne openai SDK):

from openai import OpenAI

client = OpenAI()

result = client.images.generate(
    model="gpt-image-2",
    prompt="A clean dashboard for AI visibility tracking, dark mode, "
           "showing visibility score, share of voice and a line chart. "
           "Title: 'Optimalizácia pre AI'. Photorealistic.",
    size="1024x1024",
    quality="medium",
    n=1,
)

print(result.data[0].url)

cURL ekvivalent:

curl https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "Modern SaaS landing page hero image, isometric style.",
    "size": "1024x1024",
    "quality": "high"
  }'

Editovanie s viacerými referenciami

result = client.images.edit(
    model="gpt-image-2",
    image=[
        open("logo.png", "rb"),
        open("product.png", "rb"),
        open("background.png", "rb"),
    ],
    prompt="Compose a product banner: logo top-left, product centered "
           "on the provided background. Add tagline 'Optimalizujte pre AI'.",
    size="2048x1024",
    quality="high",
)

Generujete content pre AI éru?

Skontrolujte, či vás AI vyhľadávače skutočne citujú. Optimalizácia pre AI sleduje vašu viditeľnosť v ChatGPT, Perplexity a Google AIO.

Vyskúšať zadarmo →

Use-cases pre marketing a SEO

1. Cover obrázky pre blog (a GEO benefit)

AI Overviews v Google a ChatGPT search čoraz častejšie zobrazujú aj obrázky zo zdrojových stránok. Kvalitný cover image s relevantným textom a brand prvkami zvyšuje CTR z AI Overviews. GPT Image 2 dokáže vygenerovať obrázok s vaším názvom článku, dátumom a kategóriou priamo v kompozícii — bez post-produkcie.

2. Social media posty s konzistentným brandingom

16 reference images umožňuje "naliať" do modelu logo, fonty, paletu farieb a predchádzajúce posty. Model potom generuje nový post v rovnakom vizuálnom štýle. To je veľký posun oproti DALL-E 3, kde brandová konzistencia bola ručná práca.

3. Produktové mockupy a iterácie

Pre e-commerce: vyfoťte produkt, dajte ho do GPT Image 2 ako referenciu a generujte ho v rôznych prostrediach (na pláži, v interiéri, na stole). Pre SaaS: vygenerujte rôzne varianty hero sekcie, A/B testujte cez Vercel preview deploys.

4. Lokalizácia kreatívy

Multilingválna podpora textu v obrázkoch je game-changer pre medzinárodné kampane. Jeden prompt môže vygenerovať banner so sloganom v 5 jazykoch (vrátane CJK) — bez nutnosti vytvárať šablónu pre každý jazyk osobitne.

Limity a obmedzenia

  • Content policy: blokuje generovanie skutočných osôb (politici, celebrity), explicitný obsah, násilie. Pre brand mascotky a fiktívne postavy zvyčajne funguje.
  • Watermarking: všetky výstupy obsahujú C2PA metadáta identifikujúce model. Vizuálny watermark nie je default, ale je opcia v API.
  • Latencia: high quality 4K obrázok generuje 15–40 sekúnd. Pre real-time UI to môže byť problém — zvážte fallback na medium pre prvý zobrazenie.
  • Edit cost spike: každá iterácia s referenčnými obrázkami stojí 2–3× viac ako baseline. Pre A/B testing kompozícií si pripravte rozpočet.
  • Subjektívne štýly: "ako Wes Anderson" alebo "vo štýle Studio Ghibli" funguje obmedzene a podlieha content policy.

GPT Image 2 vs. konkurencia

Model Silné stránky Slabé stránky Cena 1024×1024 (medium)
GPT Image 2 Reasoning, multilingválny text, 16 referencií, 4K Drahší pri editoch, latencia high quality ~$0,053
Midjourney v7 Estetická kvalita, štýly, komunita Subscription only, žiadne API, slabší text ~$0,04 (v rámci predplatného)
Imagen 4 (Google) Photorealizmus, integrácia s Vertex AI Menej štýlov, menej referencií ~$0,04
Flux Pro 1.1 Open weights varianty, rýchlosť Slabší prompt adherence ~$0,055

Praktické odporúčanie: GPT Image 2 vyberte, keď potrebujete text v obrázku, viacero referencií alebo multilingválne kreatívy. Midjourney stále vedie pre artistic kreatívy. Imagen 4 je najlepšia voľba, ak ste hlboko v Google ekosystéme. Flux pre rýchle prototypovanie a self-hosted scenáre.

Záver: rok 2026 ako bod obratu pre image generation

Reasoning v image modeloch je najväčšia architektonická zmena od príchodu diffusion modelov. GPT Image 2 demonštruje, že aj generovanie obrázkov má prospech z plánovacieho kroku — výsledky sú citeľne lepšie pri hustých kompozíciách, textoch a multireferenčných úlohách.

Pre marketérov a developerov je to dôvod prehodnotiť creative workflow. Pre SEO a GEO špecialistov je to pripomienka, že obrázky sú stále podceňovaný zdroj viditeľnosti — Google AI Overviews, Perplexity aj ChatGPT search ich zobrazujú a zvyšujú click-through. Pozrite si náš návod na GEO optimalizáciu, kde rozoberáme, ako z toho vyťažiť maximum.


Často kladené otázky (FAQ)

Koľko stojí GPT Image 2 cez API?

API je token-based: $8/M image input tokens, $30/M image output tokens. Praktické náklady na obrázok 1024×1024: low quality ~$0,006, medium ~$0,053, high ~$0,211. Editácia s referenciami beží 2–3× drahšie ako baseline generovanie. Detaily v oficiálnej cenovej dokumentácii OpenAI.

Funguje GPT Image 2 vo free tier ChatGPT?

Áno, ale s nižšími limitmi a štandardnou kvalitou. Pokročilé výstupy (4K rozlíšenie, viacero referencií, vysoká kvalita) sú vyhradené pre Plus, Pro a Codex predplatiteľov. Free tier je dobrý na vyskúšanie schopností; pre produktívne použitie odporúčame Plus alebo API.

Môžem komerčne použiť výstupy z GPT Image 2?

Áno. OpenAI v Usage Policies potvrdzuje, že používateľ vlastní výstup a môže ho komerčne použiť — pri dodržaní content policy. Všetky obrázky obsahujú C2PA metadáta o pôvode, ktoré je odporúčané zachovať pre transparentnosť.

Aký je rozdiel medzi gpt-image-2 a Sora 2?

gpt-image-2 generuje statické obrázky. Sora 2 (a novšie) je video model — generuje krátke video sekvencie. Architektonicky zdieľajú niektoré reasoning komponenty, ale použitie je iné: image pre statické vizuály (bannery, mockupy, sociálne posty), Sora pre dynamický obsah (reels, ads, short-form video).

Môžem GPT Image 2 self-hostnúť?

Nie. Model je proprietárny a dostupný len cez OpenAI API alebo Azure Foundry. Pre self-hosted alternatívu zvážte Flux Pro 1.1 (open weights pre menšie varianty), Stable Diffusion XL alebo Stable Diffusion 3.5 Large. Tieto však nemajú reasoning vrstvu a horšie pracujú s textom v obrázku.

Optimalizujte vizuály pre AI vyhľadávače

Cover obrázky a screenshoty sú podceňovaný GEO faktor. Sledujte, či vás AI cituje aj cez vizuálny obsah — vyskúšajte Optimalizáciu pre AI zadarmo.

Začať zadarmo →
I

Ing. Lukáš Szudár

Tím Optimalizácia pre AI pomáha firmám zvyšovať viditeľnosť v AI vyhľadávačoch. Monitorujeme Perplexity, ChatGPT, Google AIO, Gemini a Claude pre desiatky domén.

Zdieľať článok

Sledujte, ako AI vyhľadávače citujú váš web

Vyskúšajte Optimalizáciu pre AI zadarmo