Come creare personaggi coerenti con GPT Image 2 (Non più volti che si deformano)

Se hai mai provato a generare un fumetto o un libro per bambini con l'IA, conosci la frustrazione. Ottieni l'eroe perfetto nella prima vignetta. Poi nella seconda vignetta, il suo naso cambia forma. Nella terza vignetta, la sua giacca passa dal blu al viola. E nella quarta vignetta, ha un dito in più e un taglio di capelli completamente diverso.

Questo è chiamato «deriva del personaggio AI». E fino all'aprile 2026, era solo qualcosa che abbiamo tollerato.

Poi OpenAI ha rilasciato GPT Image 2 (l'esatta snapshot del modello è gpt-image-2-2026-04-21). Per la prima volta, un generatore di immagini di fascia mainstream capisce veramente cosa significa "lo stesso personaggio". Non perfettamente – no, devi ancora seguire alcune regole. Ma abbastanza bene che ora puoi creare un fumetto di 20 pagine o un storyboard animato breve senza voler buttare il tuo portatile fuori dalla finestra.

Ho passato le ultime sei settimane testando la coerenza dei personaggi su GPT Image 2, principalmente tramite Elser.ai Perché la loro interfaccia mi permette di caricare immagini di riferimento e generare 8 variazioni in batch in una sola volta. Ecco esattamente cosa funziona, cosa non funziona e come puoi bloccare un personaggio tra dozzine di generazioni.

Perché GPT Image 2 è diverso (Il motivo tecnico)

I modelli precedenti (DALL-E 3, Midjourney V6, SDXL) hanno trattato ogni prompt come una creazione completamente nuova. Non avevano memoria. Potevi scrivere "la stessa donna di prima" e loro avrebbero solo indovinato. A volte funzionava, per lo più no.

GPT Image 2 introduce un livello di ragionamento. Prima di generare i pixel, il modello "pianifica" la composizione, l'illuminazione e – in modo cruciale – l'identità visiva del personaggio. Quando fornisci un'immagine di riferimento (ne parleremo di più sotto), GPT Image 2 estrae effettivamente una "firma del personaggio" latente. Non è una LoRA completa, ma è vicina.

OpenAI stessa non lo chiama “consistenza dei personaggi” nella sua documentazione – lo chiama “generazione basata su riferimento”. Ma l'effetto è ovvio: forniscile una buona immagine frontale del tuo personaggio, e manterrà la forma del viso, il colore degli occhi, lo stile dei capelli e i dettagli dei vestiti del personaggio stabili tra nuove pose e sfondi.

Ho visto che mantiene la coerenza tra 8 immagini in un singolo lotto. È incredibile.

Metodo 1: Il flusso di lavoro dell'immagine Seed (Più semplice, Ideale per 2-5 immagini)

Questo è il modo più veloce per iniziare. Nessuna configurazione complessa. Solo tu, GPT Image 2 e una buona immagine di riferimento.

Passaggio 1 – Crea un “Scheda Personaggio” Seme

Genera un'unica immagine di alta qualità del tuo personaggio in una posa neutra. Frontale, illuminazione buona, corpo intero o almeno dalla vita in su. Includi i dettagli dei vestiti.

Prompt di esempio che ho usato la settimana scorsa:

“Ripresa frontale del corpo intero di un giovane personaggio fantasy ladro. Capelli corti e disordinati marroni, occhi verdi, una piccola cicatrice sulla guancia sinistra. Indossa una tunica in pelle verde scuro, guanti senza dita e un ciondolo d'argento a forma di lupo. Sfondo grigio neutro, illuminazione morbida e uniforme, alta risoluzione.”

Passo 2 – Carica come riferimento

In uno strumento che supporta la funzione di riferimento di GPT Image 2 (Elser.ai Fa, anche l'interfaccia di ChatGPT Plus se utilizzi la modalità “DALL-E in ChatGPT”), carica quell'immagine seed come riferimento.

Passaggio 3 – Scrivi un nuovo prompt di azione

Ora chiedi una nuova posa, mantenendo lo stesso personaggio. Esempio:

“Usando l'immagine allegata come riferimento per il personaggio, genera lo stesso personaggio fuorilegge mentre corre attraverso una foresta di notte, con un pugnale in mano, un'espressione spaventata e un'angolazione dinamica.”

Risultato: Il viso rimane lo stesso. La tunica verde rimane. L'ciondolo a forma di lupo rimane. La cicatrice c'è ancora. Ma adesso sta correndo.

Limitazione: Dopo circa 4-5 variazioni, potresti notare piccole deviazioni: la ciondola passa dall'argento alla stagna, oppure i capelli diventano leggermente più lunghi. Per risolvere questo, rigenera un nuovo “ancora” dal tuo miglior risultato e ripeti.

Metodo 2: Il Prompt a più riprese (Per 8 immagini coerenti in una sola volta)

Questo è dove GPT Image 2 fa impallidire tutti gli altri. Puoi chiedergli di generare fino a 8 immagini dello stesso personaggio in pose diverse con un solo prompt. Non è necessario caricare un'immagine di riferimento se descrivi bene il personaggio.

Prompt di esempio che funziona sorprendentemente bene:

“Genera 8 immagini diverse dello stesso personaggio: un'elfa arciera con capelli trecciati biondi platino, occhi verdi smeraldo, che indossa un'armatura in pelle borchiata e una corta mantellina verde. Mostrala in queste 8 pose: 1) che disegna una freccia, 2) che mira a un bersaglio, 3) che corre attraverso una foresta, 4) inginocchiata e nascosta dietro un albero, 5) che beve da una borraccia, 6) che arrampica su un muro roccioso, 7) che dorme appoggiata a un albero, 8) che sorride e saluta. Mantieni il suo viso, i capelli, l'armatura e la mantellina identiche in tutte le immagini. Illuminazione coerente: luce della foresta in ora d'oro.”

GPT Image 2 genererà una griglia 2×4 o 4×2 (a seconda del rapporto d'aspetto) con tutte e otto le immagini. E – questa è la magia – il personaggio sembra effettivamente la stessa persona in tutti e otto i riquadri.

Ho testato questo cinque volte. Le prime quattro prove sono state quasi impeccabili. La quinta prova ha mostrato un'immagine in cui la mantella è diventata marrone scuro. Si tratta di un tasso di coerenza dell'87,5%. Per l'IA, questo è rivoluzionario.

Metodo 3: Blocco di stile LoRA-Lite (Avanzato)

Per progetti seri (una graphic novel di 50 pagine, un avatar di YouTube coerente, una mascotte di marca), vuoi qualcosa di più di una sola immagine di riferimento. Vuoi un blocco di stile.

GPT Image 2 non supporta ufficialmente il fine-tuning o le LoRAs. Ma chi sa sfruttare al meglio i prompt ha trovato un workaround: il "blocco di descrizione del personaggio".

Scrivi un blocco di 4-5 frasi che descriva il tuo personaggio in modo estremamente dettagliato. Poi incolla questo blocco esatto all’inizio di ogni prompt. Nessuna modifica.

Blocco di esempio (lo conservo salvato in un file di testo):

[CHARACTER: Kaelen, maschio, 25 anni. Capelli corti, disordinati di colore marrone scuro, occhi grigio-blu, piccola cicatrice sopra la sopracciglia destra. Carnagione olivacea. Indossa una giacca di pelle marrone usurata sopra una felpa con cappuccio grigia, jeans scuri e stivali da combattimento neri. Ha sempre un anello d'argento al pollice sinistro. Altezza 5‘10", corporatura magra. L'espressione è di solito seria ma sa sorridere.]

Poi, per ogni nuovo prompt, scrivi:

[CHARACTER BLOCK] ora genera Kaelen seduto su un treno della metropolitana con l'aspetto stanco, dietro di lui una finestra piovosa, illuminazione cinematografica cupa.

GPT Image 2 tratta quel blocco come un'istruzione di peso elevato. Poiché il modello ha una finestra di contesto di 128k token (sì, 128k – è enorme), ricorda perfettamente il blocco. Ho eseguito 30+ generazioni con lo stesso blocco e ho avuto una coerenza di circa l'85-90%.

Test nel mondo reale: Una pagina di fumetto a 12 pannelli

Per davvero mantenere la coerenza, ho creato un fumetto a 12 pannelli (3 righe, 4 colonne) su un robot di consegna che si perde in città. Ho usato il metodo del blocco del personaggio per il robot (descrivendone la forma, i colori, il pattern degli occhi LED e i graffi).

Il prompt:

«Genera una griglia di fumetti 3x4 (12 pannelli) che mostri lo stesso personaggio di robot di consegna. Pannello 1: Il robot lascia il magazzino. Pannello 2: Legge l'indirizzo sbagliato. Pannello 3: Gira nella strada sbagliata. Pannello 4: Rimane bloccato dietro una sfilata. Pannello 5: Prova a aggirare la sfilata. Pannello 6: Entra in un vicolo. Pannello 7: Incontra un gatto. Pannello 8: Il gatto si siede sulla testa del robot. Pannello 9: Il robot è confuso. Pannello 10: Il robot trova l'indirizzo corretto. Pannello 11: Consegna il pacco. Pannello 12: Il robot fa un bip felice. Mantieni il design del robot identico in ogni pannello – corpo di scatola bianco, schermo LED blu con ':)', un'antenna piegata, piccole ruote.»

Il risultato? 11 dei 12 pannelli avevano la progettazione del robot esattamente identica. Solo il pannello 7 (quello del gatto) ha modificato leggermente l'angolo dell'antenna. Si tratta di una coerenza del 91,7%.

Sarebbe stato impossibile con qualsiasi altro modello nel 2025 o all'inizio del 2026.

Dove fare realmente questo senza una laurea in informatica

Non devi configurare un nodo ComfyUI né lottare con Python. Il modo più semplice per generare personaggi coerenti con GPT Image 2 adesso (giugno 2026) è Elser.ai.

Ecco perché lo uso per il lavoro sui personaggi:

- Il caricamento di riferimento è drag-and-drop. Nessuna impostazione nascosta.

- Generazione batch fino a 8 immagini – perfetta per il metodo multi-colpo.

- I modelli di prompt mi permettono di salvare il mio blocco del personaggio una sola volta e riutilizzarlo in 100 generazioni.

- Modalità confronto – genera lo stesso prompt con GPT Image 2, Flux e Nano Banana 2 uno accanto all'altro per vedere quale mantiene la coerenza al meglio.

- Nessun limite di velocità per i piani a pagamento. Ho generato 400 immagini in una sola sessione provando il personaggio ladro – senza rallentamenti.

Elser ha appena integrato l'istantanea GPT Image 2 di aprile 2026 due settimane fa. Hanno anche aggiunto un interruttore "Character Lock" che inserisce automaticamente la tua immagine di riferimento in ogni generazione senza riscrivere i prompt. È ancora in beta ma funziona.

You can sign up for free (first 50 credits no credit card) at https://www.elser.ai/. That’s enough to test all three methods I just showed you.

Conclusione finale: Dovresti usare GPT Image 2 per personaggi coerenti?

Sì, assolutamente. Se stai creando fumetti, storyboard, asset di marca o qualsiasi progetto che richieda la stessa persona in più immagini, GPT Image 2 è attualmente il modello migliore disponibile a giugno 2026. Midjourney V8 si discosta ancora. Flux è vicino ma più lento. Nano Banana 2 non dà priorità alla coerenza.

GPT Image 2 non è perfetto: dovrai comunque rigenerare 1 su 10 immagini. Ma si tratta di un tasso di successo del 90%, che è sufficiente per un lavoro di produzione reale.

Prova i tre metodi sopra. Inizia con il metodo dell'immagine seed, poi passa ai prompt multi-shot. E se trovi un blocco di personaggio che funziona a meraviglia, salvalo — è la tua mina d'oro.

Come creare personaggi coerenti con GPT Image 2 (Non più volti che si deformano)

Perché GPT Image 2 è diverso (Il motivo tecnico)

Metodo 1: Il flusso di lavoro dell'immagine Seed (Più semplice, Ideale per 2-5 immagini)

Passaggio 1 – Crea un “Scheda Personaggio” Seme

Passo 2 – Carica come riferimento

Passaggio 3 – Scrivi un nuovo prompt di azione

Metodo 2: Il Prompt a più riprese (Per 8 immagini coerenti in una sola volta)

Metodo 3: Blocco di stile LoRA-Lite (Avanzato)

Test nel mondo reale: Una pagina di fumetto a 12 pannelli

Dove fare realmente questo senza una laurea in informatica

Conclusione finale: Dovresti usare GPT Image 2 per personaggi coerenti?

Ultimi articoli

Migliori strumenti di generazione di anime AI per i creatori di TikTok: trasforma i tuoi OCs di anime in video corti virali nel 2026

Come convertire le immagini di anime in video: Dai vita alle tue opere d'arte statiche con l'IA nel 2026

Come generare scene anime con i prompt: Guida all'ingegneria dei prompt per i creatori di anime AI nel 2026

Nel 2026 come creare video corti animati con l'IA: flusso di lavoro passo passo per TikTok, Reels e YouTube

Spiegazione dettagliata del processo di realizzazione di animazioni con AI: Dal concetto creativo alla serie completa nel 2026 (spiegazione passo per passo)