Creare Personaggi Consistenti con l'Intelligenza Artificiale
L'AI genera immagini in modo statisticamente probabilistico: ogni generazione è una nuova estrazione da uno spazio enorme di possibilità. Il risultato può sembrare simile, ma non sarà mai identico. Capelli leggermente diversi, proporzioni cambiate, un'espressione appena diversa. Per un personaggio singolo va bene. Per un personaggio che deve comparire in più immagini coerenti, è un problema.
Ho cercato a lungo un metodo che funzionasse davvero. Non un trucco per un singolo prompt — ma un sistema riproducibile. Quello che ho trovato si basa su un principio semplice: prima di chiedere all'AI di generare qualcosa, costruisci un identikit visivo del tuo personaggio. Quattro immagini. Quattro riferimenti precisi che l'AI può seguire.
Il Metodo dei 4 Pilastri
Il sistema è strutturato in quattro passaggi: creare il personaggio base, costruire una griglia di pose diverse, realizzare un close-up dettagliato del viso, e generare una griglia di espressioni facciali. Queste quattro immagini diventano i tuoi riferimenti fissi — l'identikit che userai come punto di partenza per ogni generazione successiva.
Il metodo funziona con qualsiasi software di generazione AI — Freepik, Midjourney, Leonardo, Stable Diffusion. La ragione è tecnica: sotto la superficie, tutti questi strumenti usano modelli simili. Le differenze di stile esistono, ma la logica del riferimento visivo funziona ovunque.
Preparare il Template
Il punto di partenza è un documento template con due tipi di sezioni. Le parti fisse definiscono lo stile generale: realistico, fotografico, con imperfezioni naturali della pelle, illuminazione cinematografica. Queste rimangono identiche per tutte le generazioni — sono le costanti del tuo personaggio. Le parti in giallo sono quelle personalizzabili: genere, età, tratti fisici, colori, abbigliamento. Le compili tu prima di usare il template.
Il template è disponibile in italiano e in inglese. Il consiglio è di usare la versione inglese: i modelli AI sono stati addestrati prevalentemente su testo inglese, e i prompt in inglese producono risultati più precisi e coerenti.
La Guida di Compilazione. Se hai difficoltà a immaginare un personaggio da zero, esiste una guida strutturata che ti accompagna sezione per sezione: genere, fascia d'età, corporatura, forma del viso, colore degli occhi, tipo di capelli, abbigliamento. Non devi inventare tutto insieme — rispondi a una domanda alla volta. C'è anche un'opzione più veloce: passi la guida a ChatGPT o Claude e descrivi a parole il personaggio che hai in testa. L'AI compila il template per te.
Questo secondo approccio è utile soprattutto quando hai un'idea chiara ma fai fatica a tradurla in descrizioni tecniche. Dici 'voglio un personaggio che sembra un medico di mezza età, stanco ma competente' e il template viene compilato con parametri precisi che puoi poi rivedere e aggiustare.
Passaggio 1 — La Prima Immagine
Con il template compilato, si entra in Freepik e si usa il generatore di immagini con il modello Google Nano Banana 2. Il formato consigliato è 16:9 a risoluzione 2K. Si incolla l'intero template nel campo prompt — parti fisse incluse — e si genera. Non ci si aspetta la perfezione al primo colpo: si generano più varianti e si sceglie quella che si avvicina di più alla visione del personaggio.
Freepik con una sottoscrizione annuale è comodo per questo tipo di lavoro: la generazione di immagini fino a 2K è illimitata, quindi si può sperimentare senza preoccuparsi di consumare crediti. Quando si trova l'immagine giusta, la si salva — è il punto di partenza da cui tutto il resto deriva.
Passaggio 2 — Le Diverse Pose. Il secondo passaggio è costruire una griglia turnaround: il personaggio visto da diverse angolazioni. Il prompt ha una struttura precisa: Frase 1 (descrizione dell'obiettivo — griglia turnaround con il personaggio da più punti di vista) + Template (le stesse specifiche fisiche del primo passaggio) + Frase 2 (istruzioni sullo stile della griglia, sfondo neutro, illuminazione uniforme). FONDAMENTALE: allegare come riferimento l'immagine generata al passaggio 1. Senza questo riferimento, l'AI genererà un personaggio diverso. Con il riferimento, tende a mantenersi coerente. Essere ridondanti con l'AI non è un problema — è una strategia.
Passaggio 3 — Il Close-Up
Il terzo passaggio è un primo piano ravvicinato del viso — il più dettagliato possibile. L'obiettivo è catturare tutte le caratteristiche facciali con precisione fotografica: pori visibili, imperfezioni naturali della pelle, luci negli occhi, texture dei capelli. Più dettagli ha questo close-up, più preciso sarà l'AI nel riprodurre il viso nelle generazioni successive.
Il prompt usa la stessa struttura: Frase 1 (close-up ravvicinato, altissimo dettaglio) + Template + Frase 2 (realismo fotografico, imperfezioni naturali) + immagine di riferimento. In questo caso si può allegare sia l'immagine base che la griglia delle pose — più riferimenti si danno, più l'AI ha materiale su cui basarsi.
Passaggio 4 — Le Espressioni Facciali. L'ultimo passaggio è una griglia con diverse espressioni: sorriso, espressione seria, sorpresa, rabbia, tristezza — quelle che ti servono per il tuo progetto. La struttura del prompt è analoga agli altri passaggi. Come riferimento si usa il close-up del passaggio 3, che è l'immagine più dettagliata del viso. In alternativa, si possono allegare tutte e tre le immagini precedenti insieme: il risultato è generalmente più preciso, perché l'AI ha una visione più completa del personaggio da ogni angolazione.
Usare l'Identikit
A questo punto hai quattro immagini: il personaggio base, le pose, il close-up, le espressioni. Queste sono i tuoi binari — le guide che tengono l'AI su un tracciato coerente invece di lasciarla vagare liberamente nelle sue possibilità statistiche. Per ogni nuova generazione che vuoi creare con questo personaggio, allega questi riferimenti al prompt.
La regola è semplice: più riferimenti alleghi, meno variabilità ottieni. Se alleghi solo un'immagine, ci sarà più libertà interpretativa. Se alleghi tutte e quattro, l'AI ha pochissimo spazio di manovra e il risultato tende a essere molto più vicino all'originale. Per scene nuove, ambienti diversi, situazioni inedite — il personaggio rimane riconoscibile.
Il metodo non è magico. L'AI continuerà a produrre piccole variazioni — è nella sua natura. Ma le variazioni si riducono drasticamente rispetto a generare senza riferimenti. La pazienza resta fondamentale: si generano più versioni, si sceglie la migliore, si affina. Con questo sistema, però, il punto di partenza è molto più vicino all'obiettivo, e il numero di tentativi necessari scende in modo significativo.