
Gemini Omni — l'IA video multimodale di Google
Gemini Omni è il nuovo modello video multimodale di Google, presentato a I/O 2026. Modifica qualsiasi clip chattando con lui. Genera da testo, immagini, audio o video di riferimento — tutto in un solo modello. Disponibile ora su LoraAI — inizia a generare qui sotto.
First 24 hours · May 19, 2026
Real Gemini Omni Tests From Creators on X
Six clips from the first wave of public Gemini Omni testing. Hover or tap to play. Click the author to read the original post.
Cosa fa davvero Gemini Omni
Gemini Omni è il primo modello video multimodale unificato di Google. Rilasciato il 19 maggio 2026, il modello Gemini Omni Flash accetta testo, immagini, audio o video come input e produce video radicati nella conoscenza del mondo di Gemini. La maggior parte dei modelli video si limita a generare. Gemini Omni genera e modifica — attraverso una conversazione, su più turni, mantenendo in memoria la stessa scena.
Modifica il video chattando
Di' a Gemini Omni cosa cambiare in linguaggio naturale. "Rendi la scultura fatta di bolle." "Abbassa le luci e aggiungi una sfera a scacchi." Ogni istruzione si costruisce sulla precedente — i personaggi restano coerenti, la fisica regge.
Radicato nella conoscenza del mondo di Gemini
Gemini Omni ragiona su fisica, storia e scienza. Può renderizzare uno spiegone in claymation sul ripiegamento delle proteine o un video alfabetico in rapida sequenza di 26 lettere in cui ogni elemento ha senso culturalmente.
Qualsiasi input, un unico output coerente
Inserisci un'immagine, un clip vocale, un video di riferimento — qualsiasi combinazione. Gemini Omni li fonde in un'unica clip coerente senza concatenare strumenti o cambiare app.
Come provare Gemini Omni
Gemini Omni Flash arriva oggi su tre canali. Scegli quello che corrisponde a ciò che hai.
Gratis su YouTube Shorts
Il modo più veloce di provare Gemini Omni senza pagare. Apri YouTube Shorts o l'app YouTube Create questa settimana — nessun abbonamento richiesto.
Gemini app (Plus, Pro, Ultra)
Gli abbonati a Google AI Plus, Pro e Ultra possono usare Gemini Omni dentro la Gemini app già da oggi. Il piano Pro include 1.000 crediti iniziali.
Google Flow Studio
Per progetti più lunghi, apri Gemini Omni dentro Google Flow. Costruisci storyboard, concatena modifiche e tieni in ordine le tue inquadrature in un unico spazio di lavoro.
API — nelle prossime settimane
Sviluppatori e team enterprise avranno accesso all'API di Gemini Omni nelle settimane successive a I/O 2026. Iscriviti tramite Google AI Studio per essere avvisato.
Capacità di Gemini Omni
Ogni funzionalità qui sotto viene dalla demo di lancio di Google e dalla prima ondata di test dei creator pubblicati il 19 maggio 2026.
Input testo, immagini, audio, video
Gemini Omni accetta qualsiasi combinazione di input. Usa un'immagine come riferimento di stile, un video per il movimento, un clip audio per il ritmo — tutto nello stesso prompt.
Editing conversazionale multi-turno
Genera, poi modifica. Modifica di nuovo. Gemini Omni ricorda la scena tra un turno e l'altro. Cambia l'angolazione della camera, sostituisci un personaggio, rimuovi un oggetto — senza ricominciare la clip.
Storytelling con conoscenza del mondo
Gemini Omni attinge al ragionamento di Gemini per produrre contenuti scientificamente e culturalmente accurati. Pensa a spiegoni in claymation sul ripiegamento delle proteine, video alfabetici A-Z in rapida sequenza dove ogni elemento ha senso.
Intuizione fisica più precisa
Le biglie rotolano, l'acqua si increspa, i tessuti cadono. Gemini Omni gestisce gravità e dinamica dei fluidi meglio di Veo 3.1 — anche se Seedance 2.0 resta in testa sull'energia di movimento grezza nei test con lo stesso prompt.
Avatar con la tua voce
Costruisci un gemello digitale che ti somiglia e suona come te, poi inseriscilo nelle scene di Gemini Omni. L'editing audio di parlato arbitrario è ancora in test ristretto.
Watermark SynthID su ogni clip
Ogni video di Gemini Omni porta un watermark SynthID invisibile. Verifica che qualsiasi clip sia un output di Gemini Omni tramite la Gemini app, Chrome o Google Search.
Cosa dicono i creator di Gemini Omni
Queste citazioni vengono dalle prime 24 ore di test pubblici di Gemini Omni su X. Entrambi i lati — cosa funziona, cosa no.
@EHuanglu
Filmmaker · demo eroica 4K
“Gemini Omni è arrivato — è Nano Banana ma per i video. Puoi aggiungere VFX di livello studio a qualsiasi clip direttamente dal telefono con l'IA. Il divario tra i professionisti di Hollywood e gli studenti delle scuole è scomparso.”
@xiaohu
AI analyst · 107K follower su X
“Guarda cosa può fare Gemini Omni. In una frase: la versione video di Nano Banana. L'editing da solo è impressionante, ma questo è anche un prototipo di world model — una forma iniziale di AGI generale.”
@aimikoda
Storyboard artist · test a parità di prompt
“Ho dato a Seedance 2.0 e a Gemini Omni esattamente lo stesso prompt, storyboard e riferimenti dei personaggi. Gemini Omni mi ha sorpreso sulla qualità dello stile. Ma Seedance sembra ancora più diretto — energia di movimento migliore, linguaggio della camera, interazione con l'ambiente.”
@gengdaJ
Creator · tester quantitativo
“Gemini Omni testato: supporta clip da 4, 6, 8, 10 secondi. Modalità first-frame e reference-frame. Ogni video da 10 secondi brucia 60 crediti, il piano Pro parte con 1.000 crediti. Classifica per capacità: Seedance 2.0 > Gemini Omni > Happyhorse 1.0.”
@vista8
Tester indipendente · giudizio scettico
“Sinceramente? Gemini Omni Flash è debole finora. Prompt: "Corto sci-fi in stile Moebius, Guida galattica per autostoppisti." Ha capito a malapena la seconda metà. L'hype è avanti rispetto alla realtà.”
FAQ su Gemini Omni
Risposte rapide a ciò che la gente sta chiedendo su Gemini Omni dal lancio a I/O 2026.
Cos'è Gemini Omni?
Gemini Omni è il nuovo modello video multimodale di Google DeepMind, annunciato a Google I/O 2026 il 19 maggio. Accetta testo, immagini, audio e video come input e produce video radicati nella conoscenza del mondo di Gemini. Il primo modello della famiglia è Gemini Omni Flash.
In cosa Gemini Omni è diverso da Veo 3.1?
Veo 3.1 (nome in codice interno Toucan) è un modello di pura generazione video. Gemini Omni aggiunge due cose che Veo non ha mai avuto: editing conversazionale multi-turno e input multimodale unificato. Google ha dichiarato che Gemini Omni è costruito sulle fondamenta di Veo ma le estende ben oltre.
Gemini Omni vs Sora 2 — quale è meglio?
Sora 2 genera soltanto; Gemini Omni genera e modifica via chat. Sul puro realismo del movimento, i primi test mettono Sora 2 e Seedance 2.0 davanti a Gemini Omni. Per l'editing multi-turno sulla stessa scena, Gemini Omni è attualmente l'unica opzione.
Gemini Omni vs Seedance 2.0 — testa a testa?
Il creator @aimikoda ha passato lo stesso prompt e storyboard in entrambi. Gemini Omni ha vinto sulla qualità dello stile; Seedance 2.0 ha vinto su energia di movimento, linguaggio della camera e interazione con l'ambiente. Per lo storytelling diretto, Seedance 2.0 resta in testa.
Come posso provare Gemini Omni gratis?
Gemini Omni viene distribuito gratis su YouTube Shorts e sull'app YouTube Create questa settimana — nessun abbonamento necessario. La versione nella Gemini app è riservata agli abbonati Google AI Plus, Pro e Ultra.
Quanto può essere lungo un clip di Gemini Omni?
Le durate attuali di un singolo clip emerse dai test dei creator sono 4, 6, 8 o 10 secondi. Ogni clip da 10 secondi costa circa 60 crediti nella Gemini app. Google ha dichiarato che durate più lunghe arriveranno nei prossimi aggiornamenti.
Gemini Omni ha un'API?
Non ancora. Google ha annunciato un'API per sviluppatori ed enterprise di Gemini Omni nelle settimane successive a I/O 2026. Iscriviti tramite Google AI Studio per essere avvisato quando l'accesso si apre.
I video di Gemini Omni hanno un watermark?
Sì. Ogni clip porta un watermark SynthID invisibile. Puoi verificare che un video sia output di Gemini Omni tramite la Gemini app, Chrome o Google Search.
Cosa posso usare mentre aspetto l'accesso all'API di Gemini Omni?
LoraAI offre alternative pronte per la produzione disponibili oggi. Seedance 2.0 è in testa su realismo del movimento e storytelling multi-shot. Sora 2 copre il text-to-video veloce. Veo 3.1 gestisce inquadrature cinematografiche con audio nativo.