Gemini Omni — A IA de Vídeo Multimodal da Google

Gemini Omni é o novo modelo de vídeo multimodal da Google, lançado na I/O 2026. Edita qualquer clip conversando com ele. Gera a partir de texto, imagens, áudio ou referências de vídeo — tudo num único modelo. Disponível agora na LoraAI — começa já a gerar em baixo.

Text, image, 3-image fusionReference-to-video720p, 1080p, 4K

0/2000

First 24 hours · May 19, 2026

Real Gemini Omni Tests From Creators on X

Six clips from the first wave of public Gemini Omni testing. Hover or tap to play. Click the author to read the original post.

@EHuangluStudio-level VFX on a phone — "Nano Banana but for video."

@xiaohuCapability overview: "video version of Nano Banana; prototype world model."

@xiaohuWorld knowledge: protein folding claymation + 26-letter rapid fire.

@aimikodaSeedance 2.0 vs Gemini Omni — same prompt, same storyboard, side by side.

@gengdaJQuantitative test: 4/6/8/10s clips, 60 credits per 10s render.

@vista8Skeptical take: Moebius sci-fi prompt failed adherence on the second clause.

Google DeepMind · I/O 2026

O Que o Gemini Omni Realmente Faz

Gemini Omni é o primeiro modelo de vídeo multimodal unificado da Google. Lançado a 19 de maio de 2026, o modelo Gemini Omni Flash aceita texto, imagens, áudio ou vídeo como entrada e produz vídeo ancorado no conhecimento de mundo do Gemini. A maioria dos modelos de vídeo apenas gera. O Gemini Omni gera e edita — através de conversa, em várias rodadas, mantendo a mesma cena em memória.

Edita Vídeo Conversando

Diz ao Gemini Omni o que mudar em linguagem natural. "Faz a escultura em bolhas de sabão." "Diminui as luzes e adiciona uma esfera em xadrez." Cada instrução constrói sobre a anterior — os personagens mantêm-se consistentes, a física não falha.

Ancorado no Conhecimento de Mundo do Gemini

O Gemini Omni raciocina sobre física, história e ciência. Consegue renderizar uma explicação em claymation sobre o enovelamento de proteínas ou um vídeo do alfabeto de 26 letras em ritmo rápido, em que cada item faz sentido cultural.

Qualquer Entrada, Uma Saída Coerente

Adiciona uma imagem, um clip de voz, um vídeo de referência — qualquer combinação. O Gemini Omni funde tudo num único clip coerente sem encadear ferramentas nem trocar de app.

Experimenta Um Modelo de Vídeo Que Já Podes Usar

Disponível desde 19 de maio de 2026

Como Experimentar o Gemini Omni

O Gemini Omni Flash está a ser lançado hoje através de três canais. Escolhe o que melhor se adequa ao que tens.

Grátis no YouTube Shorts

A forma mais rápida de experimentar o Gemini Omni sem pagar. Abre o YouTube Shorts ou a app YouTube Create esta semana — sem subscrição necessária.

Gemini App (Plus, Pro, Ultra)

Os subscritores do Google AI Plus, Pro e Ultra podem usar o Gemini Omni dentro da Gemini app hoje. O nível Pro vem com 1.000 créditos iniciais.

Google Flow Studio

Para projetos mais longos, abre o Gemini Omni dentro do Google Flow. Cria storyboards, encadeia edições e mantém os teus planos organizados num único workspace.

API — Nas Próximas Semanas

Programadores e equipas empresariais recebem acesso à API do Gemini Omni nas semanas após a I/O 2026. Inscreve-te no Google AI Studio para seres notificado.

Mapa Completo de Capacidades

Capacidades do Gemini Omni

Cada funcionalidade abaixo vem da demonstração de lançamento da Google e da primeira vaga de testes de criadores publicados a 19 de maio de 2026.

Entradas de Texto, Imagem, Áudio e Vídeo

O Gemini Omni aceita qualquer combinação de entradas. Usa uma imagem como referência de estilo, um vídeo para movimento, um clip de áudio para o ritmo — tudo no mesmo prompt.

Edição Conversacional em Várias Rodadas

Gera, depois edita. Edita outra vez. O Gemini Omni lembra-se da cena entre rodadas. Muda o ângulo da câmara, troca um personagem, remove um objeto — sem reiniciar o clip.

Narrativa Com Conhecimento de Mundo

O Gemini Omni recorre ao raciocínio do Gemini para renderizar conteúdo cientificamente e culturalmente preciso. Pensa em explicações em claymation sobre o enovelamento de proteínas, vídeos rápidos de A a Z em que cada item faz sentido.

Intuição Física Mais Apurada

Berlindes rolam, a água ondula, o tecido cai. O Gemini Omni lida com gravidade e dinâmica de fluidos melhor do que o Veo 3.1 — embora o Seedance 2.0 continue à frente em energia de movimento bruta nos testes com o mesmo prompt.

Avatares Com a Tua Voz

Cria um gémeo digital que se parece e soa como tu, depois insere-o em cenas do Gemini Omni. A edição de áudio de fala arbitrária ainda está em testes restritos.

Marca de Água SynthID em Cada Clip

Cada vídeo do Gemini Omni transporta uma marca de água invisível SynthID. Verifica se qualquer clip é uma saída do Gemini Omni através da Gemini app, do Chrome ou da Google Search.

Publicações Reais de 19 de maio de 2026

O Que os Criadores Estão a Dizer Sobre o Gemini Omni

Estas citações vêm das primeiras 24 horas de testes públicos ao Gemini Omni no X. Os dois lados — o que funciona e o que não funciona.

@EHuanglu

Cineasta · demonstração de herói em 4K

“O Gemini Omni chegou — é o Nano Banana, mas para vídeo. Podes adicionar VFX de nível de estúdio a qualquer clip diretamente no telemóvel com IA. A distância entre profissionais de Hollywood e miúdos da escola desapareceu.”

@xiaohu

Analista de IA · 107K seguidores no X

“Olha o que o Gemini Omni consegue fazer. Numa frase: a versão em vídeo do Nano Banana. A edição por si só é impressionante, mas isto também é um protótipo de world model — uma forma inicial de AGI geral.”

@aimikoda

Artista de storyboard · teste com o mesmo prompt

“Dei ao Seedance 2.0 e ao Gemini Omni exatamente o mesmo prompt, storyboard e referências de personagens. O Gemini Omni surpreendeu-me na qualidade do estilo. Mas o Seedance ainda parece dirigido — melhor energia de movimento, linguagem de câmara e interação com o ambiente.”

@gengdaJ

Criador · testador quantitativo

“Gemini Omni testado: suporta clips de 4, 6, 8 e 10 segundos. Modos de primeiro frame e frame de referência. Cada vídeo de 10 segundos consome 60 créditos, o nível Pro inclui 1.000 créditos. Ranking de capacidade: Seedance 2.0 > Gemini Omni > Happyhorse 1.0.”

@vista8

Testador independente · visão cética

“Honestamente? O Gemini Omni Flash até agora é fraco. Prompt: "Curta de ficção científica estilo Moebius, Hitchhiker's Guide to the Galaxy." Mal percebeu a segunda metade. O hype está à frente da realidade.”

Perguntas Frequentes

FAQ do Gemini Omni

Respostas rápidas ao que as pessoas estão a perguntar sobre o Gemini Omni desde o lançamento na I/O 2026.

O que é o Gemini Omni?

Gemini Omni é o novo modelo de vídeo multimodal da Google DeepMind, anunciado no Google I/O 2026 a 19 de maio. Aceita texto, imagens, áudio e vídeo como entrada e produz vídeo ancorado no conhecimento de mundo do Gemini. O primeiro modelo da família é o Gemini Omni Flash.

Como é o Gemini Omni diferente do Veo 3.1?

O Veo 3.1 (codinome interno Toucan) é um modelo puro de geração de vídeo. O Gemini Omni acrescenta duas coisas que o Veo nunca teve: edição conversacional em várias rodadas e entrada multimodal unificada. A Google declarou que o Gemini Omni foi construído sobre a base do Veo, mas estende-se muito para além disso.

Gemini Omni vs Sora 2 — qual é melhor?

O Sora 2 apenas gera; o Gemini Omni gera e edita através de chat. Para realismo puro de movimento, os primeiros testes colocam o Sora 2 e o Seedance 2.0 à frente do Gemini Omni. Para edição em várias rodadas sobre a mesma cena, o Gemini Omni é, neste momento, a única opção.

Gemini Omni vs Seedance 2.0 — comparação direta?

O criador @aimikoda passou o mesmo prompt e storyboard pelos dois modelos. O Gemini Omni ganhou em qualidade de estilo; o Seedance 2.0 ganhou em energia de movimento, linguagem de câmara e interação com o ambiente. Para narrativa dirigida, o Seedance 2.0 continua à frente.

Como experimento o Gemini Omni de graça?

O Gemini Omni está a ser lançado gratuitamente no YouTube Shorts e na app YouTube Create esta semana — sem subscrição. A versão da Gemini app está reservada aos subscritores do Google AI Plus, Pro e Ultra.

Que duração pode ter um clip do Gemini Omni?

As durações atuais por clip nos testes de criadores são de 4, 6, 8 ou 10 segundos. Cada clip de 10 segundos custa cerca de 60 créditos na Gemini app. A Google indicou que durações maiores vão chegar em atualizações futuras.

O Gemini Omni tem API?

Ainda não. A Google anunciou uma API para programadores e empresas para o Gemini Omni nas semanas após a I/O 2026. Inscreve-te no Google AI Studio para seres notificado quando o acesso abrir.

Os vídeos do Gemini Omni têm marca de água?

Sim. Cada clip transporta uma marca de água invisível SynthID. Podes verificar qualquer vídeo como saída do Gemini Omni através da Gemini app, do Chrome ou da Google Search.

O que posso usar enquanto espero pelo acesso à API do Gemini Omni?

O LoraAI oferece alternativas prontas para produção que já estão disponíveis hoje. O Seedance 2.0 lidera em realismo de movimento e narrativa multi-plano. O Sora 2 cobre texto para vídeo rápido. O Veo 3.1 trata de planos cinematográficos com áudio nativo.