Gemini Omni — Googles multimodale Video-KI

Gemini Omni ist Googles neues multimodales Videomodell, vorgestellt auf der I/O 2026. Bearbeite jeden Clip per Chat. Generiere aus Text, Bildern, Audio oder Video-Referenzen — alles in einem Modell. Jetzt verfügbar auf LoraAI — leg unten direkt los.

Text, image, 3-image fusionReference-to-video720p, 1080p, 4K

0/2000

First 24 hours · May 19, 2026

Real Gemini Omni Tests From Creators on X

Six clips from the first wave of public Gemini Omni testing. Hover or tap to play. Click the author to read the original post.

@EHuangluStudio-level VFX on a phone — "Nano Banana but for video."

@xiaohuCapability overview: "video version of Nano Banana; prototype world model."

@xiaohuWorld knowledge: protein folding claymation + 26-letter rapid fire.

@aimikodaSeedance 2.0 vs Gemini Omni — same prompt, same storyboard, side by side.

@gengdaJQuantitative test: 4/6/8/10s clips, 60 credits per 10s render.

@vista8Skeptical take: Moebius sci-fi prompt failed adherence on the second clause.

Google DeepMind · I/O 2026

Was Gemini Omni wirklich kann

Gemini Omni ist Googles erstes vereintes multimodales Videomodell. Veröffentlicht am 19. Mai 2026, verarbeitet das Modell Gemini Omni Flash Text, Bilder, Audio oder Video als Eingabe und gibt Video aus, das auf dem Weltwissen von Gemini basiert. Die meisten Videomodelle generieren nur. Gemini Omni generiert und bearbeitet — im Gespräch, über mehrere Runden hinweg, mit derselben Szene im Gedächtnis.

Video per Chat bearbeiten

Sage Gemini Omni in einfachen Worten, was geändert werden soll. „Mach die Skulptur aus Seifenblasen.“ „Dimme das Licht und füge eine Schachbrettkugel hinzu.“ Jede Anweisung baut auf der letzten auf — Charaktere bleiben konsistent, die Physik stimmt.

Verankert in Geminis Weltwissen

Gemini Omni denkt über Physik, Geschichte und Wissenschaft nach. Es kann eine Knetanimation zur Proteinfaltung rendern oder ein 26-Buchstaben-Alphabet-Video im Schnellfeuer, bei dem jedes Element kulturell Sinn ergibt.

Jede Eingabe, eine kohärente Ausgabe

Wirf ein Bild, einen Sprachclip oder ein Referenzvideo hinein — jede Kombination ist möglich. Gemini Omni vermischt sie zu einem einzigen, kohärenten Clip, ohne dass du Tools verketten oder Apps wechseln musst.

Ein Videomodell testen, das du jetzt nutzen kannst

Verfügbar ab 19. Mai 2026

So testest du Gemini Omni

Gemini Omni Flash wird ab heute über drei Wege ausgerollt. Wähle den, der zu dem passt, was du hast.

Kostenlos auf YouTube Shorts

Der schnellste Weg, Gemini Omni ohne Bezahlung auszuprobieren. Öffne YouTube Shorts oder die YouTube Create App diese Woche — kein Abo nötig.

Gemini app (Plus, Pro, Ultra)

Google AI Plus-, Pro- und Ultra-Abonnenten können Gemini Omni ab sofort in der Gemini app nutzen. Die Pro-Stufe startet mit 1.000 Credits.

Google Flow Studio

Für längere Projekte öffne Gemini Omni in Google Flow. Baue Storyboards, verkette Bearbeitungen und halte deine Shots in einem Workspace organisiert.

API — kommt in den nächsten Wochen

Entwickler und Enterprise-Teams erhalten in den Wochen nach der I/O 2026 Zugang zur Gemini Omni API. Registriere dich über Google AI Studio, um benachrichtigt zu werden.

Vollständige Funktionsübersicht

Gemini Omni Funktionen

Jede Funktion unten stammt aus Googles Launch-Demo und der ersten Welle von Creator-Tests, die am 19. Mai 2026 veröffentlicht wurden.

Text-, Bild-, Audio- und Video-Eingaben

Gemini Omni akzeptiert jede Kombination von Eingaben. Referenziere ein Bild für den Stil, ein Video für die Bewegung, einen Audioclip für den Rhythmus — alles im selben Prompt.

Konversationelle Multi-Turn-Bearbeitung

Generieren, dann bearbeiten. Und noch einmal bearbeiten. Gemini Omni merkt sich die Szene zwischen den Runden. Ändere den Kamerawinkel, tausche einen Charakter, entferne ein Objekt — ohne den Clip neu zu starten.

Storytelling mit Weltwissen

Gemini Omni schöpft aus Geminis Reasoning, um wissenschaftlich und kulturell korrekte Inhalte zu rendern. Denk an Knetanimations-Erklärungen zur Proteinfaltung oder A-Z-Schnellfeuer-Videos, bei denen jedes Element Sinn ergibt.

Schärferes Physik-Verständnis

Murmeln rollen, Wasser kräuselt sich, Stoff fällt natürlich. Gemini Omni meistert Gravitation und Fluiddynamik besser als Veo 3.1 — auch wenn Seedance 2.0 bei Tests mit identischem Prompt immer noch bei der reinen Bewegungsenergie führt.

Avatare mit deiner Stimme

Baue einen digitalen Zwilling, der aussieht und klingt wie du, und füge ihn in Gemini Omni Szenen ein. Audio-Bearbeitung beliebiger Sprache befindet sich noch in eingeschränkten Tests.

SynthID-Wasserzeichen auf jedem Clip

Jedes Gemini Omni Video trägt ein unsichtbares SynthID-Wasserzeichen. Verifiziere jeden Clip als Gemini Omni Ausgabe über die Gemini app, Chrome oder Google Search.

Echte Posts vom 19. Mai 2026

Was Creator über Gemini Omni sagen

Diese Zitate stammen aus den ersten 24 Stunden öffentlicher Gemini Omni Tests auf X. Beide Seiten — was funktioniert und was nicht.

@EHuanglu

Filmemacher · 4K Hero-Demo

“Gemini Omni ist da — es ist Nano Banana, aber für Video. Du kannst direkt auf deinem Handy mit KI Studio-VFX zu jedem Clip hinzufügen. Der Abstand zwischen Hollywood-Profis und Schulkindern ist verschwunden.”

@xiaohu

KI-Analyst · 107K Follower auf X

“Schau dir an, was Gemini Omni leisten kann. In einem Satz: die Video-Version von Nano Banana. Allein die Bearbeitung ist beeindruckend, aber das ist auch ein Prototyp eines Weltmodells — eine frühe Form allgemeiner AGI.”

@aimikoda

Storyboard-Künstler · Test mit identischem Prompt

“Ich habe Seedance 2.0 und Gemini Omni den exakt gleichen Prompt, das gleiche Storyboard und die gleichen Charakter-Referenzen gegeben. Gemini Omni hat mich bei der Stilqualität überrascht. Aber Seedance fühlt sich immer noch geführt an — bessere Bewegungsenergie, Kamerasprache, Interaktion mit der Umgebung.”

@gengdaJ

Creator · quantitativer Tester

“Gemini Omni getestet: unterstützt 4, 6, 8, 10 Sekunden lange Clips. First-Frame- und Reference-Frame-Modi. Jedes 10-Sekunden-Video verbrennt 60 Credits, die Pro-Stufe startet mit 1.000 Credits. Capability-Ranking: Seedance 2.0 > Gemini Omni > Happyhorse 1.0.”

@vista8

Unabhängiger Tester · skeptischer Blick

“Ehrlich? Gemini Omni Flash ist bisher schwach. Prompt: „Moebius-Stil Sci-Fi-Kurzfilm, Per Anhalter durch die Galaxis.“ Hat die zweite Hälfte kaum verstanden. Der Hype ist der Realität weit voraus.”

Häufige Fragen

Gemini Omni FAQ

Schnelle Antworten auf das, was die Leute seit dem Launch auf der I/O 2026 zu Gemini Omni fragen.

Was ist Gemini Omni?

Gemini Omni ist Google DeepMinds neues multimodales Videomodell, angekündigt auf der Google I/O 2026 am 19. Mai. Es akzeptiert Text, Bilder, Audio und Video als Eingabe und gibt Video aus, das auf dem Weltwissen von Gemini basiert. Das erste Modell der Familie ist Gemini Omni Flash.

Wie unterscheidet sich Gemini Omni von Veo 3.1?

Veo 3.1 (interner Codename Toucan) ist ein reines Videogenerierungsmodell. Gemini Omni bringt zwei Dinge mit, die Veo nie hatte: konversationelle Multi-Turn-Bearbeitung und vereinte multimodale Eingabe. Google hat erklärt, dass Gemini Omni auf der Veo-Grundlage aufbaut, aber weit darüber hinausgeht.

Gemini Omni vs Sora 2 — was ist besser?

Sora 2 generiert nur; Gemini Omni generiert und bearbeitet per Chat. Bei der reinen Bewegungsrealität sehen frühe Tests Sora 2 und Seedance 2.0 vor Gemini Omni. Bei Multi-Turn-Bearbeitung derselben Szene ist Gemini Omni derzeit die einzige Option.

Gemini Omni vs Seedance 2.0 — direkter Vergleich?

Creator @aimikoda hat denselben Prompt und dasselbe Storyboard durch beide laufen lassen. Gemini Omni hat bei der Stilqualität gewonnen; Seedance 2.0 gewann bei Bewegungsenergie, Kamerasprache und Interaktion mit der Umgebung. Beim geführten Storytelling führt Seedance 2.0 weiterhin.

Wie kann ich Gemini Omni kostenlos testen?

Gemini Omni wird diese Woche kostenlos auf YouTube Shorts und in der YouTube Create App ausgerollt — kein Abo nötig. Die Version in der Gemini app ist Google AI Plus-, Pro- und Ultra-Abonnenten vorbehalten.

Wie lang darf ein Gemini Omni Clip sein?

Aktuelle Einzelclip-Längen aus Creator-Tests sind 4, 6, 8 oder 10 Sekunden. Jeder 10-Sekunden-Clip kostet rund 60 Credits in der Gemini app. Google hat erklärt, dass längere Laufzeiten in künftigen Updates folgen.

Hat Gemini Omni eine API?

Noch nicht. Google hat eine Entwickler- und Enterprise-API für Gemini Omni in den Wochen nach der I/O 2026 angekündigt. Registriere dich über Google AI Studio, um benachrichtigt zu werden, sobald der Zugang öffnet.

Sind Gemini Omni Videos mit einem Wasserzeichen versehen?

Ja. Jeder Clip trägt ein unsichtbares SynthID-Wasserzeichen. Du kannst jedes Video als Gemini Omni Ausgabe über die Gemini app, Chrome oder Google Search verifizieren.

Was kann ich nutzen, während ich auf den Gemini Omni API-Zugang warte?

LoraAI bietet produktionsreife Alternativen, die schon heute liefern. Seedance 2.0 führt bei Bewegungsrealität und Multi-Shot-Storytelling. Sora 2 deckt schnelles Text-zu-Video ab. Veo 3.1 übernimmt cineastische Shots mit nativem Audio.