
Gemini Omni — Googles multimodale Video-KI
Gemini Omni ist Googles neues multimodales Videomodell, vorgestellt auf der I/O 2026. Bearbeite jeden Clip per Chat. Generiere aus Text, Bildern, Audio oder Video-Referenzen — alles in einem Modell. Jetzt verfügbar auf LoraAI — leg unten direkt los.
First 24 hours · May 19, 2026
Real Gemini Omni Tests From Creators on X
Six clips from the first wave of public Gemini Omni testing. Hover or tap to play. Click the author to read the original post.
Was Gemini Omni wirklich kann
Gemini Omni ist Googles erstes vereintes multimodales Videomodell. Veröffentlicht am 19. Mai 2026, verarbeitet das Modell Gemini Omni Flash Text, Bilder, Audio oder Video als Eingabe und gibt Video aus, das auf dem Weltwissen von Gemini basiert. Die meisten Videomodelle generieren nur. Gemini Omni generiert und bearbeitet — im Gespräch, über mehrere Runden hinweg, mit derselben Szene im Gedächtnis.
Video per Chat bearbeiten
Sage Gemini Omni in einfachen Worten, was geändert werden soll. „Mach die Skulptur aus Seifenblasen.“ „Dimme das Licht und füge eine Schachbrettkugel hinzu.“ Jede Anweisung baut auf der letzten auf — Charaktere bleiben konsistent, die Physik stimmt.
Verankert in Geminis Weltwissen
Gemini Omni denkt über Physik, Geschichte und Wissenschaft nach. Es kann eine Knetanimation zur Proteinfaltung rendern oder ein 26-Buchstaben-Alphabet-Video im Schnellfeuer, bei dem jedes Element kulturell Sinn ergibt.
Jede Eingabe, eine kohärente Ausgabe
Wirf ein Bild, einen Sprachclip oder ein Referenzvideo hinein — jede Kombination ist möglich. Gemini Omni vermischt sie zu einem einzigen, kohärenten Clip, ohne dass du Tools verketten oder Apps wechseln musst.
So testest du Gemini Omni
Gemini Omni Flash wird ab heute über drei Wege ausgerollt. Wähle den, der zu dem passt, was du hast.
Kostenlos auf YouTube Shorts
Der schnellste Weg, Gemini Omni ohne Bezahlung auszuprobieren. Öffne YouTube Shorts oder die YouTube Create App diese Woche — kein Abo nötig.
Gemini app (Plus, Pro, Ultra)
Google AI Plus-, Pro- und Ultra-Abonnenten können Gemini Omni ab sofort in der Gemini app nutzen. Die Pro-Stufe startet mit 1.000 Credits.
Google Flow Studio
Für längere Projekte öffne Gemini Omni in Google Flow. Baue Storyboards, verkette Bearbeitungen und halte deine Shots in einem Workspace organisiert.
API — kommt in den nächsten Wochen
Entwickler und Enterprise-Teams erhalten in den Wochen nach der I/O 2026 Zugang zur Gemini Omni API. Registriere dich über Google AI Studio, um benachrichtigt zu werden.
Gemini Omni Funktionen
Jede Funktion unten stammt aus Googles Launch-Demo und der ersten Welle von Creator-Tests, die am 19. Mai 2026 veröffentlicht wurden.
Text-, Bild-, Audio- und Video-Eingaben
Gemini Omni akzeptiert jede Kombination von Eingaben. Referenziere ein Bild für den Stil, ein Video für die Bewegung, einen Audioclip für den Rhythmus — alles im selben Prompt.
Konversationelle Multi-Turn-Bearbeitung
Generieren, dann bearbeiten. Und noch einmal bearbeiten. Gemini Omni merkt sich die Szene zwischen den Runden. Ändere den Kamerawinkel, tausche einen Charakter, entferne ein Objekt — ohne den Clip neu zu starten.
Storytelling mit Weltwissen
Gemini Omni schöpft aus Geminis Reasoning, um wissenschaftlich und kulturell korrekte Inhalte zu rendern. Denk an Knetanimations-Erklärungen zur Proteinfaltung oder A-Z-Schnellfeuer-Videos, bei denen jedes Element Sinn ergibt.
Schärferes Physik-Verständnis
Murmeln rollen, Wasser kräuselt sich, Stoff fällt natürlich. Gemini Omni meistert Gravitation und Fluiddynamik besser als Veo 3.1 — auch wenn Seedance 2.0 bei Tests mit identischem Prompt immer noch bei der reinen Bewegungsenergie führt.
Avatare mit deiner Stimme
Baue einen digitalen Zwilling, der aussieht und klingt wie du, und füge ihn in Gemini Omni Szenen ein. Audio-Bearbeitung beliebiger Sprache befindet sich noch in eingeschränkten Tests.
SynthID-Wasserzeichen auf jedem Clip
Jedes Gemini Omni Video trägt ein unsichtbares SynthID-Wasserzeichen. Verifiziere jeden Clip als Gemini Omni Ausgabe über die Gemini app, Chrome oder Google Search.
Was Creator über Gemini Omni sagen
Diese Zitate stammen aus den ersten 24 Stunden öffentlicher Gemini Omni Tests auf X. Beide Seiten — was funktioniert und was nicht.
@EHuanglu
Filmemacher · 4K Hero-Demo
“Gemini Omni ist da — es ist Nano Banana, aber für Video. Du kannst direkt auf deinem Handy mit KI Studio-VFX zu jedem Clip hinzufügen. Der Abstand zwischen Hollywood-Profis und Schulkindern ist verschwunden.”
@xiaohu
KI-Analyst · 107K Follower auf X
“Schau dir an, was Gemini Omni leisten kann. In einem Satz: die Video-Version von Nano Banana. Allein die Bearbeitung ist beeindruckend, aber das ist auch ein Prototyp eines Weltmodells — eine frühe Form allgemeiner AGI.”
@aimikoda
Storyboard-Künstler · Test mit identischem Prompt
“Ich habe Seedance 2.0 und Gemini Omni den exakt gleichen Prompt, das gleiche Storyboard und die gleichen Charakter-Referenzen gegeben. Gemini Omni hat mich bei der Stilqualität überrascht. Aber Seedance fühlt sich immer noch geführt an — bessere Bewegungsenergie, Kamerasprache, Interaktion mit der Umgebung.”
@gengdaJ
Creator · quantitativer Tester
“Gemini Omni getestet: unterstützt 4, 6, 8, 10 Sekunden lange Clips. First-Frame- und Reference-Frame-Modi. Jedes 10-Sekunden-Video verbrennt 60 Credits, die Pro-Stufe startet mit 1.000 Credits. Capability-Ranking: Seedance 2.0 > Gemini Omni > Happyhorse 1.0.”
@vista8
Unabhängiger Tester · skeptischer Blick
“Ehrlich? Gemini Omni Flash ist bisher schwach. Prompt: „Moebius-Stil Sci-Fi-Kurzfilm, Per Anhalter durch die Galaxis.“ Hat die zweite Hälfte kaum verstanden. Der Hype ist der Realität weit voraus.”
Gemini Omni FAQ
Schnelle Antworten auf das, was die Leute seit dem Launch auf der I/O 2026 zu Gemini Omni fragen.
Was ist Gemini Omni?
Gemini Omni ist Google DeepMinds neues multimodales Videomodell, angekündigt auf der Google I/O 2026 am 19. Mai. Es akzeptiert Text, Bilder, Audio und Video als Eingabe und gibt Video aus, das auf dem Weltwissen von Gemini basiert. Das erste Modell der Familie ist Gemini Omni Flash.
Wie unterscheidet sich Gemini Omni von Veo 3.1?
Veo 3.1 (interner Codename Toucan) ist ein reines Videogenerierungsmodell. Gemini Omni bringt zwei Dinge mit, die Veo nie hatte: konversationelle Multi-Turn-Bearbeitung und vereinte multimodale Eingabe. Google hat erklärt, dass Gemini Omni auf der Veo-Grundlage aufbaut, aber weit darüber hinausgeht.
Gemini Omni vs Sora 2 — was ist besser?
Sora 2 generiert nur; Gemini Omni generiert und bearbeitet per Chat. Bei der reinen Bewegungsrealität sehen frühe Tests Sora 2 und Seedance 2.0 vor Gemini Omni. Bei Multi-Turn-Bearbeitung derselben Szene ist Gemini Omni derzeit die einzige Option.
Gemini Omni vs Seedance 2.0 — direkter Vergleich?
Creator @aimikoda hat denselben Prompt und dasselbe Storyboard durch beide laufen lassen. Gemini Omni hat bei der Stilqualität gewonnen; Seedance 2.0 gewann bei Bewegungsenergie, Kamerasprache und Interaktion mit der Umgebung. Beim geführten Storytelling führt Seedance 2.0 weiterhin.
Wie kann ich Gemini Omni kostenlos testen?
Gemini Omni wird diese Woche kostenlos auf YouTube Shorts und in der YouTube Create App ausgerollt — kein Abo nötig. Die Version in der Gemini app ist Google AI Plus-, Pro- und Ultra-Abonnenten vorbehalten.
Wie lang darf ein Gemini Omni Clip sein?
Aktuelle Einzelclip-Längen aus Creator-Tests sind 4, 6, 8 oder 10 Sekunden. Jeder 10-Sekunden-Clip kostet rund 60 Credits in der Gemini app. Google hat erklärt, dass längere Laufzeiten in künftigen Updates folgen.
Hat Gemini Omni eine API?
Noch nicht. Google hat eine Entwickler- und Enterprise-API für Gemini Omni in den Wochen nach der I/O 2026 angekündigt. Registriere dich über Google AI Studio, um benachrichtigt zu werden, sobald der Zugang öffnet.
Sind Gemini Omni Videos mit einem Wasserzeichen versehen?
Ja. Jeder Clip trägt ein unsichtbares SynthID-Wasserzeichen. Du kannst jedes Video als Gemini Omni Ausgabe über die Gemini app, Chrome oder Google Search verifizieren.
Was kann ich nutzen, während ich auf den Gemini Omni API-Zugang warte?
LoraAI bietet produktionsreife Alternativen, die schon heute liefern. Seedance 2.0 führt bei Bewegungsrealität und Multi-Shot-Storytelling. Sora 2 deckt schnelles Text-zu-Video ab. Veo 3.1 übernimmt cineastische Shots mit nativem Audio.