Gemini Omni — GoogleのマルチモーダルAI動画

Gemini Omniは、I/O 2026で発表されたGoogleの新しいマルチモーダル動画モデルです。チャットで指示するだけで、どんなクリップでも編集できます。テキスト、画像、音声、動画リファレンスから生成し、すべてを1つのモデルで処理します。今すぐ LoraAI でご利用いただけます — 下のツールで生成を始めましょう。

Text, image, 3-image fusionReference-to-video720p, 1080p, 4K

0/2000

First 24 hours · May 19, 2026

Real Gemini Omni Tests From Creators on X

Six clips from the first wave of public Gemini Omni testing. Hover or tap to play. Click the author to read the original post.

@EHuangluStudio-level VFX on a phone — "Nano Banana but for video."

@xiaohuCapability overview: "video version of Nano Banana; prototype world model."

@xiaohuWorld knowledge: protein folding claymation + 26-letter rapid fire.

@aimikodaSeedance 2.0 vs Gemini Omni — same prompt, same storyboard, side by side.

@gengdaJQuantitative test: 4/6/8/10s clips, 60 credits per 10s render.

@vista8Skeptical take: Moebius sci-fi prompt failed adherence on the second clause.

Google DeepMind · I/O 2026

Gemini Omniで実際にできること

Gemini OmniはGoogle初の統合型マルチモーダル動画モデルです。2026年5月19日に公開されたGemini Omni Flashモデルは、テキスト、画像、音声、動画を入力として受け取り、Geminiのワールドナレッジに基づいた動画を出力します。多くの動画モデルが生成のみに対応しているのに対し、Gemini Omniは生成と編集の両方に対応し、複数ターンの会話を通じて、同じシーンを記憶しながら作業を進められます。

チャットで動画を編集

Gemini Omniに変更したい内容を普通の言葉で伝えるだけです。「彫刻を泡で作って」「照明を落としてチェッカー柄の球体を追加して」。各指示が前の指示の上に積み重なり、キャラクターは一貫性を保ち、物理演算も破綻しません。

Geminiのワールドナレッジに根ざした生成

Gemini Omniは物理、歴史、科学について推論できます。タンパク質折りたたみを解説するクレイメーション動画や、26文字すべての項目が文化的に意味の通るアルファベット早回し動画もレンダリングできます。

どんな入力でも、1つのまとまった出力に

画像、音声クリップ、リファレンス動画、どんな組み合わせでも入れられます。Gemini Omniはそれらを1つのまとまったクリップに統合します。ツールを連携させたり、アプリを切り替えたりする必要はありません。

今すぐ使える動画モデルを試す

2026年5月19日提供開始

Gemini Omniを試す方法

Gemini Omni Flashは本日から3つの経路で順次展開されます。お持ちの環境に合うものをお選びください。

YouTube Shortsで無料

Gemini Omniを無料で試す最速の方法です。今週中にYouTube ShortsまたはYouTube Createアプリを開いてください。サブスクリプションは不要です。

Gemini App（Plus、Pro、Ultra）

Google AI Plus、Pro、Ultraの加入者は、本日からGemini appの中でGemini Omniを利用できます。Proティアには初期クレジットとして1,000クレジットが付属します。

Google Flow Studio

長めのプロジェクトには、Google Flow内でGemini Omniを開いてください。ストーリーボードの作成、編集の連結、ショットの整理を1つのワークスペースで完結できます。

API — 数週間以内

開発者および企業チームは、I/O 2026後の数週間でGemini OmniのAPIアクセスを取得できます。Google AI Studioから登録すると通知を受け取れます。

全機能マップ

Gemini Omniの機能

以下の機能はすべて、Googleの公式デモと2026年5月19日に投稿された最初のクリエイターテスト群から確認したものです。

テキスト、画像、音声、動画の入力対応

Gemini Omniは入力の組み合わせを自由に受け付けます。スタイルは画像、モーションは動画、リズムは音声クリップ、すべて同じプロンプト内で参照できます。

会話型のマルチターン編集

生成し、編集する。さらに編集する。Gemini Omniはターン間でシーンを記憶しています。カメラアングルの変更、キャラクターの差し替え、オブジェクトの削除を、クリップを最初からやり直すことなく行えます。

ワールドナレッジによるストーリーテリング

Gemini OmniはGeminiの推論能力を活用し、科学的かつ文化的に正確なコンテンツをレンダリングします。タンパク質折りたたみのクレイメーション解説、各項目が筋の通ったA〜Zの早回し動画などです。

より鋭い物理直感

ビー玉が転がり、水面に波紋が広がり、布が垂れます。Gemini Omniの重力や流体力学の扱いはVeo 3.1より優れています。ただし同一プロンプトのテストでは、純粋なモーションエネルギーではSeedance 2.0が依然としてリードしています。

あなたの声を持つアバター

見た目も声もあなた自身に近いデジタルツインを作成し、Gemini Omniのシーンに登場させられます。任意の発話の音声編集は現在も制限付きテスト中です。

すべてのクリップにSynthID透かし

Gemini Omniで生成されたすべての動画には、目に見えないSynthID透かしが埋め込まれています。Gemini app、Chrome、Google Searchで、どのクリップがGemini Omniの出力かを検証できます。

2026年5月19日のリアルな投稿

Gemini Omniに対するクリエイターの声

以下のコメントは、Gemini Omniの公開テスト最初の24時間にX上で投稿されたものです。良い面、悪い面、両方を掲載しています。

@EHuanglu

映像作家 · 4Kヒーローデモ

“Gemini Omniが来た — 動画版のNano Bananaだ。スマホ上でAIを使い、どんなクリップにもスタジオレベルのVFXを直接付け足せる。ハリウッドのプロと小学生の差は消えた。”

@xiaohu

AIアナリスト · X上で10.7万フォロワー

“Gemini Omniにできることを見てほしい。一言で言えば、動画版のNano Banana。編集機能だけでも素晴らしいが、これは同時にワールドモデルのプロトタイプ、汎用AGIの初期形態でもある。”

@aimikoda

ストーリーボードアーティスト · 同一プロンプトテスト

“Seedance 2.0とGemini Omniに、まったく同じプロンプト、ストーリーボード、キャラクターリファレンスを渡した。Gemini Omniはスタイル品質で驚かされた。だがSeedanceの方が演出が効いている — モーションエネルギー、カメラ言語、環境とのインタラクションが上だ。”

@gengdaJ

クリエイター · 定量テスター

“Gemini Omniをテスト：4、6、8、10秒のクリップに対応。先頭フレームとリファレンスフレームのモードあり。10秒の動画ごとに60クレジット消費、Proティアは1,000クレジット付き。能力ランキングはSeedance 2.0 > Gemini Omni > Happyhorse 1.0。”

@vista8

独立系テスター · 懐疑的な見方

“正直に言う。今のところGemini Omni Flashは弱い。プロンプト：「メビウス風のSF短編、銀河ヒッチハイク・ガイド」。後半はほぼ理解されていなかった。話題が現実を先走っている。”

よくある質問

Gemini Omni FAQ

I/O 2026の発表以降、Gemini Omniについて寄せられている質問への簡潔な回答です。

Gemini Omniとは何ですか？

Gemini Omniは、Google DeepMindが2026年5月19日のGoogle I/O 2026で発表した、新しいマルチモーダル動画モデルです。テキスト、画像、音声、動画を入力として受け取り、Geminiのワールドナレッジに基づいた動画を出力します。シリーズ最初のモデルはGemini Omni Flashです。

Gemini OmniはVeo 3.1とどう違いますか？

Veo 3.1（社内コードネームToucan）は純粋な動画生成モデルです。Gemini OmniにはVeoにはなかった2つの要素が加わっています：会話によるマルチターン編集と、統合されたマルチモーダル入力です。GoogleはGemini OmniがVeoの基盤の上に構築されつつ、それを大きく超えるものだと述べています。

Gemini Omni vs Sora 2 — どちらが優れていますか？

Sora 2は生成のみに対応します。Gemini Omniはチャットを通じて生成と編集の両方に対応します。純粋なモーションのリアリズムでは、初期テストはSora 2とSeedance 2.0がGemini Omniを上回るとしています。同じシーンに対するマルチターン編集では、現時点でGemini Omniが唯一の選択肢です。

Gemini Omni vs Seedance 2.0 — 直接対決の結果は？

クリエイターの@aimikoda氏が同一のプロンプトとストーリーボードを両モデルに通しました。スタイル品質ではGemini Omniが勝利し、モーションエネルギー、カメラ言語、環境とのインタラクションではSeedance 2.0が勝利しました。演出されたストーリーテリングでは、Seedance 2.0が依然として優位です。

Gemini Omniを無料で試すにはどうすればよいですか？

Gemini Omniは今週中にYouTube ShortsとYouTube Createアプリで無料公開されます。サブスクリプションは不要です。Gemini app版はGoogle AI Plus、Pro、Ultraの加入者に提供されます。

Gemini Omniのクリップはどの程度の長さまで対応しますか？

クリエイターのテストで現在確認されている単一クリップの長さは、4秒、6秒、8秒、10秒です。Gemini appでは10秒のクリップごとに約60クレジット消費されます。Googleは今後のアップデートでより長尺に対応すると述べています。

Gemini OmniにAPIはありますか？

まだありません。Googleは、I/O 2026後の数週間でGemini Omniの開発者向け・企業向けAPIを公開すると発表しました。Google AI Studioから登録すると、アクセス開始時に通知を受け取れます。

Gemini Omniの動画には透かしが入っていますか？

はい。すべてのクリップに目に見えないSynthID透かしが埋め込まれています。Gemini app、Chrome、Google Searchを使って、任意の動画がGemini Omniの出力かどうかを検証できます。

Gemini OmniのAPIアクセスを待つ間、何を使えますか？

LoraAIは本日から利用可能なプロダクション対応の代替手段を提供しています。Seedance 2.0はモーションのリアリズムとマルチショットのストーリーテリングでリードします。Sora 2は高速なテキストから動画の用途をカバーします。Veo 3.1はネイティブ音声付きのシネマティックなショットを担当します。