Google は2026年5月19日、新しい動画生成モデル「Google Gemini Omni」を発表しました。
Gemini Omniは、画像・動画・音声・テキストを組み合わせて動画を生成できるマルチモーダルAIです。会話形式で映像の修正や調整を行うことも可能です。
今回公開された最初のモデル「Gemini Omni Flash」では、動画内の一部分だけを変更したり、演出やカメラアングルを自然言語で継続的に調整可能。生成後も「前の内容を維持したまま編集できる」ことが大きな特徴として紹介されています。
また Google は、ビー玉が連鎖的に動く物理演算系の映像や、科学解説アニメーション、動画内テキストを含む演出例なども公開しており、生成精度の高さをアピールしています。
「Gemini Omni Flash」は、Google のAIアプリ「Gemini」や「Google Flow」にて提供を開始。さらにYouTube ShortsとYouTube Createアプリのユーザーにも今週から無料で提供するとしています。
また、今後数週間以内に開発者や企業顧客向けにAPI提供を開始予定とのことです。
公式発表はこちら:
Google公式ブログ|Introducing Gemini Omni

コメント