Xのタイムラインを流し見してたら、Googleの動画生成AIの話題が一気に増えてた。「Gemini Omni Flash」、通称「動画版ナノバナナ」って呼ばれてるやつだ。
ナノバナナってのは、Googleが以前から使ってた軽量モデルの愛称みたいなやつで、要はFlashモデルの動画対応版ってこと。速くて軽い、それが売りらしい。
海外のAI界隈ではもう「Sora超えたか?」みたいな議論になってる。日本のXはまだそこまで盛り上がってないけど、海外のクリエイターがすでにサンプル動画を大量に出してて、正直クオリティに驚いた。
自分もさっそく触ってみた。Gemini側のUIから動画生成を呼び出す感じで、プロンプトを入力するとそのまま動画になって出てくる。テキストから数秒の動画を生成できる。
得意なのは、自然な動きのある風景系とか、シンプルなアニメーション寄りの映像だ。逆に苦手なのは、人の手の動きや複雑なアクション系。Soraと同じく「手の指が溶ける問題」はまだ残ってる印象だった。
ただ、Flashって名前の通り、生成速度がマジで速い。他の動画生成AIと比べると体感でかなり違う。フォロワーからも「待ち時間が短いのが一番ありがたい」ってコメントが来てたし、そこは実際に強みだと思う。
うちのYouTubeチャンネルで使えるかどうかも考えた。2万人くらいのチャンネルだと、サムネ動画や導入の短いクリップに使えれば制作コストがだいぶ変わる。今は妻に「また新しいツール入れてるの」って言われながら、子どもが寝た後にカフェの作業配信で試してるところだ。
SoraはOpenAIが出した動画生成AIで、リリース直後から映像クオリティの高さで話題になった。GeminiのFlashはそこと真正面から戦うというより、「速さと使いやすさ」で差別化してる感じだ。
GeminiはすでにGoogleのサービスと連携してるから、Googleドキュメントやスライドと一緒に使えるようになったとき、一気に普及するシナリオは十分あり得る。特に日本の中小企業が資料作成で使い始めたら、そこは面白い変化になりそうだ。
プロンプトの書き方次第でクオリティが大きく変わるのも面白いポイントで、自分が試した中では:
このあたりのコツは、もうXのポストにまとめてフォロワーに共有した。反応はそこそこよかった。
正直、今の段階では「完璧な動画が作れる」ってレベルじゃない。でも半年後にどうなってるかは読めない。Soraが登場したときも最初はこんな感じだったし、ここ最近のAIの進化速度を見てると、次のアップデートで大きく変わる可能性がある。
あなたのチャンネルや仕事で「動画を作りたいけど手間がかかる」と感じてるなら、今のうちにGemini Flashで遊んでおく価値はある。プロンプトの感覚をつかんでおくだけで、次のアップデートに乗り遅れずに済む。
ナノバナナってのは、Googleが以前から使ってた軽量モデルの愛称みたいなやつで、要はFlashモデルの動画対応版ってこと。速くて軽い、それが売りらしい。
海外のAI界隈ではもう「Sora超えたか?」みたいな議論になってる。日本のXはまだそこまで盛り上がってないけど、海外のクリエイターがすでにサンプル動画を大量に出してて、正直クオリティに驚いた。
実際に何ができるのか試してみた
自分もさっそく触ってみた。Gemini側のUIから動画生成を呼び出す感じで、プロンプトを入力するとそのまま動画になって出てくる。テキストから数秒の動画を生成できる。
得意なのは、自然な動きのある風景系とか、シンプルなアニメーション寄りの映像だ。逆に苦手なのは、人の手の動きや複雑なアクション系。Soraと同じく「手の指が溶ける問題」はまだ残ってる印象だった。
ただ、Flashって名前の通り、生成速度がマジで速い。他の動画生成AIと比べると体感でかなり違う。フォロワーからも「待ち時間が短いのが一番ありがたい」ってコメントが来てたし、そこは実際に強みだと思う。
うちのYouTubeチャンネルで使えるかどうかも考えた。2万人くらいのチャンネルだと、サムネ動画や導入の短いクリップに使えれば制作コストがだいぶ変わる。今は妻に「また新しいツール入れてるの」って言われながら、子どもが寝た後にカフェの作業配信で試してるところだ。
Soraとの違いをどう見るか
SoraはOpenAIが出した動画生成AIで、リリース直後から映像クオリティの高さで話題になった。GeminiのFlashはそこと真正面から戦うというより、「速さと使いやすさ」で差別化してる感じだ。
GeminiはすでにGoogleのサービスと連携してるから、Googleドキュメントやスライドと一緒に使えるようになったとき、一気に普及するシナリオは十分あり得る。特に日本の中小企業が資料作成で使い始めたら、そこは面白い変化になりそうだ。
プロンプトの書き方次第でクオリティが大きく変わるのも面白いポイントで、自分が試した中では:
- シーンの背景・光の向き・カメラアングルを具体的に書くと精度が上がる
- 「ゆっくり」「滑らかに」などの動きの指示が効く
- 人物のアップより引きの映像のほうが破綻しにくい
このあたりのコツは、もうXのポストにまとめてフォロワーに共有した。反応はそこそこよかった。
正直、今の段階では「完璧な動画が作れる」ってレベルじゃない。でも半年後にどうなってるかは読めない。Soraが登場したときも最初はこんな感じだったし、ここ最近のAIの進化速度を見てると、次のアップデートで大きく変わる可能性がある。
あなたのチャンネルや仕事で「動画を作りたいけど手間がかかる」と感じてるなら、今のうちにGemini Flashで遊んでおく価値はある。プロンプトの感覚をつかんでおくだけで、次のアップデートに乗り遅れずに済む。