これで映画も作れる！？画像入力ができる動画生成AI「Veo3」試してみた。

2025.05.282025.07.13

TEKUNOTES編集部

URLをコピーしました！

2024年、OpenAIの「Sora」が世界に衝撃を与えましたが、ついにGoogleが対抗馬となる、さらに進化した動画生成AI「Veo3」が発表。Veo3は、音声付きの動画を生成でき、画像プロンプトの入力も可能になりました。

ではその実力はいかに、、

【レビュー】Gemini Veo3で画像から動画が作れるように！「i2v」プロンプトのコツとは

2025.07.12

Veo3は、Google DeepMindが開発した最新・最強の動画生成AIモデルです。ユーザーがテキストや画像で指示（プロンプト）を入力するだけで、AIがその内容を解釈し、非常にリアルで高品質な動画を自動で生成してくれます。

2025年5月に開催されたGoogleの開発者向けイベント「Google I/O」で発表され、現在、日本を含む一部の国で提供が開始されています。

カメラの視点を指示できる

大阪万博の空飛ぶ車が実際に大阪上空を飛んでいる光景。カメラは三人称視点と、空飛ぶ車を運転している一人称視点の映像を交互に切り替えてください。

なぜか車が後ろに動いてしまっていますね。最初の背景は大阪万博でしょうか？パビリオンのような上空を飛行しています。大阪万博のドローンのような空飛ぶ車ではなく、ただ車が空に浮かんでいる動画に。

今回カメラ視点を切り替える指示を出してみましたが、うまく解釈してくれましたね。音声は指示していませんでしたが、電気自動車のような静かな走行音が聞こえます。

続きの動画も作れるみたい

この空飛ぶ車と同じ見た目の車から、ジェット機のような羽根を生やして、次は田舎上空を飛行してください。カメラ視点は前回と同じく三人称視点と一人称視点を交互に切り替えてください。

完全に同じ車ではなさそうですが、色や形などほとんど同じ車が田舎上空を飛行する動画ができました。
動画生成AIの中では続きの動画を作ろうとしても見た目が違うものが出てきてしまったりすることがありますが、Gemini Veo3では続きの動画が作れそう。

映画のような一本の動画を作りたいときに前のプロンプトの内容をしっかり認識してくれて続きの動画っを作れるのは重要な点ですね。

画像プロンプト入力もできるけど、、

最終的にこちらの画像になるような、ロゴとロゴタイプのモーショングラフィックスを作成してください。音は動きに合わせて近未来感のある風の音を加えてください。

なんだこれ、全然違うロゴが出てきました。画像プロンプト入力ができるようになったとは聞いていましたがこのロゴ画像は認識できていないのでしょうか。

文字のプロンプトだけの指示はよく認識できていて音も希望どおりでした。

画像の認識はできているみたい

お城の画像のみを貼り付けて送信してみました。すると画像とは違うお城ですが動画を作成してくれました。画像自体は読み込めているようですね。画像を動かしたりするのには現時点でのGemini Veo3は向いていないようです。

Veo3のここが凄い！主な特徴

Veo3は、先行する他の動画生成AIにはない、いくつかの革新的な機能を搭載しています。

1. 世界初！音声付きの動画生成とリップシンク

Veo3最大の特徴は、映像と同時に環境音、効果音、さらには登場人物のセリフといった音声まで生成できる点です。

例えば、「猫が鳴きながら歩いている」と指示すれば、その動きだけでなく鳴き声も生成します。さらに、人物が話すシーンでは、口の動きとセリフが自然に一致する「リップシンク」にも対応しており、これまでの動画生成AIとは一線を画すリアリティを実現しています。

2. 驚異的なプロンプト理解力と表現の多様性

専門的な映像表現: 「夕暮れ時の街をドローンで空撮した映画的な映像」「花が咲くまでのタイムラプス」といった、専門的なカメラワークや映像技術を指定するだけで、意図した通りの動画を生成します。
スタイルの一貫性: テキストだけでなく、参考となる画像を一緒に読み込ませることで、動画全体の画風や雰囲気をその画像に合わせることが可能です。
物理法則の理解: 生成される映像は、現実世界の物理法則を反映しており、物体の動きや光の当たり方などが非常に自然です。

3. フルHDではないのが惜しい。

現在は720p解像度での８秒間の動画生成になります。FHDに対応していないのが惜しい点ですがいずれ搭載されるのを待ちましょう。

また、既存の動画を読み込ませて、動画内の一部を別のものに差し替えたり（インペインティング）、オブジェクトを追加・削除したりするといった高度な編集も可能です。最近では、1枚の画像から動画を生成する「Image-to-Video (i2v)」機能も追加され、活用の幅がさらに広がっています。

ライバル「Sora」との比較

動画生成AIの代名詞ともいえるOpenAIの「Sora」とVeo3は、どちらが優れているのでしょうか。現時点での主な違いを比較してみましょう。

機能	Google Veo3	OpenAI Sora
音声生成	可能（環境音、セリフ、リップシンク対応）	不可
生成時間	最大8秒程度	最大60秒
解像度	最大720p	最大1080p
編集機能	高度な編集機能（インペインティング等）	限定的
一般公開	限定的に開始（有料プラン）	未定

結論として、現時点では「音声を含めた統合的なコンテンツ制作」ではVeo3が、「映像の長さ」ではSoraが優位に立っていると言えます。 Veo3はクリエイター向けの編集ツールとしての側面が強く、Soraは純粋な映像生成能力で高いポテンシャルを示しています。

Veo3の活用が期待される分野

Veo3の登場により、様々な分野で革命が起きるかも。例えば、

映画・アニメ制作: 撮影前のイメージ共有（プリビズ）や、本編の背景、簡単なカットなどに活用することで、制作コストと時間を大幅に削減できます。
広告・マーケティング: 膨大なパターンの動画広告を短時間で生成し、効果測定を行いながら最適化していくことが容易になります。
教育: 歴史的な出来事や科学的な現象など、言葉だけでは伝えにくい内容を視覚的に分かりやすい動画教材として提供できます。
SNS・個人クリエイター: 専門知識や高価な機材がなくても、誰でも手軽に高品質なショート動画を制作し、発信することが可能になります。

Veo3の利用方法

月額2900円（税込み）でGemini AI Proを使うことができます。ちなみに大学生などの学生は15か月無料のキャンペーンを行っているのでぜひ使って試してみてくださいね。

学生向けGeminiアップグレード

まとめ│Veo3はポテンシャルを秘めている

GoogleのVeo3は、「音声生成」という決定的な強みを持ち、動画生成AIの新たな地平を切り開きました。まだ発展途上の技術であり、倫理的な課題も残されていますが、そのポテンシャルは計り知れません。

クリエイティブの世界だけでなく、私たちの生活や社会のあり方をも大きく変える可能性を秘めたVeo3の今後の動向から、目が離せません。

TEKUNOTESをシェア！

URLをコピーしました！

これで映画も作れる！？画像入力ができる動画生成AI「Veo3」試してみた。

【レビュー】Gemini Veo3で画像から動画が作れるように！「i2v」プロンプトのコツとは

カメラの視点を指示できる

続きの動画も作れるみたい

画像プロンプト入力もできるけど、、

画像の認識はできているみたい