Google の動画生成AI「Veo 3.1」を使えば、テキストプロンプトから映画のような動画が作れます。しかし実際に使ってみると、事前準備なしで一発で理想の動画を生成するのは難しいことがわかりました。
この記事では、Veo 3.1 で動画を作成した際の反省点と、次回以降に活かすためのワークフローをまとめます。
Veo 3.1 の料金体系とレート制限
Google AI Studio での料金
Veo 3.1 は Google AI Studio から API 経由で利用できます。料金は秒単位の従量課金です。
| モデル | 料金/秒 | 8秒動画の料金 | 特徴 |
|---|---|---|---|
| Veo 3.1 Standard | $0.40 | 約 $3.20(¥480) | 最高品質、1080p |
| Veo 3.1 Fast | $0.15 | 約 $1.20(¥180) | 高速・低コスト、720p |
| Veo 2.0 | $0.35 | 約 $2.80(¥420) | レート制限が緩い |
Google Cloud の無料クレジット($300 / 約¥45,000) を使えば、Veo 3.1 Fast の8秒動画を 約240本 生成できます。有効期限は90日間なので、試行錯誤には十分な量です。
レート制限に注意
Veo 3.1 / Veo 3.1 Fast には厳しいレート制限があります。
| モデル | RPM(1分あたり) | RPD(1日あたり) |
|---|---|---|
| Veo 3.1 Fast | 3 | 20 |
| Veo 3.1 | 2 | 10 |
連続して生成していると、すぐに制限に達して待ち時間が発生します。
Veo 2.0 はレート制限が緩いため、大量生成が必要な場合は Veo 2.0 を検討する価値があります。
Flow での無料枠
Google の動画編集ツール「Flow」では、毎月100クレジットが無料で付与されます。
ただし Veo 3.1 Fast でも1回20クレジット 消費するため、月5回しか生成できません。本格的に使うなら API 経由がおすすめです。
実際にやってみてわかった課題
課題1:一発で理想の人物を出すのは難しい
「30代後半の日本人男性、銀髪オールバック、鋭い目つき」とプロンプトに書いても、毎回異なる顔・体型の人物が生成されます。
複数カットで同一人物を登場させたい場合、動画ごとに顔が変わってしまうと一貫性がなくなります。
課題2:コンテンツポリシーの制限
年齢や衣装に関するプロンプトは、コンテンツポリシーに抵触して生成できないことがあります。
| プロンプト | 結果 |
|---|---|
A twenty-year-old woman |
✅ 生成可能 |
A teenage girl |
❌ 制限で生成不可 |
school uniform |
❌ 制限で生成不可の場合あり |
年齢は「twenty-year-old」以上を明示し、衣装も制服系は避けるのが無難です。
課題3:合成用素材の影とアングル問題
複数の動画を合成して1つのシーンを作ろうとした場合、以下の問題が発生しました。
| 問題 | 原因 | 対策 |
|---|---|---|
| 影の向きがバラバラ | 各動画で照明条件が異なる | no shadow, even flat lighting を指定 |
| 上からのアングルになる | dramatic shadow や intimidating glare が原因 |
eye level camera, neutral gaze を指定 |
| 人物のサイズ感・アングルが合わない | 引き・寄りの基準が不統一 | full body visible head to toe を明示 |
合成を前提とするなら、影を落とさない均一なライティングが重要です。
反省点:先に静止画でキャラデザを固めるべきだった
今回最大の反省点は、いきなり動画生成から始めてしまったことです。
動画生成AIは1回の生成に時間もコストもかかります。理想の人物が出るまで何度も回すのは非効率です。
推奨ワークフロー
❌ 今回のワークフロー(非効率)
プロンプト作成 → 動画生成 → イメージと違う → プロンプト修正 → 動画生成...
✅ 推奨ワークフロー
1. 静止画生成AIでキャラクターデザイン画を作成(全身図・正面図まで)
2. デザインが固まったら、その画像を参照して動画生成
3. 動画は微調整のみ
静止画生成は動画より圧倒的に速く・安いため、キャラクターの顔・衣装・ポーズは先に静止画で詰めるべきでした。
キャラデザに使える静止画生成AI
| ツール | 特徴 | 用途 |
|---|---|---|
| Midjourney | 高品質、スタイル制御しやすい | メインのキャラデザ |
| FLUX | 無料、プロンプト追従性が高い | バリエーション出し |
| Imagen 3 | Google製、Veo との親和性 | Veo 用の参照画像作成 |
| Adobe Firefly | 商用利用OK、CC連携 | 実務案件向け |
今後のワークフロー(改善版)
次回以降は、以下のワークフローで進める予定です。
Phase 1:キャラクターデザイン(静止画)
- Midjourney / FLUX でキャラデザ画像を生成
- 全身図(正面)を確定
- 必要に応じてバリエーション(斜め、表情違い等)
Phase 2:動画構成
- シーン割り・動画構成案(コンテ)を作成
- 各カットに必要な動き・カメラワークを定義
- 参照画像を準備
Phase 3:動画生成
- Veo 2.0 または Veo 3.1 Fast で生成(レート制限を考慮)
- 合成が必要なカットは縦長・影なしで個別生成
- 品質重視のカットのみ Veo 3.1 Standard を使用
Phase 4:ポストプロダクション
- Premiere Pro / DaVinci で編集・合成
- 必要に応じて Topaz Video AI でアップスケール
- カラーグレーディングで全体のトーン統一
まとめ
Veo 3.1 で動画を作成する際の教訓をまとめます。
- 静止画でキャラデザを固めてから動画生成に進むべき
- Veo 3.1 / Fast はレート制限がきつい。大量生成なら Veo 2.0 を検討
- 合成前提なら影を落とさない(
no shadow, even flat lighting) - 年齢・衣装のプロンプトはコンテンツポリシーに注意
動画生成AIは便利ですが、事前準備(構成案・キャラデザ・素材準備)をしっかり固めることで、試行錯誤の回数を大幅に減らせます。
最初の準備に時間をかけることが、結果的に最短ルートになる。これが今回の最大の学びでした。
関連記事
Adobe Firefly で写真から動画生成したらすごかった!CC Proプランなら無料で使える
動画制作のワークフロー:【Gemini×Remotion】でテロップ制作を自動化する

