前回の記事で、Veo 3.1 を使った動画制作の課題として「静止画でキャラデザを先に固めるべきだった」という反省点を挙げました。
動画制作のワークフロー 準備編1 - Veo 3.1 で動画を作る前に知っておきたいこと
本記事では、その具体的な実践編として、2026年現在の主要な画像生成AIの比較と、動画制作を前提としたキャラクターデザインのワークフローを解説します。
なぜ動画生成の前に静止画が必要なのか
動画生成AIは1回の生成に時間もコストもかかります。Veo 3.1 の場合、8秒の動画生成に約180円〜480円、さらにレート制限(1日10〜20回)もあるため、理想の人物が出るまで何度も回すのは現実的ではありません。
動画生成で直面する問題
| 問題 | 詳細 |
|---|---|
| 毎回顔が変わる | 同じプロンプトでも異なる顔・体型の人物が生成される |
| 試行錯誤のコストが高い | 1回の生成に数分+数百円かかる |
| レート制限 | Veo 3.1 Fast は1日20回まで |
| 合成時の不整合 | 影の向き、アングル、サイズ感がバラバラ |
静止画生成のメリット
- 速いな1枚数秒〜数十秒で生成
- 安いな無料〜数円/枚
- 試行錯誤しやすいな何度でもバリエーションを出せる
結論:キャラクターの顔・衣装・ポーズは静止画で詰めてから、動画生成に進むべきです。
モデルとプラットフォームの違いを理解する
画像生成AIを選ぶ前に、「モデル」と「プラットフォーム」の違いを理解しておくと、料金体系や商用利用の判断がしやすくなります。
モデル(Model)= AI の頭脳
画像を生成する「エンジン」そのもの。トレーニングされた AI の本体です。
| モデル | 開発元 | 公開状況 |
|---|---|---|
| Imagen 4 | クローズド(Google専用) | |
| Nano Banana (Gemini 2.5 Flash Image) | クローズド(Google専用) | |
| FLUX.1 Dev / Schnell | Black Forest Labs | オープンソース |
| Stable Diffusion | Stability AI | オープンソース |
プラットフォーム(Platform)= AI を動かす場所
モデルを実行するための「サービス・環境」。同じモデルでも複数のプラットフォームで使えます。
| プラットフォーム | 使えるモデル |
|---|---|
| Google AI Studio | Imagen 4 |
| Gemini | Nano Banana |
| Leonardo.ai | FLUX、独自モデル等 |
| Civitai | FLUX、Stable Diffusion等 |
| ローカルPC(ComfyUI等) | オープンソースモデル全般 |
モデル自体は無料でも、動かすためのGPU・サーバー代 がかかります。
Leonardo.ai のクレジットは「うちのサーバーでモデルを動かす代金」であり、モデル利用料とは別です。
画像生成AI 比較表(2026年2月時点)
実際にキャラクターデザインを試した結果をもとに比較します。
| モデル | 商用利用 | 実写品質 | 日本人 | 全身 | 料金 |
|---|---|---|---|---|---|
| Imagen 4 | ⚠️ 有料プランで可 | ◎ | ◎ | ○ | 無料枠あり、$0.04/枚〜 |
| Nano Banana (Gemini) | ⚠️ プレビュー版 | ◎ | ◎ | ◎ | 無料 |
| FLUX.1 Pro | ✅ | ◎ | △ | ◎ | 約$0.05/枚 |
| FLUX.1 Dev | ⚠️ 画像は可、サービス提供は不可 | ◎ | △ | ◎ | 無料(ローカル可) |
| FLUX.1 Schnell | ✅ Apache 2.0 | ○ | △ | ◎ | 無料 |
| Leonardo.ai | ✅ 有料プラン | ◎ | ○ | ◎ | 150クレジット/日 |
各モデル(サービス)の特徴と使い方
Imagen 4(Google AI Studio)
URL: https://aistudio.google.com/
特徴
- 日本人の実写画像が自然
- プロンプト追従性が高い
- Google AI Studio から無料で試せる
- 英語プロンプトのみ
- 商用利用は有料プラン($0.04/枚〜)
Nano Banana(Gemini)
URL: https://gemini.google.com/
特徴
- 完全無料
- 日本語プロンプト対応
- 1-2秒で生成(超高速)
- 同一キャラクター維持機能(プレビュー)
- SynthID 透かしが埋め込まれる
Leonardo.ai
URL: https://leonardo.ai/
特徴
- モデル選択肢が豊富(FLUX、PhotoReal等)
- UI が整っている
- 150クレジット/日の無料枠
ローカル環境での画像生成について
高性能なGPU(VRAM 12GB以上推奨)があれば、プラットフォームのクレジットを気にせず自由に生成できます。
| 環境 | FLUX.1 Dev | Stable Diffusion XL |
|---|---|---|
| RTX 3060 12GB | ✅ 動く(30秒〜1分/枚) | ✅ 快適(10〜30秒/枚) |
| RTX 4070 以上 | ✅ 快適 | ✅ 快適 |
| Mac M1/M2 | ⚠️ 厳しい(MPS最適化不十分) | △ 動くが遅い |
Mac の場合は Gemini / Google AI Studio を使う方が現実的です。
ワークフロー
本シリーズで解説してきた内容を統合したワークフローです。
Phase 1:キャラクターデザイン(本記事)
- Gemini(Nano Banana) または Google AI Studio(Imagen 4) でキャラデザ画像を生成
- 全身図(正面)を確定
- 必要に応じてバリエーション(斜め、表情違い等)を作成
Phase 2:プロンプトテンプレート作成(キーワード集参照)
キャラクターごとに以下の要素を固定します。
[共通設定]
- カメラアングル: eye level camera
- 照明: no shadow, even flat lighting
- 背景: pure white void background
- 品質: photorealistic, 4K
[キャラ固有設定]
- 年齢・性別・国籍
- 体格・髪型・髪色
- 服装の詳細
- ポーズ・表情
Phase 3:動画生成(Veo記事参照)
- 静止画で確定したデザインを参照して動画用プロンプトを作成
- Veo 2.0 または Veo 3.1 Fast で生成(レート制限を考慮)
- 合成が必要なカットは縦長・影なしで個別生成
Phase 4:ポストプロダクション
- Premiere Pro / DaVinci で編集・合成
- カラーグレーディングで全体のトーン統一
まとめ
動画生成AIでキャラクター動画を作る際の教訓をまとめます。
- 静止画でキャラデザを固めてから動画生成に進むべき
- モデルとプラットフォームは別物。同じモデルでも動かす場所で料金が変わる
- 日本人キャラには Imagen 4 か Nano Banana が相性良い
- 合成前提なら影を落とさない(
no shadow, even flat lighting) - 全身を出すには
showing down to the toesまで強調
動画生成AIは便利ですが、事前準備(構成案・キャラデザ・素材準備)をしっかり固めることで、試行錯誤の回数を大幅に減らせます。
関連記事
動画制作のワークフロー 準備編1 - Veo 3.1 で動画を作る前に知っておきたいこと
画像生成AIプロンプト:動画スタイルを統一するコツとキーワード集

