前回の記事で、Veo 3.1 を使った動画制作の課題として「静止画でキャラデザを先に固めるべきだった」という反省点を挙げました。

動画制作のワークフロー 準備編1 - Veo 3.1 で動画を作る前に知っておきたいこと Google Veo 3.1 で動画を生成する際の料金体系・レート制限・プロンプト設計のコツを解説。一発で理想の人物を出すのが難しい理由と、静止画でキャラデザを固めてから動画生成に進む推奨ワークフローをまとめました。  続きを読む

本記事では、その具体的な実践編として、2026年現在の主要な画像生成AIの比較と、動画制作を前提としたキャラクターデザインのワークフローを解説します。


    なぜ動画生成の前に静止画が必要なのか

    動画生成AIは1回の生成に時間もコストもかかります。Veo 3.1 の場合、8秒の動画生成に約180円〜480円、さらにレート制限(1日10〜20回)もあるため、理想の人物が出るまで何度も回すのは現実的ではありません。

    動画生成で直面する問題

    問題 詳細
    毎回顔が変わる 同じプロンプトでも異なる顔・体型の人物が生成される
    試行錯誤のコストが高い 1回の生成に数分+数百円かかる
    レート制限 Veo 3.1 Fast は1日20回まで
    合成時の不整合 影の向き、アングル、サイズ感がバラバラ

    静止画生成のメリット

    • 速いな1枚数秒〜数十秒で生成
    • 安いな無料〜数円/枚
    • 試行錯誤しやすいな何度でもバリエーションを出せる

    結論:キャラクターの顔・衣装・ポーズは静止画で詰めてから、動画生成に進むべきです。


    モデルとプラットフォームの違いを理解する

    画像生成AIを選ぶ前に、「モデル」と「プラットフォーム」の違いを理解しておくと、料金体系や商用利用の判断がしやすくなります。

    モデル(Model)= AI の頭脳

    画像を生成する「エンジン」そのもの。トレーニングされた AI の本体です。

    モデル 開発元 公開状況
    Imagen 4 Google クローズド(Google専用)
    Nano Banana (Gemini 2.5 Flash Image) Google クローズド(Google専用)
    FLUX.1 Dev / Schnell Black Forest Labs オープンソース
    Stable Diffusion Stability AI オープンソース

    プラットフォーム(Platform)= AI を動かす場所

    モデルを実行するための「サービス・環境」。同じモデルでも複数のプラットフォームで使えます。

    プラットフォーム 使えるモデル
    Google AI Studio Imagen 4
    Gemini Nano Banana
    Leonardo.ai FLUX、独自モデル等
    Civitai FLUX、Stable Diffusion等
    ローカルPC(ComfyUI等) オープンソースモデル全般

    モデル自体は無料でも、動かすためのGPU・サーバー代 がかかります。
    Leonardo.ai のクレジットは「うちのサーバーでモデルを動かす代金」であり、モデル利用料とは別です。


    画像生成AI 比較表(2026年2月時点)

    実際にキャラクターデザインを試した結果をもとに比較します。

    モデル 商用利用 実写品質 日本人 全身 料金
    Imagen 4 ⚠️ 有料プランで可 無料枠あり、$0.04/枚〜
    Nano Banana (Gemini) ⚠️ プレビュー版 無料
    FLUX.1 Pro 約$0.05/枚
    FLUX.1 Dev ⚠️ 画像は可、サービス提供は不可 無料(ローカル可)
    FLUX.1 Schnell ✅ Apache 2.0 無料
    Leonardo.ai ✅ 有料プラン 150クレジット/日

    各モデル(サービス)の特徴と使い方

    Imagen 4(Google AI Studio)

    URL: https://aistudio.google.com/

    特徴

    • 日本人の実写画像が自然
    • プロンプト追従性が高い
    • Google AI Studio から無料で試せる
    • 英語プロンプトのみ
    • 商用利用は有料プラン($0.04/枚〜)

    Nano Banana(Gemini)

    URL: https://gemini.google.com/

    特徴

    • 完全無料
    • 日本語プロンプト対応
    • 1-2秒で生成(超高速)
    • 同一キャラクター維持機能(プレビュー)
    • SynthID 透かしが埋め込まれる

    Leonardo.ai

    URL: https://leonardo.ai/

    特徴

    • モデル選択肢が豊富(FLUX、PhotoReal等)
    • UI が整っている
    • 150クレジット/日の無料枠

    ローカル環境での画像生成について

    高性能なGPU(VRAM 12GB以上推奨)があれば、プラットフォームのクレジットを気にせず自由に生成できます。

    環境 FLUX.1 Dev Stable Diffusion XL
    RTX 3060 12GB ✅ 動く(30秒〜1分/枚) ✅ 快適(10〜30秒/枚)
    RTX 4070 以上 ✅ 快適 ✅ 快適
    Mac M1/M2 ⚠️ 厳しい(MPS最適化不十分) △ 動くが遅い

    Mac の場合は Gemini / Google AI Studio を使う方が現実的です。


    ワークフロー

    本シリーズで解説してきた内容を統合したワークフローです。

    Phase 1:キャラクターデザイン(本記事)

    1. Gemini(Nano Banana) または Google AI Studio(Imagen 4) でキャラデザ画像を生成
    2. 全身図(正面)を確定
    3. 必要に応じてバリエーション(斜め、表情違い等)を作成

    Phase 2:プロンプトテンプレート作成(キーワード集参照)

    キャラクターごとに以下の要素を固定します。

    [共通設定]
    - カメラアングル: eye level camera
    - 照明: no shadow, even flat lighting
    - 背景: pure white void background
    - 品質: photorealistic, 4K
    
    [キャラ固有設定]
    - 年齢・性別・国籍
    - 体格・髪型・髪色
    - 服装の詳細
    - ポーズ・表情
    

    Phase 3:動画生成(Veo記事参照)

    1. 静止画で確定したデザインを参照して動画用プロンプトを作成
    2. Veo 2.0 または Veo 3.1 Fast で生成(レート制限を考慮)
    3. 合成が必要なカットは縦長・影なしで個別生成

    Phase 4:ポストプロダクション

    1. Premiere Pro / DaVinci で編集・合成
    2. カラーグレーディングで全体のトーン統一

    まとめ

    動画生成AIでキャラクター動画を作る際の教訓をまとめます。

    1. 静止画でキャラデザを固めてから動画生成に進むべき
    2. モデルとプラットフォームは別物。同じモデルでも動かす場所で料金が変わる
    3. 日本人キャラには Imagen 4 か Nano Banana が相性良い
    4. 合成前提なら影を落とさないno shadow, even flat lighting
    5. 全身を出すには showing down to the toes まで強調

    動画生成AIは便利ですが、事前準備(構成案・キャラデザ・素材準備)をしっかり固めることで、試行錯誤の回数を大幅に減らせます


    関連記事

    動画制作のワークフロー 準備編1 - Veo 3.1 で動画を作る前に知っておきたいこと Google Veo 3.1 で動画を生成する際の料金体系・レート制限・プロンプト設計のコツを解説。一発で理想の人物を出すのが難しい理由と、静止画でキャラデザを固めてから動画生成に進む推奨ワークフローをまとめました。  続きを読む 画像生成AIプロンプト:動画スタイルを統一するコツとキーワード集 動画を作成するとき、「カメラアングルがバラバラで違和感が出る」「スタイルが統一されない」といった問題に直面していませんか? 本記事では、違和感をなくすためのプロンプト設計を中心に、「プロンプトの基本構造と記述順序」「スタイル・雰囲気を維持するためのコツ」「キ...  続きを読む

    関連リンク