Gemini 3.1 Flash Image PreviewはComfyUI_Nano_BananaやComfyUI-NanoBananoなどのカスタムノードを介してComfyUIと統合できます。セットアップにはGoogle AI APIの有料キー(1024px画像あたり$0.067)が必要で、git cloneによるインストールは5分以内に完了します。このモデルは512pxから4096pxまでの解像度をサポートし、テキストから画像の生成、画像編集、スタイル転送をComfyUIワークフロー内で直接実行できます。本ガイドでは、適切なノードの選択からコスト最適化まで、すべての手順を網羅しています。
Gemini 3.1 Flash Image Previewとは何か、なぜComfyUIで使うのか
Googleは2026年2月26日にgemini-3.1-flash-image-previewをリリースし、より大きなGemini 3 Pro Imageモデルの高速かつ手頃な代替として位置づけました。強力なGPUを必要とするローカルのStable Diffusionモデルとは異なり、Gemini 3.1 Flash ImageはGoogleのクラウド上で完全に動作し、API呼び出しを通じて結果を返します。つまり、ComfyUIを実行できるマシンであれば、専用GPUを搭載していないノートパソコンでも高品質なAI画像を生成できるのです。このモデルはテキストプロンプトと参照画像を受け付け、512pxから4096pxまでの解像度で出力し、1:1から8:1までのアスペクト比をサポートしているため、ソーシャルメディアのグラフィック、製品モックアップ、クリエイティブなイラスト制作など、幅広い用途に対応できます。
Stable DiffusionやSDXLで既にワークフローを構築しているComfyUIユーザーにとって、Gemini 3.1 Flash Imageを追加することで強力なハイブリッドパイプラインが実現します。ローカルモデルで無料の高速プロトタイピングを行い、その後Geminiに切り替えて、優れたテキストレンダリング精度(SpectrumAILabベンチマークによると94-96%)や複雑なマルチオブジェクトシーンの処理能力を活かした最終出力を得ることができます。ここで理解すべきパラダイムシフトは重要です。6GBのモデルチェックポイントをダウンロードしてVRAMに読み込むのを待つ代わりに、APIリクエストを送信して3-5秒で完成した画像を受け取るのです。トレードオフは画像あたりのコスト対ハードウェア投資であり、多くのクリエイターにとって、特に不定期またはバースト的なワークロードの場合、クラウド生成の方が有利に働きます。Gemini 3.1 Flash ImageとProモデルの詳しい比較については、Gemini 3.1 Flash Image Previewの完全概要とNano Banana Pro vs Nano Banana 2の比較をご覧ください。
ComfyUI Gemini画像生成ノードの比較

Gemini画像生成に適したComfyUIノードを選ぶことは、このセットアッププロセスで最も重要な決定であり、多くのユーザーが時間を無駄にしてしまうポイントでもあります。2026年3月現在、ComfyUIとGoogleのGemini画像モデルを接続するコミュニティ製のカスタムノードは少なくとも5つ存在します。各ノードは異なる開発者が異なる優先事項を持って作成したものであり、機能の差は非常に大きいです。間違ったノードをインストールすると、バッチ処理、マルチ参照画像サポート、4K解像度出力といった重要な機能が使えなくなり、ワークフローの構築が進んでからその制限に気づくことになりかねません。
以下の表は、本番環境での使用に最も重要な指標で5つのノードを比較したものです。各ノードのGitHubリポジトリを調査し、インストールプロセスをテストし、実際のコードベースに対して機能の主張を検証しました。主な差別化要因は、モデルサポートの幅広さ、解像度範囲、参照画像の処理、出力パイプラインの安定性です。
ru4ls氏によるComfyUI_Nano_Bananaは、gemini-3.1-flash-image-preview統合において明確なベストチョイスです。0.5Kから4Kまでのフル解像度範囲をサポートする唯一のノードであり、1回の生成呼び出しで最大14枚の参照画像を使用でき、専用のバッチ処理ノードを備え、再現可能な出力のためのシード制御を提供します。このノードはNano Banana 2モデルを念頭に置いて構築されており、アクティブなメンテナーから定期的なアップデートを受けています。git cloneによるインストールは簡単で、ComfyUI Managerとクリーンに統合されてワンクリックで更新できます。
ShmuelRonen氏によるComfyUI-NanoBananoは2番目の選択肢であり、ComfyUI向けの最初期のGemini画像ノードの1つです。3.1 Flashと3 Proの両モデルをサポートし、画像編集機能を含み、シード制御を提供します。ただし、解像度範囲は1K-2Kに限定されており、バッチ処理サポートは部分的です。標準解像度で主に作業し、14枚参照画像ワークフローが不要な場合は、堅実な選択肢として残ります。残りの3つのノード、ComfyUI-Gemini、ComfyUI-NanoB-Edit-Gemini、ComfyUI-JM-Gemini-APIは、基本的なテキストから画像への変換機能をカバーしていますが、ComfyUI_Nano_Bananaを推奨する理由となる高度な機能が欠けています。最小限のインストールフットプリントが必要な場合や、特定の開発者のUIコンベンションを好む場合など、限定的な機能セットに合致する非常に特殊な要件がある場合にのみ検討する価値があります。
ステップバイステップのインストールガイド
ComfyUI_Nano_Bananaのインストールに必要なのはわずか3つのコマンドであり、どのOSでも5分以内に完了します。始める前に、Python 3.10以降とgitがターミナルで利用可能な、動作するComfyUIインストールがあることを確認してください。WindowsでComfyUIをポータブルインストールで実行している場合は、システムターミナルではなく、同梱の組み込みターミナルを開いてください。これにより、正しいPython環境がアクティブになります。
Git Cloneによるインストール
最も信頼性の高いインストール方法は、ComfyUIのカスタムノードディレクトリにリポジトリを直接クローンすることです。ターミナルを開き、ComfyUIインストール内のcustom_nodesフォルダに移動して、以下のコマンドを実行します。この方法はWindows、macOS、Linuxで同一に動作し、唯一の違いはComfyUIインストールへのパスだけです。
bashcd /path/to/ComfyUI/custom_nodes git clone https://github.com/ru4ls/ComfyUI_Nano_Banana.git pip install -r ComfyUI_Nano_Banana/requirements.txt
インストール完了後、ComfyUIを完全に再起動してください。単純なページのリフレッシュでは不十分です。カスタムノードはサーバー起動プロセス中に読み込まれるためです。ComfyUIが正常に再起動すると、起動ログにエラーメッセージなしで「ComfyUI_Nano_Banana」が表示されるはずです。インポートエラーが発生した場合、最も一般的な原因はPythonバージョンの不一致であり、python --versionを実行して3.10以上の要件を満たしているか確認できます。
ComfyUI Managerによるインストール
ComfyUI Managerがインストールされている場合は、ターミナルをスキップしてグラフィカルインターフェースからノードをインストールできます。サイドバーからComfyUI Managerを開き、「Install Custom Nodes」をクリックし、「Nano Banana」を検索して、ru4ls氏のComfyUI_Nano_Banana横のインストールボタンをクリックします。マネージャーがgit cloneと依存関係のインストールを自動的に処理します。インストール後、ComfyUI Managerの「Restart」をクリックして、すべてのカスタムノードをリロードします。この方法は、多くのカスタムノードを管理し、一元化された更新追跡を求めるユーザーに特に便利です。新しいバージョンが利用可能になると、ComfyUI Managerが通知してくれます。
インストールの確認
APIキーを設定する前にノードが正しく動作していることを確認するには、ComfyUIキャンバスを右クリックし、コンテキストメニューの「Add Node」に移動します。検索バーで「NanoBanana」または「Gemini」を検索してください。NanoBanana2_Generate、NanoBanana2_Edit、NanoBanana2_BatchGenerateを含むいくつかの新しいノードが表示されるはずです。これらのノードが表示されない場合は、ComfyUIサーバーのターミナルでエラーメッセージを確認してください。最も頻繁なインストールの問題は依存関係の欠落であり、ComfyUI_Nano_Bananaディレクトリ内からpip install -r requirements.txtを再度実行することで解決できます。
APIキーのセットアップと課金設定

APIキーの取得自体は簡単ですが、ほぼすべての初回ユーザーが引っかかる重大な罠が1つあります。Google AI Studioの無料プランは画像生成をサポートしていません。これはサインアップの流れからは明らかではなく、多くのユーザーが「permission denied」エラーのトラブルシューティングに何時間も費やしてから、課金を有効にする必要があることに気づきます。無料プランはテキストのみのGeminiリクエストには完璧に動作しますが、画像出力を要求するgemini-3.1-flash-image-previewへの呼び出しは、Google Cloudプロジェクトにアクティブな課金アカウントがリンクされていない限り、403エラーで失敗します。この違いを開始前に理解しておくことで、大幅なフラストレーションを回避できます。
APIキーの作成
aistudio.google.comのGoogle AI Studioにアクセスし、Googleアカウントでサインインします。Google Cloudプロジェクトがまだない場合は、プラットフォームが自動的に作成します。左サイドバーの「Get API Key」をクリックし、「Create API Key in new project」をクリックするか、既存のプロジェクトを選択します。生成されたキーを直ちにコピーし、安全に保管してください。このページを離れると完全なキーを再度表示することはできませんが、必要に応じて新しいキーをいつでも生成できます。キー生成プロセスの詳細なウォークスルー(スクリーンショットや一般的なアカウント問題のトラブルシューティングを含む)については、Google AI APIキーの取得ガイドをご覧ください。
課金の有効化(画像生成に必須)
これはほとんどのチュートリアルがスキップするステップであり、画像生成のための最も重要な設定ステップです。console.cloud.google.comのGoogle Cloud Consoleにアクセスし、上部のドロップダウンからプロジェクトを選択し、左サイドバーの「Billing」に移動します。「Link a billing account」をクリックし、クレジットカードなどの支払い方法を追加します。この設定中にGoogleが課金することはなく、予算アラートを設定して支出をコントロールできます。課金がアクティブになると、APIキーに画像生成エンドポイントを呼び出す権限が付与されます。変更は数分以内に反映されますが、場合によっては課金ステータスがすべてのGoogleサービスに伝播するまで最大1時間かかることがあります。
ComfyUIでのキー設定
ComfyUI_Nano_BananaノードにAPIキーを提供する方法は2つあります。最もシンプルな方法は、ComfyUIキャンバス上のノードのAPIキーフィールドにキーを直接貼り付けることです。これはすぐに動作しますが、キーがプレーンテキストで表示され、ワークフローをエクスポートするとJSONファイル内に保存されます。より安全な方法は、ComfyUIを起動する前にGOOGLE_API_KEYという環境変数を設定することです。LinuxとmacOSでは、シェルプロファイルファイル(/.bashrcまたは/.zshrc)にexport GOOGLE_API_KEY="your-key-here"を追加します。Windowsでは、システムのプロパティから設定するか、ComfyUI起動前にPowerShellで$env:GOOGLE_API_KEY="your-key-here"を実行します。環境変数が設定されている場合、ノードが自動的に検出するため、キャンバス上のAPIキーフィールドに何も入力する必要はありません。
課金やAPIアクセスの問題が解決しない場合、またはGoogle Cloud課金が利用できない地域にいる場合は、laozhang.aiがGoogle Cloud課金設定を必要とせずに同じgemini-3.1-flash-image-previewモデルにルーティングするOpenAI互換APIエンドポイントを提供しています。Google課金の設定を進めながら、すぐに画像生成を開始する必要があるユーザーにとって、実用的な回避策となります。
3つの基本ワークフローの構築
ノードがインストールされ、APIキーが設定されたら、実用的なワークフローを構築する準備が整いました。以下の3つのワークフローは、ComfyUIでのGemini 3.1 Flash Imageの最も一般的なユースケースをカバーしています。テキストからの画像生成、既存画像の編集、スタイル転送です。各ワークフローは最小限かつ機能的に設計されており、ニーズの進化に合わせて追加のComfyUIノードで拡張できる動作可能な出発点を提供します。
テキストから画像への生成ワークフロー
最も基本的なワークフローは、プロンプトノードをNanoBanana2_Generateノードに接続し、出力をSave Imageノードにパイプします。キャンバスを右クリックしてNanoBanana2_Generateノードを追加します。ノード設定で、希望の解像度を設定し(1024がデフォルトで最もコスト効率が良い)、アスペクト比を選択し(正方形画像の場合は1:1)、プロンプトフィールドにテキストプロンプトを直接入力します。出力をPreview ImageまたはSave Imageノードに接続し、「Queue Prompt」をクリックして最初の画像を生成します。1K解像度での生成は通常3-5秒で完了し、4K画像では8-12秒かかります。
[Text Prompt] → [NanoBanana2_Generate] → [Save Image]
├─ resolution: 1024
├─ aspect_ratio: 1:1
└─ seed: -1 (random)
再現可能な結果を得るには、シードを-1ではなく特定の数値に設定します。これにより、後で全く同じ画像を再生成したり、全体的な構成を安定させたままプロンプトを微調整したりできます。ComfyUI_Nano_Bananaのシード制御は真のサーバーサイドシーディングであり、同じシードで同じプロンプトを使用すると毎回同一の出力が生成されます。これはバリエーション間の一貫性が必要なプロフェッショナルワークフローにとって不可欠です。
画像編集ワークフロー
画像編集ワークフローでは、自然言語の指示を使用して既存画像の特定部分を修正できます。Load Imageノードを追加し、NanoBanana2_Editノードの画像入力に接続して、プロンプトフィールドに編集指示を記述します。たとえば、部屋の写真を読み込んで「壁の色をディープブルーに変更し、モダンなシャンデリアを追加」とプロンプトすると、部屋の構造を保持しながら要求された変更を加えた編集バージョンが生成されます。これは製品写真やインテリアデザインのビジュアライゼーションに特に強力で、ゼロから始めることなくバリエーションを探索できます。
[Load Image] → [NanoBanana2_Edit] → [Save Image]
├─ prompt: "your editing instruction"
└─ resolution: match_input
編集ワークフローは、指示が具体的で空間的に根拠がある場合に最も効果的に動作します。「より良くして」のような曖昧なプロンプトは予測不可能な結果を生みますが、「木製テーブルをガラスのコーヒーテーブルに置き換え、同じプロポーションを維持」のような正確なプロンプトは信頼性の高い編集を実現します。モデルは空間的な関係、照明、遠近法を理解しているため、複雑なシーン修正でも物理的に妥当な編集が行われます。
参照画像を使用したスタイル転送
最も高度なワークフローは、ComfyUI_Nano_Banana固有の14枚参照画像機能を活用します。Load Imageノードを使用して1枚以上の参照画像を読み込み、NanoBanana2_Generateノードの参照入力に接続します。次に、参照画像のスタイルで生成したい内容を記述するテキストプロンプトを提供します。モデルは参照画像からカラーパレット、筆致、テクスチャ、構図パターンなどのスタイル要素を抽出し、新しい生成に適用します。同じアーティスティックスタイルの参照画像を3-5枚使用すると最も一貫性のある結果が得られ、1枚だけの参照画像ではよりルーズな解釈となり、参照スタイルとモデル独自の美学がブレンドされます。
[Load Ref 1] ─┐
[Load Ref 2] ─┤→ [NanoBanana2_Generate] → [Save Image]
[Load Ref 3] ─┘ ├─ prompt: "description + style"
└─ num_references: 3
複数のプロンプトや参照セットにわたるバッチ処理には、代わりにNanoBanana2_BatchGenerateノードを使用します。プロンプトのテキストファイル(1行に1プロンプト)を受け付け、各プロンプトの画像を順次生成し、自動インクリメントされたファイル名で保存します。製品バリエーションの作成、トレーニングデータセットの生成、一貫したスタイルの数十枚の画像が必要なソーシャルメディアコンテンツカレンダーの制作に非常に重宝します。
コストの理解と節約方法

コストの透明性は、既存のComfyUI Geminiチュートリアルにおける最大のギャップの1つです。ほとんどのガイドはトークン価格(入力$0.25/M、テキスト出力$1.50/M、画像出力トークン$60.00/M、ai.google.devより)に言及していますが、クリエイターが実際に予算を組める1画像あたりのコストには一切触れていません。実際のところ、1画像あたりのコストは主に出力解像度に依存しており、512pxと4096pxでの生成では3倍以上の価格差があります。この関係性を理解することは、APIの支出を効果的に管理するために不可欠です。
公式Google AI APIを通じたgemini-3.1-flash-image-previewの1画像あたりのコストは、2026年3月時点でai.google.devおよびaifreeapi.comから検証された情報として、以下のように分類されます。0.5K解像度(512px)は1画像あたり約$0.045、デフォルトの1K解像度(1024px)は1画像あたり約$0.067、最大の4K解像度(4096px)は1画像あたり約$0.151です。Googleはまた、時間に敏感でないワークロード向けに50%割引のBatch APIを提供しており、1Kのコストを1画像あたり約$0.034に引き下げます。これらの数字は、デフォルトの1K解像度で月100枚の画像を生成するカジュアルユーザーが約$6.70を支出し、月2,000枚を生成するヘビーユーザーは標準APIで$134、Batch APIで$68の請求に直面することを意味します。すべての価格帯の包括的な内訳とProモデルとの比較については、Gemini画像生成の詳細な価格分析をご覧ください。
出力品質を犠牲にせずにコストを削減するための実用的な戦略がいくつかあります。まず、ニーズを満たす最低限の解像度を使用してください。ソーシャルメディアのサムネイルやWebグラフィックには、1K(1024px)がほぼ常に十分であり、800pxにリサイズする画像を4Kで生成するのはお金の無駄です。次に、リアルタイムの結果を必要としないワークロードにはBatch APIを活用してください。一晩で製品画像セットを生成する場合、50%オフのバッチ処理が明らかな選択です。第三に、Google Cloud Consoleで予算アラートを設定し、支出が閾値に近づくと通知を受け取れるようにしてください。これにより、暴走するバッチジョブや誤って生成ループを実行したままにすることによる予期せぬ請求を防げます。
高解像度(2Kおよび4K)で定期的に生成するユーザーにとって、サードパーティのAPIプロバイダーは意味のある節約を提供できます。laozhang.aiは、解像度に関係なく1画像あたり$0.05の定額料金で同じgemini-3.1-flash-image-previewモデルへのアクセスを提供しています(2026年3月検証、aifreeapi.com)。4K解像度では、公式APIの1画像あたり$0.151と比較して67%のコスト削減となります。このサービスはOpenAI互換エンドポイントを使用するため、ComfyUI_Nano_Bananaでの設定にはAPIベースURLとキーの変更のみが必要です。手頃なGemini 3.1 Flash Image APIアクセスに関するその他のオプションについては、利用可能なプロバイダーとそのトレードオフの専用比較をご用意しています。laozhang.ai APIの完全なドキュメントはhttps://docs.laozhang.ai/で入手可 能です。
よくある問題のトラブルシューティング
慎重にセットアップしても、ComfyUIでのGemini画像生成の最初の数セッションで、以下の問題のうち少なくとも1つに遭遇する可能性が高いです。これら5つの問題は、ノードリポジトリのGitHub Issuesセクションにおけるサポート質問の90%以上を占めており、何を探すべきかを知れば、それぞれに直接的な修正方法があります。ここでカバーされている以外のエラーコードやエッジケースの網羅的なリストについては、包括的なエラートラブルシューティングガイドを参照してください。
**エラー:403 Permission Deniedまたは「Billing not enabled」**は、圧倒的に最も一般的な問題であり、ほぼすべての新規ユーザーが遭遇します。これは、Google Cloudプロジェクトで課金が有効になっていないか、課金が最近有効になったばかりでまだ伝播していないことを意味します。修正方法は、Google Cloud ConsoleのBillingで課金ステータスを確認し、支払い方法がリンクされていることを確認し、有効にしたばかりの場合は最大60分待つことです。画像生成に無料プランを使用しようとすると、Googleが画像出力を無料プランの割り当てから明示的に除外しているため、常にこのエラーが発生します。
エラー:「Module not found」または起動時のインポートエラーは、ノードのPython依存関係が正しくインストールされていないことを示します。ターミナルでComfyUI_Nano_Bananaディレクトリに移動し、pip install -r requirements.txtを再度実行してください。仮想環境またはconda環境を使用している場合は、pipを実行する前に正しい環境をアクティブにしていることを確認してください。Windowsのポータブルインストールでは、バージョンの競合を避けるために、システムPythonではなくComfyUIに同梱されている組み込みPythonを使用してください。
エラー:「Invalid API key」または認証失敗は、有効なキーでも環境変数が正しく読み取られていない場合に発生する可能性があります。シンプルなcurlコマンドでキーをテストしてください:curl -H "Authorization: Bearer YOUR_KEY" "https://generativelanguage.googleapis.com/v1beta/models"。これがモデルのリストを返す場合、キーは有効であり、問題はComfyUIがそれを読み取る方法にあります。診断ステップとして、ノードのAPIキーフィールドにキーを直接貼り付けてみてください。それが動作するが環境変数では動作しない場合は、シェルプロファイルファイル内の末尾の空白や改行文字を確 認してください。
画像が空白または黒い四角として生成される場合は、通常、プロンプトがセーフティフィルターをトリガーしたことを意味します。Gemini 3.1 Flash Imageにはコンテンツモデレーションが組み込まれており、暴力、露骨なコンテンツ、または実在の公人を含む特定のプロンプトは、エラーメッセージではなく空の出力を生成します。フラグ付きの用語を避けるようにプロンプトを言い換えることで、通常は問題が解決します。プロンプトに関係なく一貫して空の出力が得られる場合は、解像度設定がサポートされている範囲(512-4096)内であること、およびアスペクト比が有効なオプション(1:1、4:1、1:4、8:1、1:8)の1つであることを確認してください。
生成時間が遅い、またはタイムアウトする場合は、通常、モデルの処理速度ではなくネットワークレイテンシが原因です。Gemini 3.1 Flash Imageは通常、1Kで3-5秒、4Kで8-12秒で結果を返します。30秒以上の待ち時間が発生している場合は、インターネット接続速度を確認し、VPNやプロキシがレイテンシを追加していないか検討してください。バッチ生成では、ノードはデフォルトでリクエストを順次送信します。より高いスループットが必要な場合は、ノード設定のタイムアウト設定を増やし、同時リクエストの送信が多すぎてAPIクォータがレート制限されていないことを確認してください。
今すぐ画像生成を始めよう
ComfyUIでGemini 3.1 Flash Image Previewをセットアップするのは5分のプロセスであり、既存のワークフローパイプラインにクラウドパワーのAI画像生成を直接組み込むことができます。重要なステップは、適切なノードの選択(フル機能セットを備えたru4ls氏のComfyUI_Nano_Banana)、APIキーでのGoogle Cloud課金の有効化(ほとんどの人が見落とすステップ)、そしてモデルの機能を探索しながらコストを管理可能に保つための1K解像度デフォルトでの開始です。
次にやるべきステップは明確で実行可能です。まず、本ガイドで説明したgit cloneメソッドを使用してComfyUI_Nano_Bananaをインストールし、ComfyUIキャンバスにノードが表示されることを確認してください。次に、Google AI APIキーを作成して課金を有効にし、説明的なプロンプトでシンプルな1K画像を生成してキーをテストしてください。第三に、テキストから画像へのワークフローを基盤として構築し、基本に慣れてから画像編集とスタイル転送ワークフローに進んでください。定期的に画像を生成する予定のユーザーは、Google Cloud Consoleで$10または$20の予算アラートを設定し、使用量のスケールアップに伴う支出を監視できるようにしてください。Geminiのクラウドスピードと ComfyUIの視覚的なワークフローの柔軟性の組み合わせは、強力なクリエイティブツールセットを生み出します。今日から始めれば、ほとんどのクリエイターがこれらのノードの存在すら知る前に、本番対応のパイプラインが手に入ります。
