Интеграция Gemini 3.1 Flash Image Preview с ComfyUI: полное руководство (2026)

AI Free API Team

•7 мар. 2026 г.•26 мин чтения•Генерация изображений

Полное руководство по интеграции gemini-3.1-flash-image-preview с ComfyUI. Сравнение всех 5 нод, пошаговая настройка API ключей и биллинга, 3 готовых рабочих процесса и способы снизить стоимость с $0.151 до $0.05 за изображение.

Интеграция Gemini 3.1 Flash Image Preview с ComfyUI: полное руководство (2026)

Gemini 3.1 Flash Image Preview интегрируется с ComfyUI через пользовательские ноды, такие как ComfyUI_Nano_Banana и ComfyUI-NanoBanano. Для настройки требуется платный API-ключ Google AI ($0.067 за изображение 1024px), а установка занимает менее 5 минут через git clone. Модель поддерживает разрешения от 512px до 4096px, генерацию изображений по текстовому описанию, редактирование изображений и перенос стиля непосредственно в рабочих процессах ComfyUI. Это руководство охватывает все шаги, от выбора правильной ноды до оптимизации затрат.

Что такое Gemini 3.1 Flash Image Preview и зачем использовать его в ComfyUI

Google выпустила gemini-3.1-flash-image-preview 26 февраля 2026 года, позиционируя её как быструю и доступную альтернативу более крупной модели Gemini 3 Pro Image. В отличие от локальных моделей Stable Diffusion, которые требуют мощного GPU, Gemini 3.1 Flash Image полностью работает в облаке Google и выдаёт результаты через вызов API. Это означает, что вы можете генерировать высококачественные ИИ-изображения на любой машине, способной запустить ComfyUI, даже на ноутбуке без выделенной видеокарты. Модель принимает текстовые промпты и референсные изображения, выводит результат в разрешениях от 512px до 4096px и поддерживает соотношения сторон от 1:1 до 8:1, что делает её достаточно универсальной как для графики в социальных сетях, так и для макетов продуктов и творческих иллюстраций.

Для пользователей ComfyUI, которые уже имеют устоявшиеся рабочие процессы со Stable Diffusion или SDXL, добавление Gemini 3.1 Flash Image создаёт мощный гибридный конвейер. Вы можете использовать локальные модели для быстрого прототипирования без затрат, а затем переключаться на Gemini для финальных результатов, которые выигрывают за счёт превосходной точности рендеринга текста (94-96% по данным бенчмарков SpectrumAILab) и способности обрабатывать сложные сцены с множеством объектов. Важно понимать суть этого сдвига парадигмы: вместо скачивания чекпоинта модели объёмом 6 ГБ и ожидания загрузки в VRAM, вы отправляете API-запрос и получаете готовое изображение за 3-5 секунд. Компромисс заключается в стоимости за изображение по сравнению с инвестициями в оборудование, и для многих создателей расчёт явно склоняется в пользу облачной генерации, особенно при нерегулярных или пиковых нагрузках. Если вы хотите глубже разобраться в том, чем Gemini 3.1 Flash Image отличается от модели Pro, ознакомьтесь с нашим полным обзором Gemini 3.1 Flash Image Preview и сравнением Nano Banana Pro и Nano Banana 2.

Сравнение нод ComfyUI для генерации изображений Gemini

Сравнительная таблица нод ComfyUI Gemini с функциями по 5 нодам

Выбор правильной ноды ComfyUI для генерации изображений Gemini — это самое важное решение, которое вам предстоит принять в процессе настройки, и именно здесь большинство пользователей тратят время впустую. По состоянию на март 2026 года существует как минимум пять пользовательских нод, созданных сообществом, которые подключают ComfyUI к моделям Gemini от Google для генерации изображений. Каждая нода создана разным разработчиком с разными приоритетами, и разрывы в функциональности между ними значительны. Установка неправильной ноды означает потерю критически важных возможностей, таких как пакетная обработка, поддержка нескольких референсных изображений или вывод в разрешении 4K, и вы можете обнаружить эти ограничения только тогда, когда будете уже глубоко погружены в рабочий процесс.

В таблице ниже сравниваются все пять нод по параметрам, которые наиболее важны для производственного использования. Мы оценили каждую ноду, изучив её репозиторий на GitHub, протестировав процесс установки и проверив заявленные функции на соответствие реальной кодовой базе. Ключевыми отличиями являются широта поддержки моделей, диапазон разрешений, обработка референсных изображений и стабильность выходного конвейера.

ComfyUI_Nano_Banana от ru4ls является безусловным лидером для интеграции gemini-3.1-flash-image-preview. Это единственная нода, которая поддерживает полный диапазон разрешений от 0.5K до 4K, позволяет использовать до 14 референсных изображений в одном запросе на генерацию, включает специализированные ноды для пакетной обработки и обеспечивает контроль seed для воспроизводимых результатов. Нода была создана специально с учётом модели Nano Banana 2 и регулярно обновляется активным разработчиком. Установка проста через git clone, и она чисто интегрируется с ComfyUI Manager для обновлений в один клик.

ComfyUI-NanoBanano от ShmuelRonen — второй лучший вариант и одна из первых нод Gemini для генерации изображений в ComfyUI. Она поддерживает модели 3.1 Flash и 3 Pro, включает возможности редактирования изображений и обеспечивает контроль seed. Однако диапазон разрешений ограничен 1K-2K, а поддержка пакетной обработки лишь частичная. Это остаётся хорошим выбором, если вы преимущественно работаете со стандартными разрешениями и не нуждаетесь в рабочем процессе с 14 референсными изображениями. Оставшиеся три ноды — ComfyUI-Gemini, ComfyUI-NanoB-Edit-Gemini и ComfyUI-JM-Gemini-API — охватывают базовую функциональность генерации изображений по тексту, но лишены продвинутых функций, которые делают ComfyUI_Nano_Banana рекомендуемым выбором. Их стоит рассматривать только при очень специфических требованиях, совпадающих с их ограниченным набором функций, например, если нужна минимальная установка или предпочтение определённых UI-конвенций конкретного разработчика.

Пошаговое руководство по установке

Установка ComfyUI_Nano_Banana требует всего три команды и занимает менее пяти минут на любой операционной системе. Перед началом убедитесь, что у вас есть работающая установка ComfyUI с Python 3.10 или новее и git, доступный в терминале. Если вы запускаете ComfyUI через портативную установку на Windows, откройте встроенный терминал, который поставляется вместе с ней, а не системный терминал, так как это обеспечивает активность правильного окружения Python.

Установка через Git Clone

Наиболее надёжный метод установки — клонирование репозитория непосредственно в директорию пользовательских нод ComfyUI. Откройте терминал, перейдите в папку custom_nodes внутри вашей установки ComfyUI и выполните следующие команды. Этот подход работает одинаково на Windows, macOS и Linux, единственное различие — путь к вашей установке ComfyUI.

bash
cd /path/to/ComfyUI/custom_nodes
git clone https://github.com/ru4ls/ComfyUI_Nano_Banana.git
pip install -r ComfyUI_Nano_Banana/requirements.txt

После завершения установки полностью перезапустите ComfyUI. Простого обновления страницы недостаточно, потому что пользовательские ноды загружаются во время запуска сервера. Когда ComfyUI успешно перезапустится, вы должны увидеть «ComfyUI_Nano_Banana» в логе запуска без каких-либо сообщений об ошибках. Если вы столкнулись с ошибками импорта, наиболее распространённая причина — несовместимость версии Python, и выполнение python --version подтвердит, соответствуете ли вы требованию 3.10+.

Установка через ComfyUI Manager

Если у вас установлен ComfyUI Manager, вы можете обойтись без терминала и установить ноду через графический интерфейс. Откройте ComfyUI Manager из боковой панели, нажмите «Install Custom Nodes», найдите «Nano Banana» и нажмите кнопку установки рядом с ComfyUI_Nano_Banana от ru4ls. Менеджер автоматически обрабатывает клонирование git и установку зависимостей. После установки нажмите «Restart» в ComfyUI Manager для перезагрузки всех пользовательских нод. Этот метод особенно удобен для пользователей, которые управляют множеством пользовательских нод и хотят централизованного отслеживания обновлений, так как ComfyUI Manager уведомит вас о появлении новой версии ноды.

Проверка установки

Чтобы убедиться, что нода работает корректно до настройки API-ключа, щёлкните правой кнопкой мыши на холсте ComfyUI и перейдите к «Add Node» в контекстном меню. Найдите «NanoBanana» или «Gemini» в строке поиска. Вы должны увидеть несколько новых нод, включая NanoBanana2_Generate, NanoBanana2_Edit и NanoBanana2_BatchGenerate. Если эти ноды не появляются, проверьте терминал сервера ComfyUI на наличие сообщений об ошибках. Наиболее частая проблема при установке — отсутствующая зависимость, которую можно устранить, повторно выполнив pip install -r requirements.txt из директории ComfyUI_Nano_Banana.

Настройка API-ключа и конфигурация биллинга

Пошаговая схема настройки API-ключа и конфигурации биллинга

Получение API-ключа — процесс несложный, но есть одна критическая ловушка, в которую попадает почти каждый новый пользователь: бесплатный тарифный план Google AI Studio не поддерживает генерацию изображений. Это не очевидно из процесса регистрации, и многие пользователи тратят часы на поиск ошибок «permission denied» (доступ запрещён), прежде чем обнаружат, что им необходимо подключить биллинг. Бесплатный тариф отлично работает для текстовых запросов к Gemini, но любой вызов gemini-3.1-flash-image-preview, запрашивающий генерацию изображения, завершится ошибкой 403, если к вашему проекту Google Cloud не привязан активный платёжный аккаунт. Понимание этого различия до начала работы сэкономит вам массу времени и нервов.

Создание API-ключа

Перейдите в Google AI Studio по адресу aistudio.google.com и войдите с помощью своего аккаунта Google. Если у вас ещё нет проекта Google Cloud, платформа создаст его автоматически. Нажмите «Get API Key» на левой боковой панели, затем «Create API Key in new project» или выберите существующий проект. Немедленно скопируйте сгенерированный ключ и сохраните его в безопасном месте. Вы не сможете увидеть полный ключ повторно после выхода с этой страницы, хотя при необходимости всегда можете сгенерировать новый. Для более детального пошагового руководства по процессу генерации ключа, включая скриншоты и решение типичных проблем с аккаунтом, ознакомьтесь с нашим руководством по получению API-ключа Google AI.

Подключение биллинга (обязательно для генерации изображений)

Это тот шаг, который большинство руководств пропускает, и это самый важный шаг конфигурации для генерации изображений. Перейдите в Google Cloud Console по адресу console.cloud.google.com, выберите ваш проект из выпадающего списка вверху и перейдите в раздел «Billing» на левой боковой панели. Нажмите «Link a billing account» и добавьте способ оплаты, например, кредитную карту. Google ничего не спишет во время этой настройки, и вы можете установить уведомления о бюджете для контроля расходов. После активации биллинга ваш API-ключ получает разрешение на вызов эндпоинтов генерации изображений. Изменение вступает в силу в течение нескольких минут, хотя иногда может потребоваться до часа, чтобы статус биллинга распространился по всем сервисам Google.

Настройка ключа в ComfyUI

У вас есть два варианта предоставления API-ключа ноде ComfyUI_Nano_Banana. Самый простой способ — вставить ключ непосредственно в поле API key ноды на холсте ComfyUI. Это работает немедленно, но означает, что ваш ключ виден в открытом виде и будет сохранён внутри JSON-файла рабочего процесса при его экспорте. Более безопасный подход — установка переменной окружения GOOGLE_API_KEY перед запуском ComfyUI. На Linux и macOS добавьте export GOOGLE_API_KEY="your-key-here" в файл профиля вашей оболочки (~/.bashrc или ~/.zshrc). На Windows установите её через «Свойства системы» или выполните $env:GOOGLE_API_KEY="your-key-here" в PowerShell перед запуском ComfyUI. Когда переменная окружения установлена, нода обнаруживает её автоматически, и вам не нужно вводить что-либо в поле API key на холсте.

Если вы столкнулись с постоянными проблемами биллинга или доступа к API, или если вы находитесь в регионе, где биллинг Google Cloud недоступен, laozhang.ai предоставляет OpenAI-совместимый API-эндпоинт, который маршрутизирует запросы к той же модели gemini-3.1-flash-image-preview без необходимости настройки биллинга Google Cloud. Это может быть практичным обходным решением для пользователей, которым нужно быстро начать генерировать изображения, пока они разбираются с настройкой биллинга Google.

Создание трёх основных рабочих процессов

После установки ноды и настройки API-ключа вы готовы создавать практические рабочие процессы. Три рабочих процесса ниже охватывают наиболее распространённые сценарии использования Gemini 3.1 Flash Image в ComfyUI: генерация изображений из текста, редактирование существующих изображений и перенос стиля. Каждый рабочий процесс разработан как минимальный и функциональный, давая вам рабочую отправную точку, которую можно расширять дополнительными нодами ComfyUI по мере развития ваших потребностей.

Рабочий процесс генерации изображений по тексту

Самый базовый рабочий процесс подключает ноду промпта к ноде NanoBanana2_Generate и направляет вывод в ноду Save Image. Щёлкните правой кнопкой мыши на холсте и добавьте ноду NanoBanana2_Generate. В настройках ноды задайте желаемое разрешение (1024 — значение по умолчанию и наиболее экономичное), выберите соотношение сторон (1:1 для квадратных изображений) и введите текстовый промпт непосредственно в поле промпта. Подключите выход к ноде Preview Image или Save Image и нажмите «Queue Prompt» для генерации вашего первого изображения. Генерация обычно завершается за 3-5 секунд при разрешении 1K, а изображения 4K занимают 8-12 секунд.

[Text Prompt] → [NanoBanana2_Generate] → [Save Image]
                  ├─ resolution: 1024
                  ├─ aspect_ratio: 1:1
                  └─ seed: -1 (random)

Для воспроизводимых результатов установите seed на конкретное число, а не -1. Это позволяет повторно сгенерировать точно такое же изображение позже или внести небольшие корректировки промпта, сохраняя общую композицию стабильной. Контроль seed в ComfyUI_Nano_Banana — это настоящий серверный сид, что означает: одинаковый seed с одинаковым промптом каждый раз будет выдавать идентичный результат, что критически важно для профессиональных рабочих процессов, где необходима согласованность между вариациями.

Рабочий процесс редактирования изображений

Рабочий процесс редактирования изображений позволяет модифицировать определённые части существующего изображения с помощью инструкций на естественном языке. Добавьте ноду Load Image, подключите её ко входу изображения ноды NanoBanana2_Edit и напишите инструкцию по редактированию в поле промпта. Например, загрузив фотографию комнаты и написав промпт «change the wall color to deep blue and add a modern chandelier», вы получите отредактированную версию, которая сохраняет структуру комнаты, внося запрошенные изменения. Это особенно мощно для предметной фотографии и визуализации интерьерного дизайна, где вы хотите исследовать вариации, не начиная с нуля.

[Load Image] → [NanoBanana2_Edit] → [Save Image]
                 ├─ prompt: "your editing instruction"
                 └─ resolution: match_input

Рабочий процесс редактирования работает лучше всего, когда ваши инструкции конкретны и пространственно обоснованы. Расплывчатые промпты вроде «make it better» дают непредсказуемые результаты, тогда как точные промпты вроде «replace the wooden table with a glass coffee table, keeping the same proportions» обеспечивают надёжные правки. Модель понимает пространственные отношения, освещение и перспективу, поэтому ваши правки будут физически правдоподобными даже при сложных модификациях сцены.

Перенос стиля с референсными изображениями

Самый продвинутый рабочий процесс использует возможность работы с 14 референсными изображениями, уникальную для ComfyUI_Nano_Banana. Загрузите одно или несколько референсных изображений с помощью нод Load Image и подключите их к входам референсов ноды NanoBanana2_Generate. Затем предоставьте текстовый промпт, описывающий, что вы хотите сгенерировать в стиле ваших референсных изображений. Модель извлекает стилистические элементы — цветовую палитру, мазки кисти, текстуру и паттерны композиции — из ваших референсов и применяет их к новой генерации. Использование 3-5 референсных изображений из одного художественного стиля обычно даёт наиболее согласованные результаты, тогда как использование одного референса даёт более свободную интерпретацию, смешивающую стиль референса с собственной эстетикой модели.

[Load Ref 1] ─┐
[Load Ref 2] ─┤→ [NanoBanana2_Generate] → [Save Image]
[Load Ref 3] ─┘    ├─ prompt: "description + style"
                    └─ num_references: 3

Для пакетной обработки нескольких промптов или наборов референсов используйте ноду NanoBanana2_BatchGenerate. Она принимает текстовый файл с промптами (по одному на строку) и генерирует изображения для каждого промпта последовательно, сохраняя их с автоматически увеличивающимися именами файлов. Это незаменимо для создания вариаций продуктов, генерации обучающих датасетов или производства контент-календарей для социальных сетей, когда вам нужны десятки изображений с единообразным стилем.

Понимание стоимости и способы экономии

Сравнительная диаграмма стоимости: официальный API, пакетный API и laozhang.ai

Прозрачность ценообразования — один из самых больших пробелов в существующих руководствах по ComfyUI и Gemini. Большинство руководств упоминают цены за токены ($0.25/M входных, $1.50/M текстовых выходных, $60.00/M токенов генерации изображений, по данным ai.google.dev), но никогда не переводят их в стоимость за изображение, на основе которой создатели контента могут реально планировать бюджет. Реальность такова, что ваша стоимость за изображение зависит прежде всего от выходного разрешения, и разница между генерацией в 512px и 4096px составляет более 3-кратного увеличения цены. Понимание этой зависимости критически важно для эффективного управления расходами на API.

Стоимость за изображение для gemini-3.1-flash-image-preview через официальный API Google AI, проверенная по состоянию на март 2026 года по данным ai.google.dev и aifreeapi.com, распределяется следующим образом: разрешение 0.5K (512px) стоит приблизительно $0.045 за изображение, разрешение по умолчанию 1K (1024px) — приблизительно $0.067 за изображение, а максимальное разрешение 4K (4096px) — приблизительно $0.151 за изображение. Google также предлагает пакетный API со скидкой 50% для задач, не требующих мгновенной обработки, что снижает стоимость 1K до примерно $0.034 за изображение. Эти цифры означают, что пользователь при умеренном использовании, генерирующий 100 изображений в месяц при разрешении 1K по умолчанию, потратит около $6.70, тогда как активный пользователь, генерирующий 2000 изображений ежемесячно, столкнётся со счётом в $134 через стандартный API или $68 через пакетный API. Для подробного разбора всех тарифных планов и их сравнения с моделью Pro ознакомьтесь с нашим детальным анализом ценообразования на генерацию изображений Gemini.

Существует несколько практических стратегий для снижения затрат без ущерба качеству вывода. Во-первых, используйте минимальное разрешение, которое соответствует вашим потребностям. Для миниатюр в социальных сетях и веб-графики 1K (1024px) практически всегда достаточно, а генерация в 4K, когда вы потом уменьшите до 800px, — это выброс денег на ветер. Во-вторых, используйте пакетный API для любых задач, не требующих результатов в реальном времени. Если вы генерируете набор изображений продуктов за ночь, пакетная обработка со скидкой 50% — очевидный выбор. В-третьих, настройте уведомления о бюджете в Google Cloud Console, чтобы получать оповещения при приближении расходов к пороговому значению. Это предотвращает неожиданные счета от неконтролируемых пакетных задач или случайно оставленных работающих циклов генерации.

Для пользователей, которые регулярно генерируют в более высоких разрешениях (2K и 4K), сторонние провайдеры API могут предложить существенную экономию. laozhang.ai обеспечивает доступ к той же модели gemini-3.1-flash-image-preview по фиксированной ставке $0.05 за изображение независимо от разрешения (проверено в марте 2026 года, aifreeapi.com). При разрешении 4K это представляет снижение затрат на 67% по сравнению с $0.151 за изображение через официальный API. Сервис использует OpenAI-совместимый эндпоинт, поэтому его настройка в ComfyUI_Nano_Banana требует лишь изменения базового URL API и ключа. Для получения дополнительных вариантов доступного API Gemini 3.1 Flash Image мы подготовили отдельное сравнение доступных провайдеров и их компромиссов. Полная документация API laozhang.ai доступна по адресу https://docs.laozhang.ai/.

Устранение распространённых проблем

Даже при тщательной настройке вы, вероятнее всего, столкнётесь хотя бы с одной из следующих проблем в течение первых сеансов работы с генерацией изображений Gemini в ComfyUI. Эти пять проблем составляют более 90% вопросов поддержки в разделах GitHub Issues репозиториев нод, и каждая из них имеет прямолинейное решение, как только вы знаете, что искать. Для исчерпывающего списка кодов ошибок и пограничных случаев, выходящих за рамки этого руководства, обратитесь к нашему комплексному руководству по устранению ошибок.

Ошибка: 403 Permission Denied или «Billing not enabled» — безусловно, самая распространённая проблема, с которой сталкивается почти каждый новый пользователь. Она означает, что в вашем проекте Google Cloud не подключён биллинг или биллинг был подключён слишком недавно и ещё не распространился. Исправление заключается в проверке статуса биллинга в Google Cloud Console в разделе Billing, подтверждении привязки способа оплаты и ожидании до 60 минут, если вы только что его подключили. Попытка использовать бесплатный тариф для генерации изображений всегда будет выдавать эту ошибку, потому что Google явно исключает генерацию изображений из квоты бесплатного тарифа.

Ошибка: «Module not found» или ошибки импорта при запуске указывает на то, что зависимости Python ноды не были установлены корректно. Перейдите в директорию ComfyUI_Nano_Banana в терминале и повторно выполните pip install -r requirements.txt. Если вы используете виртуальное окружение или окружение conda, убедитесь, что активировали правильное окружение перед запуском pip. В портативных установках на Windows используйте встроенный Python, поставляемый с ComfyUI, а не системный Python, чтобы избежать конфликтов версий.

Ошибка: «Invalid API key» или сбои аутентификации могут возникать даже с действительным ключом, если переменная окружения читается некорректно. Протестируйте свой ключ, выполнив простую команду curl: curl -H "Authorization: Bearer YOUR_KEY" "https://generativelanguage.googleapis.com/v1beta/models". Если она возвращает список моделей, ваш ключ валиден, и проблема в том, как ComfyUI его считывает. Попробуйте вставить ключ непосредственно в поле API key ноды в качестве диагностического шага. Если так работает, а переменная окружения — нет, проверьте наличие завершающих пробелов или символов переноса строки в файле профиля вашей оболочки.

Изображения генерируются как пустые или чёрные квадраты обычно означает, что промпт вызвал срабатывание фильтра безопасности. Gemini 3.1 Flash Image имеет встроенную модерацию контента, и определённые промпты, связанные с насилием, откровенным контентом или реальными публичными личностями, будут выдавать пустые результаты вместо сообщения об ошибке. Переформулировка промпта для избежания помеченных терминов обычно решает проблему. Если вы получаете постоянно пустые результаты вне зависимости от промпта, проверьте, что настройка разрешения находится в поддерживаемом диапазоне (512-4096) и что соотношение сторон является одним из допустимых вариантов (1:1, 4:1, 1:4, 8:1, 1:8).

Медленная генерация или таймауты обычно вызваны задержками сети, а не скоростью обработки модели. Gemini 3.1 Flash Image обычно возвращает результаты за 3-5 секунд при 1K и за 8-12 секунд при 4K. Если вы испытываете задержки более 30 секунд, проверьте скорость вашего интернет-соединения и подумайте, не добавляет ли задержку VPN или прокси. При пакетной генерации нода по умолчанию отправляет запросы последовательно. Если вам нужна более высокая пропускная способность, вы можете увеличить настройку таймаута в конфигурации ноды и убедиться, что ваша квота API не ограничивается из-за отправки слишком большого количества одновременных запросов.

Начните генерировать изображения уже сегодня

Настройка Gemini 3.1 Flash Image Preview в ComfyUI — это пятиминутный процесс, который открывает облачную ИИ-генерацию изображений непосредственно в вашем существующем конвейере рабочих процессов. Ключевые шаги — выбор правильной ноды (ComfyUI_Nano_Banana от ru4ls за её полный набор функций), подключение биллинга Google Cloud к вашему API-ключу (шаг, который большинство пропускает) и начало работы с разрешением 1K по умолчанию для управляемых затрат, пока вы исследуете возможности модели.

Ваши непосредственные следующие шаги должны быть простыми и конкретными. Во-первых, установите ComfyUI_Nano_Banana методом git clone, описанным в этом руководстве, и убедитесь, что ноды отображаются на холсте ComfyUI. Во-вторых, создайте API-ключ Google AI и подключите биллинг, затем протестируйте ключ, сгенерировав простое изображение 1K с описательным промптом. В-третьих, создайте рабочий процесс генерации по тексту как основу, и только затем переходите к рабочим процессам редактирования и переноса стиля, когда освоитесь с базовыми возможностями. Для пользователей, планирующих регулярную генерацию изображений, настройте уведомление о бюджете на $10 или $20 в Google Cloud Console, чтобы контролировать расходы по мере масштабирования использования. Комбинация облачной скорости Gemini и визуальной гибкости рабочих процессов ComfyUI создаёт мощный креативный инструментарий, и начав уже сегодня, вы получите готовый к производству конвейер прежде, чем большинство создателей вообще узнают об этих нодах.

Что такое Gemini 3.1 Flash Image Preview и зачем использовать его в ComfyUI

Сравнение нод ComfyUI для генерации изображений Gemini

ComfyUI_Nano_Banana от ru4ls является безусловным лидером для интеграции gemini-3.1-flash-image-preview. Это единственная нода, которая поддерживает полный диапазон разрешений от 0.5K до 4K, позволяет использовать до 14 референсных изображений в одном запросе на генерацию, включает специализированные ноды для пакетной обработки и обеспечивает контроль seed для воспроизводимых результатов. Нода была создана специально с учётом модели Nano Banana 2 и регулярно обновляется активным разработчиком. Установка проста через git clone, и она чисто интегрируется с ComfyUI Manager для обновлений в один клик.

ComfyUI-NanoBanano от ShmuelRonen — второй лучший вариант и одна из первых нод Gemini для генерации изображений в ComfyUI. Она поддерживает модели 3.1 Flash и 3 Pro, включает возможности редактирования изображений и обеспечивает контроль seed. Однако диапазон разрешений ограничен 1K-2K, а поддержка пакетной обработки лишь частичная. Это остаётся хорошим выбором, если вы преимущественно работаете со стандартными разрешениями и не нуждаетесь в рабочем процессе с 14 референсными изображениями. Оставшиеся три ноды — ComfyUI-Gemini, ComfyUI-NanoB-Edit-Gemini и ComfyUI-JM-Gemini-API — охватывают базовую функциональность генерации изображений по тексту, но лишены продвинутых функций, которые делают ComfyUI_Nano_Banana рекомендуемым выбором. Их стоит рассматривать только при очень специфических требованиях, совпадающих с их ограниченным набором функций, например, если нужна минимальная установка или предпочтение определённых UI-конвенций конкретного разработчика.

Пошаговое руководство по установке

Установка через Git Clone

После завершения установки полностью перезапустите ComfyUI. Простого обновления страницы недостаточно, потому что пользовательские ноды загружаются во время запуска сервера. Когда ComfyUI успешно перезапустится, вы должны увидеть «ComfyUI_Nano_Banana» в логе запуска без каких-либо сообщений об ошибках. Если вы столкнулись с ошибками импорта, наиболее распространённая причина — несовместимость версии Python, и выполнение python --version подтвердит, соответствуете ли вы требованию 3.10+.

Установка через ComfyUI Manager

Проверка установки

Чтобы убедиться, что нода работает корректно до настройки API-ключа, щёлкните правой кнопкой мыши на холсте ComfyUI и перейдите к «Add Node» в контекстном меню. Найдите «NanoBanana» или «Gemini» в строке поиска. Вы должны увидеть несколько новых нод, включая NanoBanana2_Generate, NanoBanana2_Edit и NanoBanana2_BatchGenerate. Если эти ноды не появляются, проверьте терминал сервера ComfyUI на наличие сообщений об ошибках. Наиболее частая проблема при установке — отсутствующая зависимость, которую можно устранить, повторно выполнив pip install -r requirements.txt из директории ComfyUI_Nano_Banana.

Настройка API-ключа и конфигурация биллинга

Получение API-ключа — процесс несложный, но есть одна критическая ловушка, в которую попадает почти каждый новый пользователь: бесплатный тарифный план Google AI Studio не поддерживает генерацию изображений. Это не очевидно из процесса регистрации, и многие пользователи тратят часы на поиск ошибок «permission denied» (доступ запрещён), прежде чем обнаружат, что им необходимо подключить биллинг. Бесплатный тариф отлично работает для текстовых запросов к Gemini, но любой вызов gemini-3.1-flash-image-preview, запрашивающий генерацию изображения, завершится ошибкой 403, если к вашему проекту Google Cloud не привязан активный платёжный аккаунт. Понимание этого различия до начала работы сэкономит вам массу времени и нервов.

Создание API-ключа

Подключение биллинга (обязательно для генерации изображений)

Настройка ключа в ComfyUI

У вас есть два варианта предоставления API-ключа ноде ComfyUI_Nano_Banana. Самый простой способ — вставить ключ непосредственно в поле API key ноды на холсте ComfyUI. Это работает немедленно, но означает, что ваш ключ виден в открытом виде и будет сохранён внутри JSON-файла рабочего процесса при его экспорте. Более безопасный подход — установка переменной окружения GOOGLE_API_KEY перед запуском ComfyUI. На Linux и macOS добавьте export GOOGLE_API_KEY="your-key-here" в файл профиля вашей оболочки (~/.bashrc или ~/.zshrc). На Windows установите её через «Свойства системы» или выполните $env:GOOGLE_API_KEY="your-key-here" в PowerShell перед запуском ComfyUI. Когда переменная окружения установлена, нода обнаруживает её автоматически, и вам не нужно вводить что-либо в поле API key на холсте.

Создание трёх основных рабочих процессов

Рабочий процесс генерации изображений по тексту

Рабочий процесс редактирования изображений

Перенос стиля с референсными изображениями

Понимание стоимости и способы экономии

Устранение распространённых проблем

Ошибка: 403 Permission Denied или «Billing not enabled» — безусловно, самая распространённая проблема, с которой сталкивается почти каждый новый пользователь. Она означает, что в вашем проекте Google Cloud не подключён биллинг или биллинг был подключён слишком недавно и ещё не распространился. Исправление заключается в проверке статуса биллинга в Google Cloud Console в разделе Billing, подтверждении привязки способа оплаты и ожидании до 60 минут, если вы только что его подключили. Попытка использовать бесплатный тариф для генерации изображений всегда будет выдавать эту ошибку, потому что Google явно исключает генерацию изображений из квоты бесплатного тарифа.

Ошибка: «Module not found» или ошибки импорта при запуске указывает на то, что зависимости Python ноды не были установлены корректно. Перейдите в директорию ComfyUI_Nano_Banana в терминале и повторно выполните pip install -r requirements.txt. Если вы используете виртуальное окружение или окружение conda, убедитесь, что активировали правильное окружение перед запуском pip. В портативных установках на Windows используйте встроенный Python, поставляемый с ComfyUI, а не системный Python, чтобы избежать конфликтов версий.

Ошибка: «Invalid API key» или сбои аутентификации могут возникать даже с действительным ключом, если переменная окружения читается некорректно. Протестируйте свой ключ, выполнив простую команду curl: curl -H "Authorization: Bearer YOUR_KEY" "https://generativelanguage.googleapis.com/v1beta/models". Если она возвращает список моделей, ваш ключ валиден, и проблема в том, как ComfyUI его считывает. Попробуйте вставить ключ непосредственно в поле API key ноды в качестве диагностического шага. Если так работает, а переменная окружения — нет, проверьте наличие завершающих пробелов или символов переноса строки в файле профиля вашей оболочки.

Изображения генерируются как пустые или чёрные квадраты обычно означает, что промпт вызвал срабатывание фильтра безопасности. Gemini 3.1 Flash Image имеет встроенную модерацию контента, и определённые промпты, связанные с насилием, откровенным контентом или реальными публичными личностями, будут выдавать пустые результаты вместо сообщения об ошибке. Переформулировка промпта для избежания помеченных терминов обычно решает проблему. Если вы получаете постоянно пустые результаты вне зависимости от промпта, проверьте, что настройка разрешения находится в поддерживаемом диапазоне (512-4096) и что соотношение сторон является одним из допустимых вариантов (1:1, 4:1, 1:4, 8:1, 1:8).

Медленная генерация или таймауты обычно вызваны задержками сети, а не скоростью обработки модели. Gemini 3.1 Flash Image обычно возвращает результаты за 3-5 секунд при 1K и за 8-12 секунд при 4K. Если вы испытываете задержки более 30 секунд, проверьте скорость вашего интернет-соединения и подумайте, не добавляет ли задержку VPN или прокси. При пакетной генерации нода по умолчанию отправляет запросы последовательно. Если вам нужна более высокая пропускная способность, вы можете увеличить настройку таймаута в конфигурации ноды и убедиться, что ваша квота API не ограничивается из-за отправки слишком большого количества одновременных запросов.

Начните генерировать изображения уже сегодня

#Gemini 3.1 Flash Image #Интеграция ComfyUI #Генерация изображений #Руководство по API

laozhang.ai

Один API, все модели ИИ

Документы

AI Изображения

Gemini 3 Pro Image

$0.05/изобр.

-80%

AI Видео

Sora 2 · Veo 3.1

$0.15/видео

Async API

AI Чат

GPT · Claude · Gemini

200+ моделей

Офиц. цена

Обслужено 100K+ разработчиков·Без оплаты при ошибках·Стабильный·Alipay/TG

|@laozhang_cn|$0.1 бонус