Перейти к основному содержанию

Почему Gemini ограничивает генерацию изображений людей: полное руководство 2026

A
22 мин чтенияGemini

Gemini ограничивает генерацию изображений людей по трём ключевым причинам: скандал с многообразием 2024 года, законы о предотвращении дипфейков и обновление безопасности Nano Banana 2, выпущенное в феврале 2026. Руководство объясняет, что заблокировано, что разрешено и какие именно стратегии промптов работают в 2026 году.

Почему Gemini ограничивает генерацию изображений людей: полное руководство 2026

Gemini ограничивает генерацию изображений людей по трём ключевым причинам: скандал с многообразием 2024 года, в результате которого выяснился опасный перекос при создании исторических изображений ИИ; постоянно ужесточающиеся законы о дипфейках и конфиденциальности, запрещающие фотореалистичное отображение идентифицируемых людей; и обновление безопасности Nano Banana 2 в феврале 2026 года, существенно ужесточившее ограничения в отношении знаменитостей и операций с лицами. Тем не менее Gemini по-прежнему способен создавать вымышленных персонажей, стилизованные портреты и нарисованных людей — главное понять точные границы политики и использовать правильные стратегии промптов.

Краткое содержание

  • Заблокировано с февраля 2024: Фотореалистичные изображения реальных, идентифицируемых людей (следствие широко раскритикованного инцидента с историческими изображениями)
  • Ужесточено в феврале 2026: Nano Banana 2 добавил 4 новые категории ограничений — публичные фигуры/знаменитости, подмена лиц, смена наряда на изображениях реальных людей и манипуляции с финансовыми документами
  • По-прежнему работает: Вымышленные персонажи, иллюстративные и мультяшные стили, силуэты толпы, концепции дизайна персонажей
  • Для разработчиков: Ограничения API отличаются от потребительского приложения Gemini — смотрите сравнение всех моделей изображений Gemini, чтобы узнать об ограничениях для каждого уровня доступа

Краткий ответ — 3 ключевые причины блокировки изображений людей в Gemini

Три основные причины, по которым Gemini ограничивает генерацию изображений людей: скандал с предвзятостью 2024 года, законы о предотвращении дипфейков и обновление безопасности Nano Banana 2

Когда пользователи впервые сталкиваются с отказом Gemini — «Я не могу создавать реалистичные изображения реальных людей» — первой реакцией обычно становится раздражение. Ограничение кажется произвольным, особенно в сравнении с конкурирующими инструментами вроде Midjourney или DALL-E, которые выглядят более лояльными. Однако ограничения Gemini на изображения людей — это не случайные решения. Они вытекают из конкретной, задокументированной последовательности событий и юридических обязательств, не оставляющих Google практически никакого выбора в вопросе поддержания этих защитных механизмов.

Три ключевые причины работают на разных уровнях. Первая — историческая: модель изображений Gemini в начале 2024 года была поймана на серьёзно проблематичных результатах, и последствия оказались настолько значительными, что генеральный директор Google был вынужден принести публичные извинения. Это создало внутри Google институциональную память: любое ослабление политики в отношении изображений людей несёт в себе огромный репутационный риск. Вторая причина — юридическая: законодательство о дипфейках стремительно развивается в США, Европейском союзе и многих других юрисдикциях, и юридическая команда Google пришла к выводу, что создание фотореалистичных изображений идентифицируемых людей влечёт за собой неприемлемые юридические риски. Третья причина — техническая и архитектурная: модель Nano Banana 2 (gemini-3.1-flash-image-preview), выпущенная в феврале 2026 года, включала новый уровень безопасности, специально направленный против четырёх категорий злоупотреблений, которые приобрели широкое распространение.

Понимание этих трёх причин важно, потому что помогает правильно сформировать ожидания. Это не временное ограничение, которое снимут, когда общественное внимание переключится на другое — это многоуровневый политический ответ на конкретные проблемы. Что менялось и, вероятно, будет меняться в будущем — так это точность ограничений. В начале 2024 года применялся грубый подход «приостановить всё». Нынешняя политика 2026 года более детализирована: она блокирует конкретные вредоносные категории, при этом допуская широкий спектр законных творческих применений. Знание точных границ позволяет работать продуктивно в их рамках, а не угадывать, что Gemini примет.


Скандал 2024 года: как эксперимент с многообразием обернулся провалом

Полная хронология политики Gemini в отношении изображений людей — от кризиса 2024 года до ограничений Nano Banana 2 в 2026

Чтобы понять, почему ограничения Gemini настолько строги, необходимо разобраться в том, что произошло в феврале 2024 года — и почему тот инцидент оставил столь глубокий след в подходе Google к изображениям людей, созданным ИИ.

Инцидент, изменивший всё

22 февраля 2024 года пользователи начали публиковать скриншоты, показывающие, что генерация изображений Gemini выдаёт исторически недостоверные результаты. Когда просили создать изображения «сенаторов США 1800-х годов» или «нацистских солдат», Gemini генерировал расово разнородные группы — модель была чрезмерно настроена применять коррекцию разнообразия ко всем запросам без исторического контекста. Темнокожий сенатор США 1800-х годов или немецкий солдат Второй мировой азиатского или африканского происхождения — это не разнообразие, а историческая фальсификация. Изображения широко распространились в социальных сетях, вызвав значительную критику со стороны комментаторов самых разных политических взглядов: одни называли это дезинформацией, созданной с помощью ИИ, другие расценивали как идеологическую манипуляцию, заложенную в модель.

Через шесть дней — 28 февраля 2024 года — генеральный директор Google Сундар Пичаи нарушил своё обычное публичное молчание и обратился к проблеме напрямую. Во внутреннем меморандуме, впоследствии опубликованном, Пичаи назвал результаты «совершенно неприемлемыми» и признал, что модель выдавала «неточные и оскорбительные» изображения. Он пообещал провести коренной пересмотр подхода Gemini к генерации изображений людей — не просто исправление, а переосмысление принципов работы модели с реальными и историческими людьми. Google немедленно приостановил все функции генерации изображений людей как в приложении Gemini, так и через API.

Почему восстановление шло медленно

Большинство технологических компаний, обнаружив ошибку, устраняют её и движутся дальше. Инцидент с Gemini в 2024 году не был воспринят как ошибка — он был расценён как свидетельство фундаментальной проблемы с выравниванием. Модель научилась применять поправки на разнообразие в контекстах, где историческая точность требовала обратного. Исправить это было невозможно простым изменением параметра — требовалась тщательная оценка обучающих данных и процессов обучения с подкреплением, которые породили эту предвзятость.

К третьему кварталу 2024 года Google восстановил ограниченную генерацию изображений людей для подписчиков Gemini Advanced с использованием модели Imagen 3. Но это был контролируемый запуск, а не полное восстановление. Базовый уровень Gemini оставался ограниченным, а даже уровень Advanced работал в соответствии с более строгими правилами, чем до приостановки. На протяжении всего 2025 года ограничения сохранялись: никаких фотореалистичных изображений реальных, идентифицируемых людей — это оставалось основным правилом, при этом модель отклоняла запросы на изображения знаменитостей, портреты, которые могли изображать конкретных живых людей, и любые изображения, которые могли быть интерпретированы как изображения реального человека без явного вымышленного контекста.

Долгосрочное институциональное воздействие

Что делает инцидент 2024 года особенно значимым — так это институциональная реакция, которую он вызвал. Google созвал внутреннюю комиссию по пересмотру всей политики в отношении изображений ИИ, работа которой продолжалась весь второй квартал 2024 года. Этот обзор определил архитектуру Nano Banana 2, выпущенного в феврале 2026 года. Вместо того чтобы просто добавить больше контентных фильтров поверх существующей модели, Nano Banana 2 включил ограничения безопасности на уровне самой модели — ограничения являются не постпроцессинговым фильтром, который можно обойти умными промптами, а встроенным в фундаментальное понимание модели того, что представляет собой правомерный запрос изображения. Именно поэтому нынешние ограничения более надёжны и сложнее в обходе, чем ограничения 2024 года.


Что заблокировано сегодня: ограничения Gemini на изображения людей в 2026 году (Nano Banana 2)

Запуск Nano Banana 2 (gemini-3.1-flash-image-preview) 27 февраля 2026 года отражает текущее состояние политики Gemini в отношении изображений людей. Понимание того, что именно отклоняет эта модель и почему, необходимо для всех, кто работает с возможностями генерации изображений Gemini. Эти ограничения действуют как в приложении Gemini, так и при API-доступе, хотя строгость применения различается в зависимости от уровня.

Фотореалистичные реальные идентифицируемые люди — базовое ограничение, действующее с февраля 2024 года. Модель отклоняет любой промпт, который, по всей видимости, запрашивает правдоподобное изображение конкретного реального человека, идентифицированного по имени, описанию («генеральный директор крупной технологической компании») или визуальному референсу. Порог «идентифицируемости» ниже, чем ожидают многие пользователи: модели не нужно знать наверняка, что целью является конкретный реальный человек — она отклонит промпты, соответствующие сценариям, где конкретный реальный человек, скорее всего, подразумевается.

Изображения знаменитостей и публичных фигур были формально закреплены как отдельная категория в Nano Banana 2. Прежде отказы знаменитостям обрабатывались как подкатегория «идентифицируемых реальных людей». Политика 2026 года возводит это в отдельное ограничение: именованные знаменитости, политики, спортсмены, актёры, музыканты и другие публичные фигуры не могут быть сгенерированы вне зависимости от контекста, формулировки или заявленной цели. Это применяется даже к явно сатирическим или художественным запросам — модель не пытается оценить намерение, она просто отклоняет категорию.

Подмена лиц и дипфейки — ещё одно добавление Nano Banana 2. Любой промпт, описывающий замену лица одного человека лицом другого — будь то через явный язык («наложи лицо [человека A] на это тело») или косвенные инструкции — вызывает отказ. Это ограничение существует специально в ответ на распространение неконсенсуального контента с дипфейками в 2024–2025 годах и отражает юридическую ответственность Google в соответствии с формирующимся законодательством о дипфейках.

Изменение внешнего вида и одежды знаменитостей было добавлено как отдельная категория в Nano Banana 2, отличная от подмены лиц. Промпты, описывающие изменение одежды, тела или внешнего вида изображения реального человека — «покажи [знаменитость] в другом наряде» или «как бы выглядел [публичный деятель] с другой причёской» — отклоняются. Это конкретно направлено против сценария использования, ставшего распространённым в социальных сетях.

Фальсификация финансовых документов завершает четыре новые категории ограничений Nano Banana 2. Хотя технически это отличается от ограничений на изображения людей, данная категория отражает более широкую философию безопасности, лежащую в основе обновления: Gemini не будет создавать изображения, выглядящие как изменённые версии финансовых документов, выписок или записей, вне зависимости от заявленной цели.

Механизмы применения этих ограничений различаются в зависимости от модели и уровня доступа. Потребительское приложение Gemini работает с наиболее консервативной трактовкой, применяя ограничения с широкой границей безопасности, которая захватывает некоторые пограничные случаи, допустимые при более точном прочтении политики. API-уровень — особенно при прямом доступе к gemini-3.1-flash-image-preview — применяет ограничения с более высокой точностью, то есть некоторые творческие вымышленные сценарии, вызывающие отказ в потребительском приложении, успешно выполняются через API. Ни один уровень не предусматривает исключений из основных ограничений, однако API-среда действительно более полезна для профессиональных творческих рабочих процессов с участием персонажей-людей.

Также стоит понять, как модель обрабатывает неоднозначные случаи. Когда промпт можно правдоподобно интерпретировать как изображение либо вымышленного персонажа, либо конкретного реального человека, поведение модели по умолчанию — отклонить, чтобы не рисковать ложноотрицательным результатом. Это консервативное умолчание является намеренным: стоимость ошибочной генерации фотореалистичного изображения реального человека без согласия считается выше, чем стоимость ошибочного отказа в законном творческом запросе. Пользователи, сталкивающиеся с отказами, казалось бы, на невинные промпты, часто попадают именно в этот порог неоднозначности, а не в основные ограничения как таковые.


Более глубокие причины: законы о конфиденциальности, дипфейках и предотвращение предвзятости

Помимо инцидента 2024 года, ограничения Gemini отражают более широкий правовой и этический ландшафт, претерпевающий значительные изменения. Понимание этих глубинных факторов помогает объяснить, почему ограничения существуют на нынешнем уровне и по какой траектории они, вероятно, будут двигаться.

Законы о конфиденциальности — наиболее конкретный юридический фактор. В нескольких юрисдикциях теперь действуют специальные законы, регулирующие использование ИИ для создания изображений реальных людей. Несколько штатов США приняли законодательство о дипфейках в 2024–2025 годах с положениями, специально касающимися неконсенсуальной генерации изображений. Закон ЕС об ИИ, вводившийся в действие поэтапно на протяжении 2024–2025 годов, включает явные положения о системах ИИ, создающих реалистичные изображения реальных людей. Для такой компании, как Google, работающей одновременно во всех этих юрисдикциях, наиболее безопасный подход — политика, удовлетворяющая самым строгим применимым законам повсеместно. Именно поэтому ограничения фактически носят глобальный, а не региональный характер.

Проблема неконсенсуальных интимных изображений (NCII) стала наиболее политически острым фактором законодательства о дипфейках. Исследования, опубликованные в 2024–2025 годах, задокументировали, что подавляющее большинство контента с дипфейками в интернете составляют неконсенсуальные сексуализированные изображения реальных людей, преимущественно направленные против женщин. Хотя существующая политика контента Gemini уже блокирует явный контент, репутационные риски от даже косвенной связи с инфраструктурой, допускающей создание NCII, весьма значительны. Ограничения в отношении знаменитостей и публичных фигур — это не только вопрос юридической ответственности, но и нежелание видеть результаты Gemini в потоках людей, изучающих подобный вредоносный контент.

Аспект предотвращения предвзятости специфичен для инцидента 2024 года, но сохраняет свою актуальность. Фундаментальная проблема, выявленная в феврале 2024 года, заключалась в том, что модель научилась применять демографические поправки, не понимая контекста — переусиление, разработанное для получения более разнообразных результатов в вымышленных сценариях, слепо применялось к историческим сценариям, где точное представление отличается от справедливого. Ограничения существуют не только для предотвращения вредоносных результатов — они дают модели пространство для работы с подлинной сложностью изображения людей без категориальных ошибок. Ограничение сферы генерации изображений людей — это, как ни парадоксально, способ Google быть более вдумчивым в отношении той генерации изображений людей, которую он всё же допускает.

Все изображения, созданные Gemini, несут водяной знак SynthID от Google — невидимую цифровую подпись, встроенную в данные изображения, позволяющую идентифицировать его как созданное ИИ даже после редактирования, обрезки или конвертации формата. SynthID отражает ту же основную философию, что и ограничения контента: подход Google к безопасности изображений ИИ включает техническую инфраструктуру, а не только политические правила. Водяной знак напрямую не предотвращает злоупотребления, но создаёт след для аудита и демонстрирует добросовестные усилия по обеспечению идентификации изображений ИИ, что важно в регуляторных контекстах.


Что вы МОЖЕТЕ генерировать — изображения людей, работающие в 2026 году

Сравнение того, что Gemini блокирует и что разрешает при генерации изображений людей в 2026 году

Ограничения на изображения реальных людей значительны, но они оставляют открытым существенное творческое пространство. Понимание того, что Gemini успешно генерирует — и как правильно это запрашивать — зачастую полезнее, чем каталогизирование того, от чего он отказывается.

Обобщённые вымышленные персонажи полностью поддерживаются и представляют собой наиболее широкую категорию допустимых изображений людей. Персонаж для видеоигры, главный герой иллюстрации к рассказу, обобщённый человек для маркетинговой концепции — всё это работает при условии, что промпт не привязывает персонажа к конкретному реальному человеку. Ключ — оставаться в области физических и личностных черт, а не маркеров идентичности, указывающих на конкретных реальных людей. «30-летний инженер-программист в очках с задумчивым выражением лица» успешно генерируется; «инженер-программист, похожий на [конкретного технологического директора]» — нет.

Иллюстративные и художественные образы людей представляют ещё одну надёжно поддерживаемую категорию. Когда промпты явно апеллируют к художественному стилю — иллюстрация, мультфильм, акварель, масляная живопись, стиль комиксов, аниме, чиби — порог Gemini для ограничения «фотореалистичного идентифицируемого человека» значительно сдвигается. Написанный маслом портрет человека с конкретными физическими чертами трактуется иначе, чем фотореалистичный портрет с теми же чертами, даже если описываемый человек был бы теоретически узнаваем. Использование дескрипторов стиля — это не способ обойти ограничения; это работа в рамках предполагаемой области политики, конкретно ориентированной на фотореалистичные изображения.

Исторические деятели в стилизованных, нефотореалистичных изображениях занимают неоднозначное срединное положение. Явно нарисованный или иллюстративный портрет Авраама Линкольна, Наполеона или других исторических деятелей часто успешно генерируется, когда стиль явно нефотореалистичный. Ограничение направлено против конкретного сочетания «реальный человек» + «фотореалистичный» — разделите эту пару, и граница политики сдвинется. Тем не менее эта категория требует осторожности: попытка сгенерировать фотореалистичное изображение любого исторического деятеля или запрос на современную переработку, которая может быть использована как дезинформация, вызовут отказы.

Сцены с толпой и силуэты полностью поддерживаются. Анонимные фигуры в толпе, композиции с тенями и силуэтами, далёкие фигуры в сценах и группы людей, снятые с ракурсов, скрывающих индивидуальные черты лица, генерируются без ограничений. Для случаев использования, требующих человеческого присутствия без индивидуальной идентичности — макеты продуктов, экологические иллюстрации, архитектурные визуализации — подходы с толпой и силуэтами надёжны и зачастую визуально убедительны.

Концепты и дизайн персонажей для игр, книг и брендинга представляют собой сильный сценарий использования для текущих возможностей Gemini. Создание оригинальных персонажей, где промпт определяет личность, роль и эстетику персонажа без ссылок на реальных людей, стабильно даёт высококачественные результаты. Пространство дизайна персонажей особенно хорошо обслуживается дескрипторами стиля: «концепт персонажа-фэнтезийного воина в полуреалистичном иллюстративном стиле» работает эффективно и даёт результаты, пригодные для профессиональных творческих проектов.

Портреты с описательными чертами могут работать с важными оговорками. Промпт с описанием физических и личностных черт — «женщина средних лет с серебристыми волосами и авторитетным видом, стиль корпоративного портрета» — успешно генерируется, если описание не сводится к конкретному узнаваемому человеку. Практический тест: уникально ли описание идентифицирует реального человека. Если несколько разных людей могут правдоподобно соответствовать описанию, промпт, скорее всего, будет выполнен. Если описание настолько специфично, что читающий его немедленно идентифицирует реального человека, — вероятнее всего, последует отказ.


Стратегии инжиниринга промптов для создания изображений персонажей

Эффективные промпты для изображений людей в Gemini требуют понимания не только того, что модель будет и не будет генерировать, но и того, как она интерпретирует запросы. Одно и то же содержание может завершиться успехом или неудачей в зависимости от формулировки, и развитие интуиции в отношении этого различия — практический навык, отделяющий пользователей, постоянно получающих отказы, от тех, кто успешно генерирует изображения.

Наиболее эффективная стратегия — начинать со стиля. Когда ваше первое описание задаёт визуальную трактовку — «В стиле детальной иллюстрации» или «Акварельный портрет» или «Арт аниме-персонажа, изображающий» — вы сразу же контекстуализируете всё последующее как вымышленное творческое произведение, а не как запрос фотореалистичного изображения. Ограничения Gemini специально откалиброваны на фотореалистичные результаты; установка нефотореалистичного стиля в начале резко меняет интерпретацию последующих дескрипторов. Это не обман модели — это точная передача намерения.

Описание на основе черт, а не ссылок — второй базовый принцип. Разница между «персонаж, похожий на [знаменитость]» и «персонаж с тёмными вьющимися волосами, выразительными скулами и уверенным выражением лица» — не тонкая с точки зрения политики: первое напрямую апеллирует к реальному человеку, второе описывает физические черты, присущие миллионам людей. При создании описаний персонажей думайте в терминах архетипов, комбинаций черт и эстетических тем, а не ссылок на конкретных людей. Такие черты, как цвет волос, тип телосложения, возрастной диапазон, стиль одежды и эмоциональное выражение, допустимы; имена и сравнения с реальными людьми — нет.

Установка контекста важнее, чем многие пользователи осознают. Промпт, устанавливающий вымышленный мир, историю или творческий проект перед описанием персонажа, обрабатывается иначе, чем простое описание персонажа без контекста. «Для фэнтезийного романа, действие которого разворачивается в альтернативной средневековой Европе, персонаж придворного советника, сочетающего учёный ум с политической проницательностью» — обрабатывается в пространстве творческой фантастики; «учёный с политической хитростью» без контекста — более буквально. Добавление предложения контекста — жанр, носитель, цель — не гарантирует успеха, но сдвигает интерпретацию модели в направлении, снижающем ложные срабатывания фильтров ограничений.

Избегайте словаря, напрямую соответствующего заблокированным категориям. Определённые слова и фразы надёжно вызывают отказы вне зависимости от контекста: «реалистичное фото», «фотореалистичный портрет», «выглядит точно как», «в стиле [имя реального человека]» и аналогичные формулировки. Это не ключевые слова в простом фильтре — это высоковесовые сигналы в интерпретации модели того, что вы запрашиваете фотореалистичный результат с реальным человеком. Замена «реалистичного фото» на «детальную иллюстрацию» или «художественный портрет» зачастую меняет результат, при этом точно описывая то, что вам действительно нужно в большинстве творческих целей.

При доработке отклонённого промпта не поддавайтесь искушению просто убрать слова. Вместо этого переформулируйте: добавьте дескрипторы стиля, установите вымышленный контекст, переключитесь с описания на основе ссылок на описание на основе черт, уточните цель. Отказ — это обратная связь о том, как модель интерпретировала ваш промпт, а не оценка того, является ли ваша творческая цель законной. Большинство законных творческих целей достижимы в рамках нынешней политики Gemini при правильном подходе к промптам.

Комбинирование нескольких стратегий в одном промпте часто даёт наиболее надёжные результаты. Промпт, начинающийся со стиля («В стиле детальной иллюстрации графического романа»), устанавливающий контекст («для киберпанк-триллера, действие которого разворачивается в 2090 году»), использующий описание на основе черт («персонаж-детектив с острыми чертами и усталыми глазами, в длинном пальто»), и указывающий чёткую творческую цель («для обложки главы романа»), — обращается к порогу неоднозначности сразу с нескольких сторон. Любого одного элемента может быть достаточно, но их комбинация создаёт чёткий сигнал, что запрос касается вымышленного творческого произведения, а не фотореалистичного изображения реального человека.


API-доступ vs. потребительский Gemini: разные политики для разработчиков

Для разработчиков, создающих приложения с использованием возможностей генерации изображений Gemini, политический ландшафт существенно отличается от того, с чем сталкиваются пользователи потребительского приложения Gemini. Понимание этих различий необходимо для точного планирования продукта и выстраивания ожиданий с заинтересованными сторонами.

Основные ограничения на изображения людей применяются ко всем уровням доступа — не существует конфигурации разработчика или предприятия, которая разблокировала бы фотореалистичные изображения реальных идентифицируемых людей или разрешила генерацию изображений знаменитостей. Эти ограничения встроены в модель Nano Banana 2 на архитектурном уровне, а не применяются как фильтры постобработки, которые мог бы обойти API-доступ. Любой план разработки, основанный на получении «неограниченной» генерации изображений людей через API-доступ, следует пересмотреть.

Что действительно отличается — так это точность применения. Потребительское приложение Gemini включает дополнительные защитные механизмы, разработанные для широкой нетехнической аудитории, что означает несколько более консервативную настройку порога отказа. API-доступ к той же модели Nano Banana 2 (gemini-3.1-flash-image-preview) работает с несколько более высокой терпимостью к пограничным случаям и неоднозначным промптам в художественных или явно вымышленных контекстах. Разработчики, создающие инструменты для профессиональных творческих сценариев — дизайн персонажей, концепт-арт, помощь в иллюстрации — нередко обнаруживают, что промпты, вызывающие отказы в потребительском приложении, успешно выполняются через прямые API-вызовы с идентичным содержанием.

Практическая импликация заключается в том, что бесплатные квоты на генерацию изображений Gemini имеют меньшее значение для случаев использования с изображениями людей, чем контекст политики вашего приложения. Создание инструмента, явно позиционированного как помощник по дизайну творческих персонажей, где вымышленный контекст является частью системного промпта приложения, даёт более надёжную основу, чем попытка обработки вымышленного контекста промпт за промптом.

Для разработчиков, оценивающих стоимость API, доступ к API изображений Gemini по выгодным ценам через агрегирующие сервисы, такие как laozhang.ai, может значительно снизить стоимость создания функций генерации изображений. Модель Nano Banana Pro (gemini-3-pro-image-preview) доступна приблизительно по $0,05 за генерацию — около 20% от прямого API-ценообразования — что делает практичным создание итеративных рабочих процессов генерации без чрезмерных затрат на изображение в процессе разработки. Документация и доступ к API-площадке доступны на docs.laozhang.ai.

Ограничения скорости и управление квотами также различаются между потребительским приложением и API-доступом. Бесплатный уровень API Gemini предоставляет ограниченное количество запросов на генерацию изображений в день, тогда как платные уровни API предлагают существенно более высокие лимиты, пригодные для производственных приложений. Для приложений с высоким объёмом генерации изображений различие между моделями Nano Banana 2 и Nano Banana Pro важно не только для качества результатов, но и для оптимизации стоимости — модель flash обеспечивает достаточное качество для многих сценариев при меньшей стоимости за генерацию.


Gemini vs. Midjourney vs. DALL-E для генерации изображений людей

Пользователи, сравнивающие ограничения Gemini на изображения людей с конкурирующими платформами, нередко приходят к выводу, что альтернативы более мягкие. Реальность более нюансирована — каждая платформа имеет различную философию ограничений, и практическая разница во многом зависит от конкретного сценария использования.

Midjourney допускает более гибкие изображения людей, чем Gemini, включая более реалистичных персонажей-людей, но применяет собственные ограничения в отношении реальных именованных людей и откровенного контента. Для создания вымышленных персонажей в реалистичных стилях Midjourney в целом способнее, чем Gemini при нынешней политике. Однако Midjourney работает преимущественно через Discord и предлагает более ограниченные возможности API, что делает его менее подходящим для программной интеграции. Для иллюстративных и художественных стилей — составляющих большую часть законных творческих применений — Gemini Flash Image против DALL-E и Flux демонстрирует конкурентоспособное качество при меньших затратах.

DALL-E 3 (доступный через API OpenAI или ChatGPT) также допускает более гибкие реалистичные изображения людей, чем Gemini, причём подход OpenAI сосредоточен скорее на конкретных вредоносных категориях, чем на широких ограничениях для реалистичных людей. Ограничения DALL-E в отношении реальных людей и знаменитостей сопоставимы с ограничениями Gemini, но его порог для вымышленных реалистичных людей выше. Компромисс — стоимость: API-доступ DALL-E 3 значительно дороже за изображение, чем варианты Gemini.

Честное сравнение: если ваш сценарий использования конкретно требует фотореалистичных вымышленных персонажей и нефотореалистичных знаменитостей, Gemini в настоящее время является наиболее ограничивающей из крупных платформ. Для художественных, иллюстративных и стилизованных изображений людей — охватывающих подавляющее большинство законных творческих применений — Gemini конкурентоспособен с альтернативами как по качеству, так и по допустимости. Вопрос не в том, какая платформа не имеет ограничений (у всех они есть), а в том, профиль ограничений которой лучше всего соответствует вашему конкретному законному сценарию использования.


Часто задаваемые вопросы об ограничениях Gemini на изображения людей

Может ли Gemini создавать изображения с моим собственным лицом? Нет. Загрузка собственной фотографии и просьба Gemini создать её варианты, добавить другой фон или изменить внешний вид охватывается ограничением «идентифицируемого реального человека». Даже при полном согласии субъекта нынешняя политика не предусматривает исключения для автопортретов. Это известное ограничение, вызывающее разочарование в сценариях с фото для профиля.

Могу ли я создавать изображения политиков или исторических деятелей? Исторические деятели (умершие люди) в явно нефотореалистичных художественных стилях нередко успешно генерируются. Ныне живущие политики отклоняются согласно ограничению на публичных фигур. Точная граница между «историческим деятелем» и «достаточно недавним, чтобы трактоваться как нынешняя публичная фигура» чётко не задокументирована, но как практическое правило: люди, умершие несколько десятилетий назад, в явно художественных стилях нередко работают; ныне живущие или недавно умершие политические деятели — нет.

Применяется ли ограничение к сгенерированным ИИ персонажам, похожим на реальных людей? Ограничение направлено против фотореалистичных изображений, которые будут интерпретированы как изображения реального человека, а не против случайного сходства. Вымышленный персонаж, случайно разделяющий физические черты с реальным человеком, описанный через черты без ссылки на этого человека, как правило, трактуется как вымышленный. Персонаж, описанный специально для того, чтобы напоминать именованного человека — «создай персонажа, похожего на [знаменитость]» — отклоняется.

Откроет ли API-доступ более разрешительную генерацию людей? Нет. Основные ограничения являются уровневыми в модели, а не в API, и применяются ко всем уровням доступа. API-доступ предлагает несколько более высокую точность для творческих вымышленных контекстов, но не позволяет генерировать фотореалистичных реальных людей, знаменитостей или заблокированные категории контента.

Является ли Nano Banana 2 окончательной версией этих ограничений? Политика изображений Google непрерывно развивается с 2024 года, и нет оснований полагать, что она окончательно стабилизировалась. Nano Banana 2 представляет текущее состояние по состоянию на март 2026 года. Будущие обновления модели могут скорректировать ограничения в любом направлении — ослабить пограничные случаи для законных творческих применений или ужесточить в ответ на новые паттерны злоупотреблений. Следить за объявлениями Google о политике ИИ — наиболее надёжный способ оставаться в курсе событий.

Могу ли я использовать Gemini для создания аватаров или фотографий для профиля? Создание аватаров в явно нефотореалистичных стилях — иллюстративном, мультяшном, аниме и аналогичных — как правило, успешно. Фотореалистичное создание аватаров заблокировано согласно нынешней политике. Для сценариев с фото профиля явный запрос иллюстративных или художественных стилей обычно даёт пригодные результаты.

Чем ограничение Gemini отличается от других инструментов для создания изображений ИИ? Ограничения Gemini шире и более последовательно применяются для фотореалистичных изображений людей, чем у большинства конкурирующих платформ. Ограничения обусловлены специфической историей (скандал 2024 года) и отражают особенную юридическую ответственность Google как крупной регулируемой компании. Конкурирующие платформы имеют собственные ограничения на вредоносный контент, но в целом допускают более гибкие реалистичные изображения людей для вымышленных персонажей.

Что делать, если мой законный промпт отклонён? Добавьте явные дескрипторы стиля (иллюстрация, художественный портрет, дизайн персонажа), установите вымышленный контекст перед описанием персонажа, переключитесь с описания на основе ссылок на описание на основе черт и избегайте словаря, соответствующего запросам фотореалистичных портретов. Большинство законных творческих целей достижимы при нынешней политике с соответствующей формулировкой промпта.


Заключение: работать с политикой, а не против неё

Ограничения Gemini на изображения людей — результат конкретной задокументированной истории, реальных юридических обязательств и намеренных архитектурных решений, принятых командами Google по безопасности ИИ. Они не являются ошибками, заглушками или временными неудобствами, ожидающими устранения — они отражают подлинные институциональные обязательства, которые, если и изменятся, то, скорее всего, в сторону большей точности, а не уменьшения масштаба.

Практическое следствие для пользователей состоит в том, что наиболее продуктивный подход — понимать фактические границы политики, а не трактовать все изображения людей как запрещённые. Вымышленные персонажи, художественные стили, дизайн персонажей, сцены с толпой и широкий спектр творческих применений полностью доступны в рамках нынешних возможностей Gemini. Ограничения направлены против конкретного сочетания фотореализма и идентичности реального человека, которое составляет лишь небольшую долю законных творческих сценариев. Работая в этих рамках с соответствующими стратегиями промптов, большинство потребностей в изображениях людей можно удовлетворить.

Для разработчиков, создающих приложения, ключевой вывод состоит в том, что API-доступ не обходит ограничения на уровне модели, но предоставляет более точно настроенную среду для творческих приложений, где вымышленный контекст чётко установлен. Встраивание этого контекста в архитектуру приложения — а не опора на формулировку промпт за промптом — даёт более стабильные результаты и лучший пользовательский опыт.

Инцидент 2024 года и его последствия коренным образом изменили то, как Google думает об изображении людей в изображениях, созданных ИИ — вероятно, навсегда. Но политика, возникшая из этого процесса, более продуманна и конкретно нацелена, чем грубая приостановка, предшествовавшая ей. Понимание как истории, так и нынешнего состояния ограничений — это то, что позволяет эффективно работать с генерацией изображений Gemini в 2026 году.

Поделиться:

laozhang.ai

Один API, все модели ИИ

AI Изображения

Gemini 3 Pro Image

$0.05/изобр.
-80%
AI Видео

Sora 2 · Veo 3.1

$0.15/видео
Async API
AI Чат

GPT · Claude · Gemini

200+ моделей
Офиц. цена
Обслужено 100K+ разработчиков
|@laozhang_cn|$0.1 бонус