ChatGPT と Gemini で文字・色・ワークシート配置が崩れる理由

•2026年6月11日•12 分で読めます•AI画像編集

ChatGPT と Gemini はワークシート風の画像を作れますが、正確な文字、色分け、グリッドは編集可能なレイヤーで管理し、最後に確認する必要があります。

ChatGPT と Gemini の画像生成で文字、色、ワークシート配置が崩れる理由。

ChatGPT と Gemini は、ワークシート風の画像をすばやく作れます。タイトル、色付きの枠、答えを書く欄、矢印、イラストまで入っていると、プレビューではほぼ完成に見えることがあります。ところが実際に使おうとすると、文字が少し崩れたり、色分けの意味が変わったり、グリッドの行や余白がずれていたりします。

原因は単純です。画像生成はピクセルを作る処理であって、スプレッドシート、スライド、PDF 用の編集可能なワークシートを保存しているわけではありません。だから最初に決めるべきなのは「ChatGPT と Gemini のどちらが上か」ではなく、「どの部分を AI に任せ、どの部分を編集可能な層で管理するか」です。

崩れた部分	たいてい起きていること	最初の修正ルート	そこで止める基準
文字	モデルが文字を本文ではなく画像パターンとして描いている。	ラベルを短くし、大きくし、最後の文言は編集可能なテキスト層に置く。	誤字が消えず、場所だけ変わる。
色	パレット、塗り、境界、圧縮のにじみが固定されていない。	色見本を決め、文字と塗りを分け、最終サイズでコントラストを確認する。	意味を持つ色やブランド色がそろわない。
ワークシート配置	出力はグリッドを真似ているだけで、実際の行・列・余白を保持していない。	表計算、スライド、デザインツールでグリッドを作り直す。	セル、余白、印刷位置が正確である必要がある。
編集のドリフト	一か所を直すたびに、別の正しい部分が変わる。	参照画像、マスク、またはレイヤー再構築を使う。	新しい修正が古い正解を壊す。

実務では、AI に見た目の下書きを任せ、正確な文字、色トークン、ワークシートの幾何は編集可能なファイルで保持します。

先に結論

ChatGPT、OpenAI の画像生成ルート、Gemini、Gemini の画像生成ルートは、画像を生成・編集するためのものです。これは、実際のセル、テキストボックス、色見本、整列制約、ページ余白を持つ文書を管理することとは違います。モデルは「英語教材のワークシートには見出し、枠、色分け、答え欄がある」と理解できます。しかし、同じ文言、同じ色、同じ行間を毎回守る保証はありません。

そのため、サムネイルでは完成に見えるのに、拡大すると使えないことが起きます。画像が文書に近い役割を持つほど、文書側のツールが必要です。

必要なもの	画像モデルに任せるもの	編集ツールや表計算に任せるもの
早いビジュアル案	背景、雰囲気、アイコン、粗いグループ分け	最終文言と書き出し設定
授業用ワークシート	テーマ、挿絵、例のイメージ	行、答え欄、番号、印刷余白
色分けされた説明図	構図、アイコンのスタイル	パレット、コントラスト、ラベル、凡例
クライアント配布物	方向性の案	ブランドカラー、フォント、承認済みコピー
ChatGPT と Gemini の比較	同じ条件での候補画像	採点表と横並びの検証

よくある失敗は、見た目のよいラスター画像を編集可能なワークシートと同じように扱うことです。生成されたのは表計算ファイルではなく、表計算ファイルに見える画像です。

もう一度プロンプトを書く前に診断する

AI 生成ワークシート画像における文字、色、レイアウト、編集ドリフトの分類。

失敗した直後に「文字だけ直して、ほかは変えないで」と頼みたくなります。軽い修正なら有効なこともありますが、密度の高いワークシートでは、再生成が画像全体を解釈し直すことがあります。まずは問題の種類を分けます。

問題の種類	見える症状	プロンプトだけで直りにくい理由	最初にやること
文字の崩れ	誤字、欠け、謎の字形、切れたラベル、表記ゆれ	文字がピクセルとして描かれ、小さい文字や繰り返しに弱い	文字数を減らし、大きくし、最後は外部で文字を載せる
色の崩れ	白い筋、にじみ、暗い色、分類色の不一致	色が固定パレットではなく画像の一部になっている	色見本を決め、エディタで確認する
レイアウト崩れ	行幅が違う、列がそろわない、余白がずれる、枠が曲がる	モデルはグリッドを視覚的に近似しているだけ	スライド、表計算、デザインツールで組み直す
編集ドリフト	ひとつ直すと別の要素が変わる	複数ターン編集で周辺領域まで再解釈される	マスク編集か、レイヤー再構築に切り替える

「Gemini に替える」「ChatGPT に替える」は比較としては意味があります。しかし、正確な文字、意味を持つ色、実際の行列を必要とするなら、モデル変更だけでは責任の所在は変わりません。

文字が崩れる理由

画像内の文字には二つの役割があります。ひとつは文字らしく見えること、もうひとつは正確な言語として読めることです。画像モデルは前者には強くなりましたが、小さい文字、繰り返しのラベル、長い説明文、多言語、忙しい背景では後者が不安定になります。

次のようにリスクを分けます。

文字の種類	画像生成内に置いてよいか	安全なワークフロー
短い大見出し	大きく単純なら可能	生成後、最終サイズで校正する。
セクションラベル	場合によって可能	短く、高コントラストにし、全ラベルを確認する。
ワークシート本文の説明	リスクが高い	本文は文書やスライド側で保持する。
答え、日付、名前、価格、法的文言、医療文言	ピクセルに頼らない	生成後に編集可能テキストとして配置する。
翻訳や多言語	高リスク	先にローカル文言を書き、最後に配置する。

日本語では、漢字の画数、かなとの混在、全角・半角、句読点、改行位置がさらに問題になります。日本語の長い説明文を小さな色付き枠の中に生成させるより、まず枠と余白だけを作り、本文は実フォントで載せたほうが安定します。

色付きボックスに白い筋や違う塗りが出る理由

色は見た目だけではありません。ワークシートでは、赤、青、緑、黄色が問題の種類、重要度、答えの状態、読む順番を表すことがあります。その色が途中で変わると、文字が読めても指示が崩れます。

色を形容詞ではなく design token として扱います。

色の問題	見るべき点	修正
文字の周りに白い帯が出る	モデルが可読性のために偽の背景を作っていないか	文字と塗りを分ける。先に空の色ブロックを作る。
カテゴリ色が違う	「明るい」「やさしい」など曖昧に書いていないか	色名、色見本、凡例を使う。
コントラスト不足	実際の書き出しサイズで読めるか	エディタでコントラストを上げる。
にじみや圧縮跡	背景テクスチャや小さい文字が原因ではないか	クリーンな元ファイルから書き出す。
編集後の色ズレ	再編集で全体のパレットが変わっていないか	マスクで局所編集するか、色形状を手作業で組む。

プロンプトでは「flat color blocks, no texture, no gradients, no glow, no text inside the blocks」のように言うと改善することがあります。ただし、色に意味がある場合は、PowerPoint、Keynote、Google Slides、Figma、Canva などで色を固定してください。

ワークシートのレイアウトが崩れる理由

ワークシートは単純に見えますが、実際には多くの制約があります。行、列、等間隔、余白、答え欄、読み順、印刷範囲、ページ比率、裁ち落とし。画像モデルはこれらを見た目として真似できますが、内部に表計算の制約を持っているわけではありません。

止める基準は明確です。印刷する、記入する、採点する、翻訳する、再利用する可能性があるワークシートなら、グリッドを生成画像のままにしないでください。

AI に任せるもの：

ビジュアルテーマ
小さな挿絵
背景スタイル
セクションの雰囲気
おおまかな配置案

編集ツールに任せるもの：

最終行列
答え欄
罫線
ページ余白
印刷サイズ
実フォント
PDF/PNG 書き出し

これは AI を使わないという意味ではありません。AI の速い発想力を残し、検査が必要な精度だけを別の層で持つということです。

修正の階段

ChatGPT または Gemini で崩れたワークシート画像を修正する流れ。

もっとも破壊の少ない修正から始めます。

手順	使う場面	すること	次へ進む基準
プロンプトを軽くする	画像は近いが要求が多すぎる	文字、要素、細かい条件を減らす	同じ種類のミスが移動し続ける
参照画像を使う	以前の版の構図がよい	構造と比率を保つよう指示する	無関係な部分まで変わる
マスクを使う	一部だけ直したい	壊れた枠、ラベル、色だけを直す	近くに新しいノイズが出る
正確な文字を重ねる	デザインは使えるが文言が違う	文字なし、または仮文字で出してから編集層に置く	後で翻訳や修正が必要
ワークシート層を作り直す	行列や印刷境界が大事	表計算、スライド、デザインツールで再構築する	管理できる元ファイルができた
最終確認	完成に見える	文字、色、グリッド、裁切、書き出しを確認する	実際の使用サイズで通る

この順番にすると、無駄な再生成が減ります。何度も全体を作り直すと、直したかった場所は改善しても、別の場所が崩れることがあります。

ChatGPT、Gemini、API、編集ツールを分けて考える

モデル名だけではワークフローは決まりません。ChatGPT アプリ、OpenAI Image API、Responses API の画像生成、Gemini アプリ、Gemini API、外部エディタでは、マスク、出力サイズ、ログ、比較テスト、会話履歴の扱いが違います。

しかし、どのルートでもラスター画像はラスター画像です。編集可能な worksheet file にはなりません。

ChatGPT と Gemini を比較するなら、条件をそろえます。

テスト項目	理由
同じ元文言	そうしないと prompt の差を測ってしまう。
同じアスペクト比	キャンバスが変わると配置も変わる。
同じ密度	ポスターとワークシートは別タスク。
同じ書き出し先	SNS、PDF、印刷では検査基準が違う。
同じ採点表	文字、色、グリッド、無関係な変更を別々に数える。

API は、同一プロンプトテスト、ログ、モデル比較、量産に向いています。アプリは、素早い視覚探索に向いています。最終的に文字、色、ワークシート配置を守る必要があるなら、編集可能なレイヤーが必要です。

共有前の最終チェック

AI 生成ワークシート画像を公開前に確認するチェックリスト。

最終ファイルは、実際に使う場所で確認します。チャットのプレビューで読めても、PDF、印刷、LMS、スマートフォン表示では失敗することがあります。

チェック	合格条件	失敗したら
文字	すべての文字、数字、記号が最終サイズで正しい	文字を編集可能レイヤーに移して再書き出し
色	色の意味が全ブロック、凡例、例で一致する	色見本を固定し、塗りを作り直す
レイアウト	行、列、答え欄、余白、読み順がそろう	layout tool でグリッドを再構築
裁切	重要な要素が切れていない	ページサイズを直してから再編集
書き出し	PNG、PDF などが用途に合う	チャットプレビューではなく元ファイルから出す
再利用	後で文言と配置を直せる	editable master file を残す

最後に見るべきなのは、見た目の美しさだけではありません。読む人が迷わず使えるかどうかです。

日本語ワークシートで追加確認すること

日本語版では、文字崩れの原因を単に「モデルが弱い」と片づけると修正が遅くなります。漢字、かな、全角記号、数字、英語ラベル、改行が一つの小さな枠に入ると、モデルはそれを読み物ではなく模様として扱いやすくなります。特に教材、社内資料、印刷用 PDF では、見た目の雰囲気よりも校正できる構造が重要です。

日本語の確認点	壊れやすい理由	安全な扱い
漢字とかな	画数と字形の差が小さいサイズでつぶれやすい	生成内では短い見出しだけにする
全角記号	括弧、句読点、番号がずれやすい	実フォントで後から配置する
中英混在	英語ラベルと日本語説明のベースラインがずれる	スライドやデザインツールで整列する
答え欄	罫線と余白が採点や記入に直結する	表計算や文書側で作る
色分け	色が手順や難易度を表す場合がある	色見本と凡例を固定する

最終成果物が授業、社内共有、営業資料に使われるなら、AI 画像だけで完結させないほうが安全です。視覚案、編集可能な master file、配布用 PDF/PNG を分けて残すと、後から文言や余白を直すときに再生成の偶然に頼らずに済みます。

配布前には、文字だけを見る確認、色だけを見る確認、配置だけを見る確認を分けます。一度に全体を眺めると、雰囲気のよさに引っ張られて小さな誤字や行ずれを見落とします。日本語資料では一文字の誤り、句読点の位置、答え欄の幅がそのまま使いやすさに影響します。

よくある質問

ChatGPT の画像生成で文字が崩れるのはなぜですか？

正確な言葉をピクセルとして描く必要があるからです。小さい文字、繰り返しのラベル、密集した説明、色付き枠内の文字は特に弱くなります。短い大見出しは使えることがありますが、最終文言は編集可能な文字層に置くのが安全です。

Gemini で色や枠が変わるのはなぜですか？

生成画像の色は、固定された色見本ではなくラスター画像の一部だからです。色に意味がある場合は、パレット、凡例、文字との分離を決め、最終エディタで確認します。

ワークシートなら Gemini のほうが ChatGPT より良いですか？

プロンプトによっては片方が良い結果を出すことがあります。ただし、正確な worksheet の修正はモデル選びだけでは解決しません。文字、色、グリッドの責任を編集可能な層に移すことが重要です。

AI で安全にワークシートを作れますか？

作れます。AI には雰囲気、背景、挿絵、粗い配置を任せます。最終の文言、答え欄、色分け、印刷寸法は、スライド、文書、表計算、デザインツールで管理します。

いつプロンプト修正をやめるべきですか？

ミスが減らずに移動する、ひとつ直すと別の場所が壊れる、正確な文言が必要、行列や印刷サイズが重要。このどれかに当てはまるなら、AI 出力を concept layer として使い、精密部分を別ツールで作り直します。

API を使えばレイアウトは安定しますか？

API は同条件テスト、ログ、量産には便利です。ただし、API でも出力は画像です。最終的な文字、色、ワークシート配置の安定性は、編集可能な元ファイルで管理する必要があります。

#ChatGPT Images#Gemini 画像生成#AI画像編集#ワークシートデザイン#GPT Image