ChatGPT와 Gemini는 워크시트처럼 보이는 이미지를 아주 빠르게 만들 수 있습니다. 제목, 색상 박스, 답안 칸, 아이콘, 예시 그림까지 들어가면 미리보기에서는 거의 완성본처럼 보입니다. 하지만 실제로 쓰려고 확대하면 한글이 깨지고, 색상 구분이 달라지고, 표의 줄과 여백이 미세하게 어긋나는 일이 생깁니다.
핵심은 모델이 문서 파일을 저장하는 것이 아니라 픽셀 이미지를 만든다는 점입니다. 생성된 결과는 스프레드시트, 슬라이드, 편집 가능한 워크시트가 아닙니다. 그래서 먼저 물어야 할 질문은 "ChatGPT가 더 좋나, Gemini가 더 좋나"가 아니라 "정확해야 하는 부분을 누가 소유해야 하나"입니다.
| 깨진 부분 | 보통 의미하는 것 | 첫 번째 수정 경로 | 멈춰야 하는 기준 |
|---|---|---|---|
| 텍스트 | 모델이 문구를 실제 글자가 아니라 시각적 무늬처럼 그렸다. | 라벨을 줄이고 크게 만든 뒤, 정확한 문구는 편집 가능한 텍스트 레이어에 넣는다. | 오탈자가 사라지지 않고 위치만 바뀐다. |
| 색상 | 팔레트, 채움, 경계, 압축 흔적이 고정되지 않았다. | 색상 견본을 정하고, 텍스트와 채움을 분리하고, 최종 크기에서 대비를 확인한다. | 의미가 있는 색이나 브랜드 색이 일관되지 않는다. |
| 워크시트 레이아웃 | 이미지는 격자를 흉내 낼 뿐 실제 행, 열, 여백을 보존하지 않는다. | 스프레드시트, 슬라이드, 디자인 도구에서 격자를 다시 만든다. | 셀, 정렬, 인쇄 여백이 정확해야 한다. |
| 반복 수정 드리프트 | 한 곳을 고치면 이미 맞았던 다른 곳이 바뀐다. | 참조 이미지, 마스크, 레이어 재구성을 사용한다. | 새 수정이 기존 정답 영역을 계속 망가뜨린다. |
실무 규칙은 간단합니다. AI는 시각 초안을 만들게 하고, 정확한 텍스트, 색상 토큰, 워크시트 구조는 편집 가능한 레이어에서 관리합니다.
빠른 답
ChatGPT, OpenAI 이미지 경로, Gemini, Gemini 이미지 생성 경로는 이미지를 생성하거나 편집하는 도구입니다. 이것은 실제 셀, 텍스트 상자, 색상 견본, 정렬 규칙, 페이지 여백을 가진 문서를 유지하는 것과 다릅니다. 모델은 "영어 워크시트에는 제목, 상자, 색상 구역, 답안 칸이 있다"는 모양은 배울 수 있습니다. 하지만 매번 같은 문장, 같은 색상, 같은 셀 간격을 유지한다는 뜻은 아닙니다.
그래서 작은 미리보기에서는 좋아 보이지만 PDF나 인쇄물에서는 실패합니다. 이미지가 문서처럼 쓰일수록 문서 도구가 필요합니다.
| 작업에 필요한 것 | 이미지 모델이 맡을 것 | 편집기, 스프레드시트, 디자인 도구가 맡을 것 |
|---|---|---|
| 빠른 콘셉트 | 배경, 분위기, 아이콘, 대략적인 그룹 | 최종 문구와 내보내기 설정 |
| 수업용 워크시트 | 시각 테마, 작은 삽화, 예시 장면 | 행, 답안 칸, 번호, 인쇄 여백 |
| 색상 코드 설명 이미지 | 구성과 아이콘 스타일 | 팔레트, 대비, 라벨, 범례 |
| 고객용 자료 | 레이아웃 방향의 초안 | 브랜드 색상, 폰트, 승인 문구 |
| ChatGPT와 Gemini 비교 | 같은 조건의 후보 이미지 | 채점표와 나란히 검수 |
보기 좋은 래스터 이미지를 실제 워크시트 파일처럼 다루는 것이 가장 흔한 실수입니다. 생성된 것은 표가 아니라 표처럼 보이는 이미지입니다.
다시 프롬프트를 쓰기 전에 문제를 분류하기

첫 실패 뒤에 "텍스트만 고치고 나머지는 바꾸지 마"라고 쓰고 싶어집니다. 간단한 경우에는 도움이 되지만, 밀도가 높은 워크시트에서는 두 번째 생성이 전체 이미지를 다시 해석할 수 있습니다. 먼저 어떤 문제가 생겼는지 나눠야 합니다.
| 문제 유형 | 보이는 증상 | 프롬프트만으로 어려운 이유 | 더 나은 첫 조치 |
|---|---|---|---|
| 텍스트 깨짐 | 오탈자, 이상한 글자, 잘린 라벨, 한글 자모 뭉개짐 | 글자가 픽셀로 그려지며 작은 글자와 반복 라벨에 약하다 | 단어를 줄이고 크게 쓰거나, 최종 글자는 외부에서 올린다 |
| 색상 깨짐 | 흰 줄, 번짐, 색온도 변화, 카테고리 색 불일치 | 팔레트가 잠긴 값이 아니라 이미지 일부다 | 색상 견본과 대비를 정하고 편집기에서 확인한다 |
| 레이아웃 깨짐 | 행 높이 불일치, 열 어긋남, 여백 이동, 틀어진 선 | 모델은 격자를 시각적으로 흉내 낼 뿐이다 | 슬라이드나 스프레드시트에서 행열을 다시 만든다 |
| 수정 드리프트 | 라벨 하나를 고치면 테두리, 아이콘, 색상이 바뀜 | 여러 번의 편집이 주변 영역까지 재해석한다 | 마스크 편집 또는 레이어 재구성으로 전환한다 |
"Gemini로 바꿔 보자" 또는 "ChatGPT로 다시 해 보자"는 비교에는 유용합니다. 하지만 정확한 문구, 의미가 있는 색상, 실제 격자가 필요하다면 모델 변경만으로는 충분하지 않습니다.
텍스트가 깨지는 이유
이미지 속 텍스트는 두 가지 일을 해야 합니다. 글자처럼 보여야 하고, 동시에 정확한 언어여야 합니다. 이미지 모델은 첫 번째에는 강하지만, 작은 글자, 긴 설명, 반복 라벨, 한글 조합, 복잡한 배경에서는 두 번째가 흔들립니다.
한글은 자음과 모음 조합, 받침, 띄어쓰기, 줄바꿈이 있어 작은 크기에서 더 취약합니다. 색상 박스 안에 긴 한글 문장을 직접 생성시키면 오탈자와 어색한 자모가 생기기 쉽습니다.
| 텍스트 종류 | 생성 이미지 안에 둬도 되나 | 더 안전한 워크플로 |
|---|---|---|
| 짧은 큰 제목 | 단순하면 가능 | 생성 후 최종 크기에서 교정한다. |
| 섹션 라벨 | 경우에 따라 가능 | 짧고 대비 높게 만들고 모든 라벨을 확인한다. |
| 워크시트 설명문 | 위험함 | 원문은 문서나 슬라이드 편집기에 둔다. |
| 답, 날짜, 이름, 가격, 법률/의료 문구 | 픽셀에 맡기지 않는다 | 생성 뒤 편집 가능한 텍스트로 배치한다. |
| 번역 또는 다국어 | 매우 위험함 | 먼저 현지 문구를 쓰고 마지막에 디자인 도구에 넣는다. |
워크시트 콘셉트가 필요하다면 "큰 빈 답안 칸", "짧은 섹션 라벨", "최종 지시문을 넣을 여백"처럼 요청합니다. 그런 다음 정확한 문구는 실제 문서 도구에서 올립니다.
색상 박스에 흰 줄, 번짐, 다른 채움이 생기는 이유
색상은 장식이 아닐 수 있습니다. 워크시트에서는 빨강, 초록, 파랑, 노랑이 문제 유형, 중요도, 정답 상태, 읽는 순서를 나타낼 수 있습니다. 모델이 텍스트 주변에 흰 배경을 만들거나 같은 카테고리 색을 매번 다르게 칠하면 독자는 의미를 잘못 읽을 수 있습니다.
색상을 형용사가 아니라 design token처럼 다룹니다.
| 색상 문제 | 확인할 것 | 수정 방법 |
|---|---|---|
| 글자 주변 흰 띠 | 모델이 가독성을 위해 가짜 배경을 만든 것인지 확인 | 텍스트와 채움을 분리하거나, 빈 색상 블록만 생성한다. |
| 카테고리 색상 불일치 | "밝은", "파스텔"처럼 모호하게 썼는지 확인 | 색상명, 색상 견본, 범례를 사용한다. |
| 낮은 대비 | 최종 내보내기 크기에서 읽히는지 확인 | 전체 재생성보다 편집기에서 대비를 높인다. |
| 번짐 또는 압축 흔적 | 텍스처, 작은 글자, 압축이 섞였는지 확인 | 깨끗한 원본 파일에서 다시 내보낸다. |
| 수정 후 팔레트 드리프트 | 한 번의 수정이 전체 팔레트를 다시 해석했는지 확인 | 마스크로 국소 수정하거나 색상 모양을 수동으로 만든다. |
프롬프트로는 "flat color blocks, no texture, no gradients, no glow, no text inside the blocks"처럼 제어할 수 있습니다. 하지만 색상이 의미를 갖는 경우에는 PowerPoint, Keynote, Google Slides, Figma, Canva 같은 도구에서 직접 고정하는 편이 안전합니다.
워크시트 레이아웃이 깨지는 이유
워크시트 레이아웃은 단순해 보여도 제약이 많습니다. 행, 열, 동일한 간격, 페이지 여백, 답안 칸, 읽는 순서, 인쇄 크기, 잘림 여부가 모두 맞아야 합니다. 이미지 모델은 이런 구조를 시각적으로 흉내 낼 수 있지만, 내부적으로 스프레드시트 제약을 유지하지 않습니다.
멈춤 규칙은 명확합니다. 인쇄, 작성, 채점, 번역, 재사용이 필요한 워크시트라면 격자를 생성된 픽셀로 남겨 두지 않습니다.
AI에게 맡길 것:
- 시각 테마
- 작은 삽화
- 배경 스타일
- 섹션 분위기
- 대략적인 구성 아이디어
편집 도구가 맡을 것:
- 최종 행과 열
- 답안 칸
- 선과 테두리
- 페이지 여백
- 인쇄 크기
- 실제 폰트
- PDF/PNG 내보내기
이 방식은 AI 사용을 줄이는 것이 아니라, 빠른 창의적 초안과 검수 가능한 정밀 레이어를 분리하는 것입니다.
수정 사다리

가장 덜 파괴적인 수정부터 시작합니다.
| 단계 | 언제 사용하나 | 무엇을 하나 | 다음 단계로 넘어갈 때 |
|---|---|---|---|
| 프롬프트 단순화 | 이미지가 가깝지만 요구가 너무 많음 | 글자 수, 요소 수, 세부 조건을 줄인다 | 같은 오류가 계속 이동한다 |
| 참조 이미지 추가 | 이전 버전의 구성이 좋음 | 구조와 비율을 유지하도록 요청한다 | 관련 없는 부분도 바뀐다 |
| 마스크 사용 | 한 영역만 고치면 됨 | 깨진 박스, 라벨, 색상만 수정한다 | 근처에 새 아티팩트가 생긴다 |
| 정확한 텍스트 오버레이 | 디자인은 쓸 만하지만 문구가 틀림 | 빈 이미지나 임시 문구로 출력한 뒤 텍스트를 올린다 | 이후 수정/번역이 필요하다 |
| 워크시트 레이어 재구성 | 행열, 여백, 인쇄 경계가 중요함 | 스프레드시트, 슬라이드, 디자인 도구에서 다시 만든다 | 통제 가능한 원본 파일이 생긴다 |
| 최종 검수 | 완성처럼 보임 | 철자, 색상, 격자, 잘림, 내보내기를 확인한다 | 실제 사용 크기에서 통과한다 |
이 순서가 중요한 이유는 재생성마다 이미 맞았던 영역을 잃을 수 있기 때문입니다. 오류가 줄지 않고 이동한다면, 모델을 최종 레이아웃 도구로 쓰는 것을 멈춰야 합니다.
ChatGPT, Gemini, API, 편집 도구는 서로 다른 작업면이다
모델 이름만으로 워크플로가 정해지지 않습니다. ChatGPT 앱, OpenAI Image API, Responses API 이미지 생성, Gemini 앱, Gemini API, 외부 편집기는 마스크, 출력 크기, 로그, 반복 테스트, 대화 기록에서 차이가 있습니다.
하지만 어떤 경로도 래스터 이미지를 잠긴 워크시트 파일로 바꾸지는 않습니다.
ChatGPT와 Gemini를 비교하려면 조건을 맞춥니다.
| 테스트 항목 | 이유 |
|---|---|
| 같은 원문 | 그렇지 않으면 모델이 아니라 프롬프트를 비교하게 된다. |
| 같은 화면 비율 | 캔버스가 달라지면 워크시트 구조도 달라진다. |
| 같은 정보 밀도 | 포스터와 빽빽한 워크시트는 다른 작업이다. |
| 같은 내보내기 목적 | SNS 이미지, PDF, 인쇄물은 검수 기준이 다르다. |
| 같은 채점표 | 텍스트, 색상, 격자, 무관한 변화 오류를 따로 센다. |
API는 동일 프롬프트 테스트, 로그, 모델 비교, 생산 통합에 좋습니다. 앱은 빠른 시각 탐색에 좋습니다. 최종 결과가 텍스트, 색상, 워크시트 레이아웃을 보존해야 한다면 편집 가능한 원본 파일이 필요합니다.
공유 전 최종 검수

최종 파일은 실제 사용 환경에서 확인합니다. 채팅 미리보기에서 괜찮아 보여도 PDF, 인쇄, LMS 업로드, 모바일 화면에서 실패할 수 있습니다.
| 검수 항목 | 통과 기준 | 실패하면 |
|---|---|---|
| 텍스트 | 모든 글자, 숫자, 문장부호가 최종 크기에서 정확하다 | 텍스트를 편집 가능한 레이어로 옮겨 다시 내보낸다 |
| 색상 | 색상 의미가 모든 박스, 범례, 예시에서 일관된다 | 색상 견본을 고정하고 채움을 다시 만든다 |
| 레이아웃 | 행, 열, 답안 영역, 여백, 읽는 순서가 맞다 | 레이아웃 도구에서 격자를 다시 만든다 |
| 잘림 | 중요한 요소가 캔버스 밖으로 잘리지 않는다 | 페이지 크기를 먼저 고친다 |
| 내보내기 | PNG, PDF 등 형식이 목적에 맞다 | 채팅 미리보기가 아니라 원본 파일에서 내보낸다 |
| 재사용 | 문구와 레이아웃을 나중에 수정할 수 있다 | editable master file을 보관한다 |
마지막 질문은 "예쁜가"가 아니라 "사용자가 추측 없이 이 워크시트를 쓸 수 있는가"입니다.
한국어 워크시트에서 추가로 확인할 것
한국어 자료에서는 한글 깨짐을 단순한 오탈자 문제로만 보면 안 됩니다. 자음과 모음 조합, 받침, 띄어쓰기, 숫자, 영어 약어, 괄호가 작은 색상 박스 안에 들어가면 모델은 그것을 읽을 글자가 아니라 복잡한 모양으로 처리하기 쉽습니다. 특히 수업 자료, 안내문, PDF 배포물에서는 보기 좋은 초안보다 검수 가능한 구조가 더 중요합니다.
| 한국어 확인 지점 | 왜 깨지기 쉬운가 | 더 안전한 처리 |
|---|---|---|
| 한글 자모 | 작은 크기에서 받침과 모음이 뭉개질 수 있다 | 생성 이미지에는 짧은 제목과 라벨만 둔다 |
| 띄어쓰기와 문장부호 | 줄바꿈과 괄호 위치가 바뀌기 쉽다 | 실제 글꼴로 편집 도구에서 배치한다 |
| 한영 혼용 | 영문 약어와 한글 설명의 기준선이 어긋난다 | 슬라이드나 디자인 도구에서 정렬한다 |
| 답안 칸 | 작성과 채점에는 줄 간격이 직접 영향을 준다 | 문서나 스프레드시트에서 실제 선을 만든다 |
| 색상 의미 | 색이 단계, 난이도, 상태를 나타낼 수 있다 | 색상 견본과 범례를 잠근다 |
최종 파일을 학생, 팀원, 고객에게 전달한다면 AI 초안만 저장하지 말고 편집 가능한 master file을 함께 남기는 것이 좋습니다. 그 파일에는 정확한 텍스트, 실제 색상 블록, 실제 격자, 내보내기 설정이 있어야 합니다. 그래야 나중에 문구를 바꾸거나 언어를 바꿀 때 다시 생성 운에 의존하지 않습니다.
검수도 한 번에 끝내지 않는 편이 좋습니다. 첫 번째 검수에서는 한글 문장, 띄어쓰기, 숫자, 괄호, 단위를 읽습니다. 두 번째 검수에서는 색상 박스와 범례만 봅니다. 세 번째 검수에서는 줄 간격, 답안 칸, 페이지 여백, 인쇄 비율만 봅니다. 이렇게 나누면 예쁜 이미지라는 인상 때문에 실제 수업이나 업무에서 필요한 오류를 놓칠 가능성이 줄어듭니다.
여러 번 생성한 결과가 있다면 마지막 이미지만 남기지 말고, 텍스트가 가장 나은 버전, 색상이 가장 나은 버전, 레이아웃이 가장 나은 버전을 따로 저장합니다. 그런 다음 편집 도구에서 필요한 부분을 재구성하는 편이 안전합니다. 장기적으로 쓸 워크시트라면 원문 텍스트 파일과 표 구조 메모도 함께 보관해야 나중에 한글 문구나 난이도를 바꿀 때 다시 생성 결과를 추측하지 않아도 됩니다. PNG만 남기는 전달은 일회성 미리보기에 가깝습니다.
자주 묻는 질문
ChatGPT 이미지 생성에서 텍스트가 깨지는 이유는 무엇인가요?
모델이 정확한 문장을 실제 텍스트로 입력하는 것이 아니라 픽셀로 그리기 때문입니다. 작은 글자, 반복 라벨, 긴 설명, 한글 조합은 특히 불안정합니다. 최종 문구는 편집 가능한 텍스트 레이어에 두는 것이 안전합니다.
Gemini가 색상이나 박스를 바꾸는 이유는 무엇인가요?
생성 이미지의 색상 박스는 고정된 색상 토큰이 아니라 래스터 이미지의 일부입니다. 색상에 의미가 있다면 팔레트와 범례를 정하고, 텍스트와 채움을 분리하고, 편집기에서 확인해야 합니다.
워크시트에는 Gemini가 ChatGPT보다 낫나요?
특정 프롬프트에서는 한쪽이 더 잘할 수 있습니다. 하지만 정확한 워크시트의 핵심은 모델 선택보다 책임 분리입니다. 텍스트, 색상, 격자는 편집 가능한 레이어가 맡아야 합니다.
AI로 워크시트를 안전하게 만들 수 있나요?
가능합니다. AI는 시각 콘셉트, 배경, 삽화, 대략적인 배치를 맡기고, 최종 문구, 답안 칸, 색상 코드, 인쇄 구조는 슬라이드, 문서, 스프레드시트, 디자인 도구에서 관리합니다.
언제 프롬프트 수정을 멈춰야 하나요?
오류가 줄지 않고 이동할 때, 한 영역 수정이 다른 영역을 망가뜨릴 때, 정확한 문구가 중요할 때, 실제 행과 열이 필요할 때 멈춰야 합니다. 그때는 AI 결과를 콘셉트 레이어로 쓰고 정밀 요소를 다시 만듭니다.
API를 쓰면 더 안정적인가요?
API는 반복 테스트, 로그, 모델 비교, 생산 통합에 유리합니다. 그러나 API도 결국 이미지를 출력합니다. 텍스트, 색상, 레이아웃의 최종 안정성은 편집 가능한 원본 파일에서 나옵니다.
