만약 당신의 Codex 이미지가 아직도 "OpenAI의 클라우드 코딩 에이전트"에 머물러 있다면, 2026년 3월 이후의 Codex는 그 그림으로 설명되지 않습니다. 진짜 변화는 단일 기능 하나가 아니라, Codex가 더 완성된 에이전트 시스템처럼 맞물리기 시작했다는 점입니다. 병렬 에이전트를 다루는 데스크톱 앱, 주 모델이 된 GPT-5.4, 더 싼 보조 작업용 GPT-5.4 mini, review 지향 보안 흐름으로 들어온 Codex Security, 그리고 로컬과 클라우드의 실행 경계를 훨씬 더 명확하게 설명하는 현재의 안전 모델. 이 모든 것이 한 덩어리의 변화였습니다.
이 점이 중요한 이유는, 지금의 Codex가 이 표면들을 함께 봐야만 제대로 설명되기 때문입니다. Codex는 클라우드 작업 실행기 하나도 아니고, CLI 코딩 도구 하나도 아니며, 단순한 OpenAI 코딩 모델 하나도 아닙니다. 공식적으로 앱, CLI, IDE, 클라우드를 모두 포함해 설명되고, 이 표면들은 서로 따로 존재하는 것이 아니라 서로를 강화합니다.
먼저 보는 결론 (2026-04-01 기준)
- 2026년 3월 5일: GPT-5.4가 Codex에 들어왔고 주 모델이 되었습니다. OpenAI는 이를 중요한 업무를 위한 주력 모델로 설명하며, 네이티브 computer use와 더 강한 툴 워크플로를 강조합니다.
- 2026년 3월 17일: GPT-5.4 mini가 Codex의 앱, CLI, IDE, web에 들어왔습니다. GPT-5.4 quota의 30%만 사용하며, 더 싸고 더 좁은 보조 작업에 적합합니다.
- 2026년 3월 6일: Codex Security가 Codex web에서 research preview로 들어오면서, 프로젝트 문맥을 이해하는 application security review가 Codex 스택 안으로 들어왔습니다.
- 2026년 2월 2일과 3월 4일 업데이트: Codex 앱은 macOS에서 시작해 이후 Windows로 확대되었습니다. 이로써 병렬 에이전트, worktrees, skills, Automations를 다루는 공식 데스크톱 표면이 분명해졌습니다.
- 핵심 변화: Codex는 더 이상 하나의 인터페이스나 하나의 모델로 이해하는 것보다, 여러 표면을 잇는 에이전트 시스템으로 이해하는 편이 훨씬 정확합니다.
증거 메모: 이 글은 2026년 4월 1일 기준 OpenAI의 현재 제품 페이지와 Codex 문서를 다시 확인해 작성했습니다. 접근 범위, 모델 라우팅, quota 정책은 빠르게 바뀔 수 있으니 날짜가 붙은 운영 스냅샷으로 읽는 편이 맞습니다.
3월 변화의 본질은 단일 기능이 아니라 스택 변화였다

Codex를 가장 쉽게 오해하는 방법은 3월의 발표들을 따로따로 읽는 것입니다.
Codex 앱만 보면 OpenAI가 보기 좋은 데스크톱 UI를 하나 추가한 것처럼 보일 수 있습니다. GPT-5.4만 보면 모델만 바뀐 것처럼 보일 수 있습니다. GPT-5.4 mini만 보면 더 싼 옵션 하나가 늘어난 이야기처럼 들릴 수 있습니다. Codex Security만 보면 Codex 옆에 붙은 별도 security 제품처럼 읽힐 수도 있습니다.
하지만 더 강한 해석은 다릅니다. 2026년 3월의 Codex는 더 일관적인 시스템이 되었습니다.
앱은 여러 개의 장기 작업을 관리하는 표면을 주었습니다. GPT-5.4는 메인 에이전트의 능력 상한을 끌어올렸습니다. Codex Security는 review와 검증 중심 워크플로로 영역을 넓혔습니다. GPT-5.4 mini는 강한 모델이 계획과 최종 판단을 맡고, 더 싼 모델이 좁은 보조 작업을 병렬로 처리하는 운영 방식을 현실적으로 만들었습니다. 이를 한꺼번에 보면 Codex는 "또 하나의 AI 코딩 도구"가 아니라, 에이전트 작업을 조직하는 시스템처럼 보이기 시작합니다.
그래서 2026년 3월 4일의 Windows 지원도 표면상 의미보다 훨씬 큽니다. 단독으로 보면 플랫폼 확대이지만, 3월 전체 흐름 안에서는 Codex 앱이 일회성 부가 기능이 아니라 오래 갈 공식 표면이라는 신호이기 때문입니다.
Codex는 이제 네 가지 표면을 가진 시스템이다

현재 OpenAI 문서와 제품 페이지는 Codex를 네 가지 주요 표면으로 설명합니다.
- Codex 앱
- CLI
- IDE 확장
- Codex cloud
중요한 질문은 이제 "어느 것이 진짜 Codex인가"가 아닙니다. 지금은 모두 Codex입니다. 더 유용한 질문은 각 표면이 어떤 작업에 더 잘 맞는가입니다.
앱은 OpenAI가 앞으로 사람과 에이전트의 협업을 어떻게 보려는지 가장 잘 보여줍니다. 공식 제품 페이지는 앱을 단순한 채팅창이 아니라 에이전트의 command center로 설명합니다. 여러 thread를 병렬로 돌릴 수 있고, 에이전트는 분리된 worktree에서 일할 수 있습니다. diff를 보고, 변경에 댓글을 달고, 로컬 git 상태를 건드리지 않은 채 백그라운드 작업을 계속 진행할 수 있습니다. 이것은 "터미널을 열고 모델에게 패치를 시킨다"는 감각과는 꽤 다릅니다.
CLI 와 IDE 확장도 여전히 중요합니다. Codex를 로컬 repo와 실제 편집 환경 가까이에 붙여 주기 때문입니다. 게다가 앱은 CLI와 IDE의 session history와 설정을 이어받습니다. 이것은 OpenAI가 로컬 워크플로를 대체하려는 것이 아니라, 그것을 통합하려 한다는 강한 신호입니다.
그리고 cloud Codex가 있습니다. 작업이 이미 충분히 명확해서 repo를 연결하고, 작업을 던져 두고, 필요하면 로그를 보고, 마지막에 깨끗한 diff나 PR을 검토하는 식이 맞을 때 이 경로는 여전히 Codex의 강점 중 하나입니다. OpenAI가 이 흐름을 꽤 명시적으로 문서화하고 있기 때문입니다.
이 표면들을 묶는 것이 skills, rules, 그리고 점점 더 중요해지는 Automations입니다. 앱 페이지는 skills를 앱에서 만들고, 앱, CLI, IDE에서 쓰며, repo에 체크인해서 팀과 공유할 수 있다고 설명합니다. 이 시점에서 Codex는 단순한 "기억 있는 어시스턴트"보다, repo를 따라 워크플로를 움직이는 시스템에 가까워집니다.
GPT-5.4가 메인 에이전트의 상한을 올렸다
3월의 능력 변화 가운데 가장 큰 것은 여전히 2026년 3월 5일 GPT-5.4가 Codex에 들어온 일입니다.
그 이유는 적어도 세 가지입니다.
첫째, OpenAI는 GPT-5.4를 ChatGPT, API, Codex 전반의 중요한 업무용 주 모델로 명시합니다. 이것은 조용한 백엔드 교체가 아니라, Codex가 무엇을 기본으로 삼아야 하는지에 대한 기대치를 바꾸는 일입니다.
둘째, OpenAI는 GPT-5.4를 Codex와 API에서 네이티브 computer use를 가진 첫 general-purpose 모델로 설명합니다. 이 변화가 중요한 이유는, Codex가 단순한 코드 수정 범주를 넘어서기 때문입니다. 도구, 소프트웨어 환경, 인터페이스를 더 잘 다루는 에이전트는 테스트, UI 점검, 워크플로 검증, 문서 파이프라인, skills를 통한 spreadsheet나 presentation 생성, 브라우저와 코드를 섞는 작업 등 더 넓은 기술 업무에 쓰이게 됩니다.
셋째, GPT-5.4는 긴 horizon의 작업에도 더 나은 기반을 줍니다. OpenAI는 최대 100만 토큰 컨텍스트와 더 큰 툴 생태계에서의 tool search 향상을 설명합니다. 이것을 "이제 Codex가 긴 작업을 자동으로 다 끝낸다"로 읽는 것은 과장입니다. 하지만 실무 상한이 올라가는 것은 맞습니다. 더 많은 파일, 도구, 단계가 얽힌 작업에서 메인 에이전트가 계획과 검증을 유지할 가능성이 커지기 때문입니다.
그래서 지금의 Codex 이야기는 단순히 "모델이 더 똑똑해졌다"가 아닙니다. GPT-5.4가 들어왔기 때문에 앱, skills, Automations의 이야기가 실제로 설득력을 갖습니다. 여러 에이전트를 관리하는 표면은, 밑의 모델이 긴 작업과 도구 사용을 충분히 견딜 때 비로소 가치가 커집니다. 3월은 그 층들이 맞물린 시기였습니다.
신뢰 경계가 드디어 명시적으로 설명된다

현재 Codex 문서에서 가장 유용한 개선점 중 하나는 사실 새로운 기능 자체가 아닙니다. OpenAI가 신뢰 경계를 충분히 명확하게 설명하기 시작했다는 점입니다.
로컬 CLI / IDE 에서 기본 동작은 다음과 같습니다.
- 네트워크 없음
- 쓰기는 active workspace로 제한
이것은 "기본적으로 더 안전하다" 같은 추상적인 표현보다 훨씬 실무적입니다. 기본 상자가 어디까지인지 직접 알 수 있기 때문입니다.
Codex cloud에서는 OpenAI가 runtime을 두 단계로 설명합니다.
- setup phase는 의존성 설치와 환경 준비를 위해 네트워크를 쓸 수 있음
- 본체인 agent phase는 internet access를 명시적으로 켜지 않는 한 기본적으로 오프라인
OpenAI는 secrets가 setup 단계에서는 사용 가능하지만 main agent phase 전에 제거된다고도 설명합니다. 이것은 사소한 각주가 아닙니다. 의존성 설치, 빌드 준비, 그 이후의 실행을 어떻게 이해할지에 직접 영향을 주기 때문입니다. 실행 경계가 여기까지 명시되면서 실제 운영 판단도 훨씬 구체적으로 할 수 있게 됐습니다.
실무적으로 보면 이제 Codex에서는 단순히 "에이전트에게 맡겨 둔다"가 아니라,
- 로컬 기본값으로 무엇에 접근하는가
- 네트워크가 언제 들어오는가
- 클라우드 실행이 setup 전후로 어떻게 달라지는가
- 어느 순간부터가 의도적인 권한 확장인가
를 더 명확하게 생각할 수 있습니다. policy, reviewability, 리스크 분리를 중요하게 보는 팀에게 이 명확성 자체가 큰 능력입니다.
과소평가되기 쉬운 3월 추가는 GPT-5.4 mini다

2026년 3월 17일의 GPT-5.4 mini는 단순히 "더 싼 모델이 생겼다"로 읽으면 가치를 놓치게 됩니다. Codex 안에서는 워크플로 차원의 의미가 더 큽니다.
OpenAI는 GPT-5.4 mini가 앱, CLI, IDE 확장, web에서 쓰이고, **GPT-5.4 quota의 30%**만 사용한다고 설명합니다. 이것만으로도 가벼운 작업을 더 빠르고 싸게 처리하려는 개발자에게는 중요한 변화입니다. 하지만 더 중요한 것은 Codex 안에서의 역할 설명입니다.
GPT-5.4 mini 소개 글은 Codex에서 더 큰 GPT-5.4가 계획, 조정, 최종 판단을 맡고, GPT-5.4 mini subagent들이 더 좁은 보조 작업을 병렬로 처리한다고 설명합니다. 예시는 다음과 같습니다.
- codebase 검색
- 큰 파일 검토
- 보조 문서 처리
이것은 "하나의 모델을 골라 모든 작업에 쓴다"는 그림과 다릅니다. Codex 내부에서 더 본격적인 작업 라우팅이 시작되고 있다는 뜻에 가깝습니다. 그래서 Codex 앱의 다중 에이전트 UI도 더 중요해집니다. UI와 모델 전략이 서로를 뒷받침하기 시작하기 때문입니다.
여기에는 분명한 경계도 있습니다. GPT-5.4 nano는 Codex 표면이 아닙니다. OpenAI는 nano를 API-only로 둡니다. 그래서 현재 Codex의 모델 이야기는 사실상 이렇게 정리됩니다.
- GPT-5.4는 무거운 계획과 최종 판단
- GPT-5.4 mini는 좁고 싼 보조 작업
이렇게 이해하는 편이 단순히 모델 목록을 읽는 것보다 훨씬 실무적입니다.
지금 Codex가 특히 강한 장면
3월의 변화를 한데 놓고 보면, Codex는 특히 네 가지 상황에서 강점이 분명합니다.
1. 병렬 백그라운드 작업을 돌리되, 결과는 검토 가능한 형태로 받아야 할 때.
앱의 thread 구조, worktrees, diff-first review 흐름은 정확히 이 용도에 맞습니다. 작업 경계가 명확하다면 Codex는 여러 개의 백그라운드 작업을 동시에 전진시키고 마지막에 검토하는 시스템으로 꽤 강합니다.
2. 코드, 도구, 인터페이스가 함께 얽힌 작업.
이 장면에서는 GPT-5.4의 computer use 방향이 중요합니다. 앱 층과 skill 층도 중요합니다. Codex는 단순히 파일을 수정하는 도구에서 벗어나, 코드, 문서, 브라우저, 자산, 외부 도구를 한 번의 실행 흐름 안에서 묶는 쪽으로 가고 있습니다.
3. 스케줄링해서 돌리는 편이 나은 반복 엔지니어링 잡무.
Automations는 가장 과소평가되기 쉬운 추가 요소 중 하나입니다. OpenAI는 issue triage, CI failure 요약, release brief, bug check에 이것을 쓰고 있다고 말합니다. 이런 작업은 "끝나면 review queue로 들어오는 에이전트"가 "채팅에서 매번 손으로 돌리는 어시스턴트"보다 훨씬 자연스럽습니다.
4. 더 높은 신뢰가 필요한 review 흐름, 특히 보안 관련 작업.
Codex Security가 Codex 전체는 아니지만, 플랫폼이 어디로 넓어지는지는 잘 보여 줍니다. OpenAI는 Codex를 단순한 코드 생성기에서 review, validation, patching처럼 더 높은 문맥 이해와 낮은 노이즈가 필요한 흐름으로 밀어 넣고 있습니다.
이것이 곧 Codex가 모든 코딩 작업에서 자동으로 최선이라는 뜻은 아닙니다. 하지만 Codex를 평가하는 방식은 이미 바뀌어야 한다는 뜻입니다. 단일 표면 코딩 어시스턴트로만 보면, 지금 가장 빠르게 강해지고 있는 부분을 놓치게 됩니다.
다음 질문이 "그렇다면 다른 코딩 에이전트와 비교해 일상에서는 무엇부터 쓰는 게 맞는가"라면, 이어서 Claude Code vs Codex 비교를 보는 것이 자연스럽습니다. 먼저 현대적인 Codex 그림을 정확히 잡고 나서 비교하는 편이 판단이 훨씬 또렷해집니다.
FAQ
Codex는 이제 주로 앱인가요?
아닙니다. 앱은 병렬 에이전트, worktrees, skills, Automations를 관리하기 쉽게 만든 중요한 표면이지만, OpenAI는 여전히 Codex를 앱, CLI, IDE 확장, 클라우드 전반으로 설명합니다.
지금 Codex를 구동하는 모델은 무엇인가요?
현재 OpenAI 문서 기준으로 GPT-5.4가 메인 모델입니다. GPT-5.4 mini도 Codex에 들어와 더 빠르고 싼 보조 작업을 맡습니다. GPT-5.4 nano는 API-only입니다.
Codex는 지금도 로컬 작업에 의미가 있나요?
있습니다. OpenAI 문서는 로컬 CLI / IDE 기본값으로 네트워크 없음과 active workspace 제한 쓰기를 명시합니다. Codex는 클라우드 전용 제품이 아닙니다.
Codex Security에서 진짜 새로워진 부분은 무엇인가요?
단순한 security scanner가 아니라, Codex web 안에서 프로젝트 문맥을 만들고, 후보 결과를 검증하고, 패치를 제안하는 application security agent라는 점입니다. 중요한 것은 "보안 기능이 생겼다"보다, Codex가 review-heavy 워크플로로 들어오고 있다는 사실입니다.
왜 GPT-5.4 mini가 그렇게 중요한가요?
가격만 바꾸는 것이 아니라 작업 분담을 바꾸기 때문입니다. OpenAI는 GPT-5.4 mini를 더 좁은 병렬 subagent 작업용 모델로 설명하고, GPT-5.4는 계획과 최종 판단을 맡깁니다.
지금의 Codex를 한 문장으로 말하면 무엇인가요?
가장 정확한 표현은, Codex를 여러 표면을 잇는 에이전트 시스템으로 보는 것입니다. 앱은 병렬 작업을 정리하고, 로컬 표면은 repo에 밀착하며, 클라우드는 handoff형 작업을 처리하고, GPT-5.4는 메인 에이전트의 상한을 올리며, GPT-5.4 mini는 싼 보조 작업을 현실화하고, 현재의 보안 모델은 실제 배포 판단에 쓸 수 있을 만큼 명확해졌습니다.
이 글의 핵심 정리: 2026년 3월은 Codex가 흩어진 기능 묶음처럼 보이던 단계에서 벗어나, 더 일관된 에이전트 스택으로 보이기 시작한 시점이었습니다. 중요한 것은 Codex가 단지 더 많은 일을 할 수 있게 되었다는 사실이 아니라, 표면, 모델, 신뢰 경계가 이제 서로를 더 잘 설명한다는 점입니다.
