Codex for Almost Everything — OpenAI가 Codex를 '거의 모든 일'로 확장
2026년 4월 16일, OpenAI가 Codex에 아홉 가지 기능을 한 번에 얹으며 재포지셔닝했습니다. macOS 백그라운드 컴퓨터 제어, Atlas 기반 내장 브라우저, 이미지 생성, 메모리 프리뷰, 장시간 자동화, 90+ 플러그인, GitHub PR 리뷰, 멀티 터미널 탭, 원격 devbox SSH. "코딩 CLI"가 아니라 "맥에서 손 떼면 알아서 돌아가는 운영 엔진"으로 넘어갔어요.
Claude Opus 4.7, Claude Design, GLM 5.1, Gemma 4, GPT-5.4-Cyber. 열흘 안에 쏟아진 릴리스 노트 사이에서 OpenAI의 Codex 업데이트는 조금 결이 다릅니다. 모델 자체의 벤치마크 싸움이 아니라 "모델 주변에 뭘 얹어서 일을 끝까지 시킬까"의 싸움에서 한 걸음 나간 릴리스예요.
01한 줄 요약 — "코딩 CLI"에서 "운영 엔진"으로
이번 업데이트의 핵심 메시지는 "Codex는 이제 코드를 쓰는 툴이 아니라, 코드 주변의 모든 일을 대신 돌리는 엔진이다" 입니다. OpenAI가 말하는 "almost everything"의 구성을 뜯어보면 세 층이 있어요.
- 입력 확장 — 자연어 + 스크린샷 + 90+ 플러그인을 통한 외부 컨텍스트
- 실행 확장 — 터미널, GitHub, 내장 브라우저, macOS 앱 조작, 원격 devbox까지 한 에이전트가 넘나듦
- 시간 확장 — 메모리 프리뷰로 과거 행동을 이어받고, 장시간 자동화로 "잠시 자리 비워도 이어서" 진행
이전 Codex가 "코드 질문에 대한 답"이라면, 이번 버전은 "코드 주변 업무 전체를 책임지는 러너"에 가깝습니다.
02출시 정보와 접근 경로
| 항목 | Codex for Almost Everything |
|---|---|
| 발표일 | 2026년 4월 16일 |
| 단계 | 정식 배포 (플랜 포함 기능) |
| 주 진입점 | ChatGPT 앱 내 Codex · 데스크톱 앱(macOS) · CLI · 웹 |
| 기본 모델 | GPT-5.4 |
| Fast mode 모델 | GPT-5.3-Codex-Spark (Cerebras Wafer Scale Engine 3) |
| 포함 플랜 | ChatGPT Plus · Pro Lite · Pro · Team · Enterprise |
| 프로모션 | Pro $100 플랜 — 2026-05-31까지 Codex 한도 2× (총 10×) |
| API 단가 | GPT-5.4 $2.50 / $15 per 1M tokens |
03새로 추가된 9가지 기능
macOS 백그라운드 컴퓨터 사용 (Background Computer Use)
Codex가 사용자와 별개의 자체 커서를 갖고 화면을 보고, 클릭하고, 타이핑합니다. 여러 에이전트를 병렬로 돌려도 내가 하는 포그라운드 작업을 막지 않아요. API가 없는 앱 자동화, 프론트엔드 앱의 에이전트 셀프 테스트처럼 "UI밖에 없는 대상도 자동화 가능"해진 게 핵심입니다.
Atlas 기반 In-app Browser
OpenAI 브라우저 Atlas의 기술이 Codex 안으로 들어왔습니다. 로컬 서버로 서빙한 웹사이트·앱을 바로 띄워 인라인 댓글로 피드백을 주고받을 수 있고, 향후 인터넷 사이트 상호작용·스크린샷·사용자 흐름 테스트까지 확장 예정입니다. Claude Design이 디자인 캔버스 안에서 닫힌 루프를 만들었다면, Codex는 개발자 루프 안에서 같은 흐름을 잡으려는 움직임입니다.
이미지 생성 내장
이제 Codex 세션 안에서 로고·일러스트레이션·UI 목업을 바로 생성합니다. 프론트엔드 개발 중 "여기 들어갈 placeholder 이미지 만들어줘"가 별도 도구 전환 없이 끝나는 워크플로예요.
메모리 프리뷰 (Memory Preview)
Codex가 과거 세션의 선호·결정을 기억하고 필요할 때 꺼내 씁니다. "지난번에 우리가 쓰기로 한 라우팅 방식대로" 같은 지시가 한 번에 먹히고, 프리뷰 단계라 사용자가 기억될 항목을 직접 검토·편집할 수 있습니다.
Longer-running Automations
에이전트가 "나중에 깨어나 이어서" 작업을 끝낼 수 있게 됐습니다. GLM 5.1의 8시간 자율 실행이 "한 번에 달리는" 방식이라면, Codex는 "중간에 쉬었다가 이어지는" 일정형 에이전트 쪽입니다. 빌드·테스트·마이그레이션처럼 소요가 큰 잡을 밤 사이 진행시킬 수 있어요.
90+ 플러그인
외부 시스템의 컨텍스트를 Codex 세션으로 끌어오는 플러그인이 90개 이상으로 확장됐습니다. 문서·이슈 트래커·데이터 웨어하우스·관찰성 도구 등 흔히 쓰는 사내 파이프를 바인딩해두면, 매번 프롬프트에 길게 붙여 넣던 컨텍스트가 "필요할 때 자동으로" 붙습니다.
GitHub PR 리뷰 워크플로
PR 진단·코멘트·suggestion이 Codex 세션과 양방향으로 묶였습니다.
사람 리뷰어의 흐름을 흉내 내 파일을 훑고, 세션 안에서 수정안을 올려 체인으로 수렴합니다.
Claude Opus 4.7의 /ultrareview와 같은 축의 기능이지만
플랫폼 내장(GitHub)이라는 경로가 다릅니다.
멀티 터미널 탭
한 Codex 창 안에서 여러 터미널을 탭으로 띄웁니다. 서버 로그 따라가며 클라이언트 빌드 돌리고, 테스트 러너는 따로 모니터하는 식의 "멀티 실행 흐름"을 세션 하나로 관리하게 됐어요.
원격 Devbox SSH
Codex를 원격 개발 박스에 SSH로 붙여 그 위에서 에이전트를 돌릴 수 있습니다. 로컬 맥의 자원을 쓰지 않고 고사양 클라우드 머신에서 장시간 잡을 돌리는 용도나, 회사 보안 경계 안쪽 환경에서 에이전트 운영을 필요로 하는 팀에 유용합니다.
04백그라운드 컴퓨터 제어가 왜 달라 보이나
이번 릴리스에서 가장 화제인 건 macOS 백그라운드 컴퓨터 제어입니다. 비슷한 "computer use" 기능은 작년에 Anthropic도 내놓았는데, 반응이 다른 이유는 속도와 결합도입니다.
iOS·맥 업계의 꾸준한 테스터 Federico Viticci는 Codex의 컴퓨터 제어를 "지금까지 테스트한 어떤 LLM·데스크톱 에이전트의 컴퓨터 제어 기능보다 뛰어나다"고 평했어요. 체감 포인트는 두 가지입니다.
- 속도 — Anthropic 기반의 Sky 같은 선행 제품 대비 반응 속도가 눈에 띄게 빠름
- 오케스트레이션 — 한 화면에서 여러 에이전트가 동시에 다른 작업을 진행해도 사용자의 포그라운드를 건드리지 않음
동시에 Hacker News에서는 보안 우려가 제기됐습니다.
사용자 postalcoder는 "완전한 접근 권한이 있는 에이전트에겐 컴퓨터가 극도로 적대적인 장치가 된다"며,
텍스트 파일 한 장이 자격 증명 탈취 벡터가 될 수 있다고 지적했어요. 이 부분은 뒤에서 따로 다룹니다.
05기반 모델 — GPT-5.4 + GPT-5.3-Codex-Spark
Codex는 이제 모델이 아니라 제품입니다. 아래 두 모델을 상황에 맞춰 쓰는 형태로 움직여요.
| 모델 | 포지션 | 특징 |
|---|---|---|
| GPT-5.4 | 기본 / 깊은 추론 | SWE-Bench Pro 57.7% · OSWorld 75% · GDPval 83% |
| GPT-5.3-Codex-Spark | Fast mode / 실시간 코딩 | Cerebras WSE-3 호스팅, 1,000+ tok/s, ChatGPT Pro 리서치 프리뷰 |
Spark는 처음부터 "실시간 코딩" 용도로 설계된 경량 변형입니다.
초당 1,000 토큰 이상 속도로 대답하는 만큼, 큰 리팩터링보다는 인플레이스 자동완성이나 반복 질답에서 가치가 큽니다.
반대로 아키텍처 설계나 멀티파일 디버깅처럼 깊은 추론이 필요한 작업에선 GPT-5.4가 주력입니다.
06가격과 플랜
| 플랜 | 월 요금 | Codex 한도 | 비고 |
|---|---|---|---|
| ChatGPT Plus | $20 | 기본 (1×) | 개인 사용자 |
| ChatGPT Pro Lite | $100 | 5× | Pro 축소판 |
| ChatGPT Pro | $200 | 5× | Pro $100은 프로모션으로 2× → 10× (2026-05-31까지) |
| API (GPT-5.4) | $2.50 / $15 per 1M tokens | 입력 / 출력 | |
Pro Lite($100)는 Plus 대비 더 많은 Codex를 원하지만 Pro까지는 부담스러운 사용자를 위한 중간 티어입니다. 한시적으로 Pro $100 플랜에 2× 프로모션(2026-05-31까지)이 걸려 있어 실질 한도가 10×까지 올라가요. 개인이 Codex를 업무에 깊게 쓴다면 프로모션 기간 안에 갈아타는 게 합리적일 수 있습니다.
07경쟁 지도 — Claude Code · Cursor · Aider · Claude Design
| 도구 | 주 전장 | Codex와의 관계 |
|---|---|---|
| Claude Code | 터미널 기반 깊은 코딩 에이전트 | 직접 경쟁 — 에이전트 범위·깊이 |
| Cursor | IDE 내장 AI 사이드카 | 보완 — Cursor 안에서 Codex 호출 가능 |
| Aider / Continue | OSS 로컬 코딩 에이전트 | 동일 카테고리 — 유연성·비용 우위 |
| Claude Design | 디자인 캔버스 + 프로토타입 | 인접 경쟁 — 내장 브라우저 영역 |
| GLM 5.1 | 오픈 웨이트 에이전트 | 간접 — 비용·주권 차별화 |
단순화하면 이렇습니다.
- 에디터 옆에서 짧게 보조받고 싶다 → Cursor
- 터미널에서 한 작업을 깊게 파고들고 싶다 → Claude Code
- 맥에서 여러 에이전트를 백그라운드로 동시 돌리고 싶다 → Codex
- 디자인·프로토타입까지 포함한 닫힌 루프가 필요하다 → Claude Design
- 가중치를 내려 비용·주권을 컨트롤하고 싶다 → GLM 5.1 + 사내 러너
Codex가 차별화한 지점은 "사용자가 하는 포그라운드 작업을 건드리지 않으면서 여러 에이전트가 맥 위에서 병렬로 돌아간다"는 경험입니다. Claude Code·Cursor가 "한 세션, 한 작업"에 초점을 맞췄다면, Codex는 "세션 풀"을 겨냥하고 있어요.
08한계와 보안 우려
"맥에 손 안 대도 에이전트가 돌아간다"는 말은 매력적이지만, 그만큼 위임 범위를 다시 설계할 필요가 생깁니다.
- 적대적 컴퓨터 가설 — 에이전트에 전권을 주면 로컬 파일·클립보드·브라우저 세션 전부가 잠재 탈취 경로가 됩니다. "열어 본 적 없던 텍스트 파일 하나"가 자격 증명 유출 시나리오가 될 수 있다는 점, 조직 단위 도입 전에 샌드박스·권한 범위·감사 로그 설계를 먼저 끝내세요.
-
컴퓨터 제어의 신뢰 간극 — Hacker News
billyok은 "에이전트 기능이 흥미롭지만 실제 자동화에 넘기기엔 신뢰가 부족하다"고 평했습니다. 시연용 성공률과 프로덕션 성공률은 다릅니다. 중요한 작업은 관찰 → 리플레이 → 승인 3단계로 시작하세요. - 계정 한도 관리 — Codex는 플랜별 한도를 쉽게 소모합니다. Pro $100 10× 프로모션이 끝나면 체감 한도가 절반으로 줄어드니, 자동화 파이프라인을 구성할 때 상한 초과 시의 폴백(낮은 티어·API 전환)까지 미리 정해두세요.
- 플랫폼 락인 — 메모리·플러그인 컨텍스트가 OpenAI 계정에 묶입니다. 중립 라우팅이 필요한 팀은 동일 작업을 Claude Code나 오픈 웨이트로도 재현 가능한지 교차 테스트를 권장합니다.
- Spark의 롤아웃 범위 — 현재 ChatGPT Pro 리서치 프리뷰 한정이고 API에는 열려 있지 않습니다. "실시간 속도"를 팀 서비스에 내장하려는 계획이라면 가용성 변화를 계속 추적해야 합니다.
09Codex를 언제 써야 하나
| 상황 | 권장 | 이유 |
|---|---|---|
| macOS 단독 워크스테이션에서 병렬 에이전트 | Codex | 백그라운드 컴퓨터 제어의 구조적 우위 |
| 야간 배치·밤새 돌리는 잡 | Codex | 장시간 자동화 + 메모리 프리뷰 |
| API 없는 레거시 앱의 자동화 | Codex | UI 조작 + Atlas 브라우저 |
| 터미널 + 단일 레포에서 깊은 디버깅 | Claude Code | 긴 컨텍스트 + xhigh 추론 |
| 에디터 중심 소규모 보조 | Cursor | IDE 통합 경험 |
| 오픈 웨이트 · 에어갭 환경 | GLM 5.1 / Gemma 4 | 로컬 실행 + 라이선스 여유 |
요약하면, Codex의 프리미엄은 "사용자 포그라운드를 비워두고도 여러 에이전트가 동시에 돌아간다"는 한 줄에 있습니다. 이 가치를 체감하는 팀은 맥 워크스테이션 중심에 야간 자동화가 많은 곳, 혹은 GUI밖에 없는 외부 앱 자동화가 잦은 곳이에요.
핵심 정리
- Codex는 2026-04-16 업데이트로 "코딩 CLI"가 아니라 "운영 엔진"으로 재포지셔닝
- 새 기능 9가지 — macOS 백그라운드 제어, Atlas 브라우저, 이미지 생성, 메모리, 장시간 자동화, 90+ 플러그인, GitHub PR, 멀티 터미널, SSH devbox
- 기본 GPT-5.4 + 실시간용 GPT-5.3-Codex-Spark (Cerebras WSE-3, 1,000+ tok/s)
- Plus/Pro Lite/Pro 포함. Pro $100 프로모션으로 2026-05-31까지 Codex 한도 2× (총 10×)
- 포지션: Cursor(에디터) · Claude Code(터미널) · Codex(데스크톱 에이전트 풀)로 역할 분화
- 도입 전 샌드박스·권한·감사 로그 설계를 먼저 끝낼 것
같은 주에 풀린 Claude Opus 4.7, Claude Design, GPT-5.4-Cyber를 함께 읽으면 2026년 2분기 "장시간 자율 실행 + 운영 엔진" 경쟁 축이 선명해집니다. 모델 선택 전반은 Claude vs ChatGPT vs Gemini 실전 비교로 이어집니다.
자주 묻는 질문
Codex for Almost Everything은 언제 공개됐고 무엇을 추가했나요?
Codex의 macOS 백그라운드 컴퓨터 제어는 정확히 어떻게 동작하나요?
Codex는 어떤 모델을 기반으로 동작하고 속도는 어떤가요?
$2.50/$15 per 1M tokens의 API 가격을 가집니다.
빠른 응답이 필요한 실시간 코딩용으로는 Cerebras Wafer Scale Engine 3에서 호스팅되는 경량 변형 GPT-5.3-Codex-Spark가 초당 1,000 토큰 이상을 내는 "fast mode"로 제공됩니다.
Codex for Almost Everything은 어떤 플랜에서 쓸 수 있나요?
$2.50 입력 / $15 출력 per 1M tokens)를 별도로 부담합니다.