릴리스 노트

Codex for Almost Everything — OpenAI가 Codex를 '거의 모든 일'로 확장

2026년 4월 16일, OpenAI가 Codex에 아홉 가지 기능을 한 번에 얹으며 재포지셔닝했습니다. macOS 백그라운드 컴퓨터 제어, Atlas 기반 내장 브라우저, 이미지 생성, 메모리 프리뷰, 장시간 자동화, 90+ 플러그인, GitHub PR 리뷰, 멀티 터미널 탭, 원격 devbox SSH. "코딩 CLI"가 아니라 "맥에서 손 떼면 알아서 돌아가는 운영 엔진"으로 넘어갔어요.

Claude Opus 4.7, Claude Design, GLM 5.1, Gemma 4, GPT-5.4-Cyber. 열흘 안에 쏟아진 릴리스 노트 사이에서 OpenAI의 Codex 업데이트는 조금 결이 다릅니다. 모델 자체의 벤치마크 싸움이 아니라 "모델 주변에 뭘 얹어서 일을 끝까지 시킬까"의 싸움에서 한 걸음 나간 릴리스예요.

01한 줄 요약 — "코딩 CLI"에서 "운영 엔진"으로

이번 업데이트의 핵심 메시지는 "Codex는 이제 코드를 쓰는 툴이 아니라, 코드 주변의 모든 일을 대신 돌리는 엔진이다" 입니다. OpenAI가 말하는 "almost everything"의 구성을 뜯어보면 세 층이 있어요.

  • 입력 확장 — 자연어 + 스크린샷 + 90+ 플러그인을 통한 외부 컨텍스트
  • 실행 확장 — 터미널, GitHub, 내장 브라우저, macOS 앱 조작, 원격 devbox까지 한 에이전트가 넘나듦
  • 시간 확장 — 메모리 프리뷰로 과거 행동을 이어받고, 장시간 자동화로 "잠시 자리 비워도 이어서" 진행
이전 Codex가 "코드 질문에 대한 답"이라면, 이번 버전은 "코드 주변 업무 전체를 책임지는 러너"에 가깝습니다.

02출시 정보와 접근 경로

항목Codex for Almost Everything
발표일2026년 4월 16일
단계정식 배포 (플랜 포함 기능)
주 진입점ChatGPT 앱 내 Codex · 데스크톱 앱(macOS) · CLI · 웹
기본 모델GPT-5.4
Fast mode 모델GPT-5.3-Codex-Spark (Cerebras Wafer Scale Engine 3)
포함 플랜ChatGPT Plus · Pro Lite · Pro · Team · Enterprise
프로모션Pro $100 플랜 — 2026-05-31까지 Codex 한도 2× (총 10×)
API 단가GPT-5.4 $2.50 / $15 per 1M tokens
Codex는 이제 모델 이름이 아니라 제품 이름에 가깝게 움직입니다. 제품 안에서 "GPT-5.4 → Codex-Spark로 자동 다운시프트" 같은 라우팅이 일어나니, 엄밀히 어떤 모델이 답했는지는 작업 맥락에 따라 달라져요.

03새로 추가된 9가지 기능

01 — 컴퓨터 제어

macOS 백그라운드 컴퓨터 사용 (Background Computer Use)

Codex가 사용자와 별개의 자체 커서를 갖고 화면을 보고, 클릭하고, 타이핑합니다. 여러 에이전트를 병렬로 돌려도 내가 하는 포그라운드 작업을 막지 않아요. API가 없는 앱 자동화, 프론트엔드 앱의 에이전트 셀프 테스트처럼 "UI밖에 없는 대상도 자동화 가능"해진 게 핵심입니다.

02 — 내장 브라우저

Atlas 기반 In-app Browser

OpenAI 브라우저 Atlas의 기술이 Codex 안으로 들어왔습니다. 로컬 서버로 서빙한 웹사이트·앱을 바로 띄워 인라인 댓글로 피드백을 주고받을 수 있고, 향후 인터넷 사이트 상호작용·스크린샷·사용자 흐름 테스트까지 확장 예정입니다. Claude Design이 디자인 캔버스 안에서 닫힌 루프를 만들었다면, Codex는 개발자 루프 안에서 같은 흐름을 잡으려는 움직임입니다.

03 — 멀티모달 출력

이미지 생성 내장

이제 Codex 세션 안에서 로고·일러스트레이션·UI 목업을 바로 생성합니다. 프론트엔드 개발 중 "여기 들어갈 placeholder 이미지 만들어줘"가 별도 도구 전환 없이 끝나는 워크플로예요.

04 — 시간 확장

메모리 프리뷰 (Memory Preview)

Codex가 과거 세션의 선호·결정을 기억하고 필요할 때 꺼내 씁니다. "지난번에 우리가 쓰기로 한 라우팅 방식대로" 같은 지시가 한 번에 먹히고, 프리뷰 단계라 사용자가 기억될 항목을 직접 검토·편집할 수 있습니다.

05 — 장시간 자동화

Longer-running Automations

에이전트가 "나중에 깨어나 이어서" 작업을 끝낼 수 있게 됐습니다. GLM 5.1의 8시간 자율 실행이 "한 번에 달리는" 방식이라면, Codex는 "중간에 쉬었다가 이어지는" 일정형 에이전트 쪽입니다. 빌드·테스트·마이그레이션처럼 소요가 큰 잡을 밤 사이 진행시킬 수 있어요.

06 — 컨텍스트 허브

90+ 플러그인

외부 시스템의 컨텍스트를 Codex 세션으로 끌어오는 플러그인이 90개 이상으로 확장됐습니다. 문서·이슈 트래커·데이터 웨어하우스·관찰성 도구 등 흔히 쓰는 사내 파이프를 바인딩해두면, 매번 프롬프트에 길게 붙여 넣던 컨텍스트가 "필요할 때 자동으로" 붙습니다.

07 — 협업 통합

GitHub PR 리뷰 워크플로

PR 진단·코멘트·suggestion이 Codex 세션과 양방향으로 묶였습니다. 사람 리뷰어의 흐름을 흉내 내 파일을 훑고, 세션 안에서 수정안을 올려 체인으로 수렴합니다. Claude Opus 4.7의 /ultrareview와 같은 축의 기능이지만 플랫폼 내장(GitHub)이라는 경로가 다릅니다.

08 — 작업 공간

멀티 터미널 탭

한 Codex 창 안에서 여러 터미널을 탭으로 띄웁니다. 서버 로그 따라가며 클라이언트 빌드 돌리고, 테스트 러너는 따로 모니터하는 식의 "멀티 실행 흐름"을 세션 하나로 관리하게 됐어요.

09 — 원격 실행

원격 Devbox SSH

Codex를 원격 개발 박스에 SSH로 붙여 그 위에서 에이전트를 돌릴 수 있습니다. 로컬 맥의 자원을 쓰지 않고 고사양 클라우드 머신에서 장시간 잡을 돌리는 용도나, 회사 보안 경계 안쪽 환경에서 에이전트 운영을 필요로 하는 팀에 유용합니다.

04백그라운드 컴퓨터 제어가 왜 달라 보이나

이번 릴리스에서 가장 화제인 건 macOS 백그라운드 컴퓨터 제어입니다. 비슷한 "computer use" 기능은 작년에 Anthropic도 내놓았는데, 반응이 다른 이유는 속도와 결합도입니다.

9
새 기능
90+
플러그인
1,000+
tok/s (Spark)
10×
Pro 한도 프로모션

iOS·맥 업계의 꾸준한 테스터 Federico Viticci는 Codex의 컴퓨터 제어를 "지금까지 테스트한 어떤 LLM·데스크톱 에이전트의 컴퓨터 제어 기능보다 뛰어나다"고 평했어요. 체감 포인트는 두 가지입니다.

  • 속도 — Anthropic 기반의 Sky 같은 선행 제품 대비 반응 속도가 눈에 띄게 빠름
  • 오케스트레이션 — 한 화면에서 여러 에이전트가 동시에 다른 작업을 진행해도 사용자의 포그라운드를 건드리지 않음

동시에 Hacker News에서는 보안 우려가 제기됐습니다. 사용자 postalcoder"완전한 접근 권한이 있는 에이전트에겐 컴퓨터가 극도로 적대적인 장치가 된다"며, 텍스트 파일 한 장이 자격 증명 탈취 벡터가 될 수 있다고 지적했어요. 이 부분은 뒤에서 따로 다룹니다.

05기반 모델 — GPT-5.4 + GPT-5.3-Codex-Spark

Codex는 이제 모델이 아니라 제품입니다. 아래 두 모델을 상황에 맞춰 쓰는 형태로 움직여요.

모델포지션특징
GPT-5.4기본 / 깊은 추론SWE-Bench Pro 57.7% · OSWorld 75% · GDPval 83%
GPT-5.3-Codex-SparkFast mode / 실시간 코딩Cerebras WSE-3 호스팅, 1,000+ tok/s, ChatGPT Pro 리서치 프리뷰

Spark는 처음부터 "실시간 코딩" 용도로 설계된 경량 변형입니다. 초당 1,000 토큰 이상 속도로 대답하는 만큼, 큰 리팩터링보다는 인플레이스 자동완성이나 반복 질답에서 가치가 큽니다. 반대로 아키텍처 설계나 멀티파일 디버깅처럼 깊은 추론이 필요한 작업에선 GPT-5.4가 주력입니다.

06가격과 플랜

플랜월 요금Codex 한도비고
ChatGPT Plus$20기본 (1×)개인 사용자
ChatGPT Pro Lite$100Pro 축소판
ChatGPT Pro$200Pro $100은 프로모션으로 2× → 10× (2026-05-31까지)
API (GPT-5.4)$2.50 / $15 per 1M tokens입력 / 출력

Pro Lite($100)는 Plus 대비 더 많은 Codex를 원하지만 Pro까지는 부담스러운 사용자를 위한 중간 티어입니다. 한시적으로 Pro $100 플랜에 2× 프로모션(2026-05-31까지)이 걸려 있어 실질 한도가 10×까지 올라가요. 개인이 Codex를 업무에 깊게 쓴다면 프로모션 기간 안에 갈아타는 게 합리적일 수 있습니다.

07경쟁 지도 — Claude Code · Cursor · Aider · Claude Design

도구주 전장Codex와의 관계
Claude Code터미널 기반 깊은 코딩 에이전트직접 경쟁 — 에이전트 범위·깊이
CursorIDE 내장 AI 사이드카보완 — Cursor 안에서 Codex 호출 가능
Aider / ContinueOSS 로컬 코딩 에이전트동일 카테고리 — 유연성·비용 우위
Claude Design디자인 캔버스 + 프로토타입인접 경쟁 — 내장 브라우저 영역
GLM 5.1오픈 웨이트 에이전트간접 — 비용·주권 차별화

단순화하면 이렇습니다.

  • 에디터 옆에서 짧게 보조받고 싶다 → Cursor
  • 터미널에서 한 작업을 깊게 파고들고 싶다 → Claude Code
  • 맥에서 여러 에이전트를 백그라운드로 동시 돌리고 싶다 → Codex
  • 디자인·프로토타입까지 포함한 닫힌 루프가 필요하다 → Claude Design
  • 가중치를 내려 비용·주권을 컨트롤하고 싶다 → GLM 5.1 + 사내 러너

Codex가 차별화한 지점은 "사용자가 하는 포그라운드 작업을 건드리지 않으면서 여러 에이전트가 맥 위에서 병렬로 돌아간다"는 경험입니다. Claude Code·Cursor가 "한 세션, 한 작업"에 초점을 맞췄다면, Codex는 "세션 풀"을 겨냥하고 있어요.

08한계와 보안 우려

"맥에 손 안 대도 에이전트가 돌아간다"는 말은 매력적이지만, 그만큼 위임 범위를 다시 설계할 필요가 생깁니다.

  1. 적대적 컴퓨터 가설 — 에이전트에 전권을 주면 로컬 파일·클립보드·브라우저 세션 전부가 잠재 탈취 경로가 됩니다. "열어 본 적 없던 텍스트 파일 하나"가 자격 증명 유출 시나리오가 될 수 있다는 점, 조직 단위 도입 전에 샌드박스·권한 범위·감사 로그 설계를 먼저 끝내세요.
  2. 컴퓨터 제어의 신뢰 간극 — Hacker News billyok은 "에이전트 기능이 흥미롭지만 실제 자동화에 넘기기엔 신뢰가 부족하다"고 평했습니다. 시연용 성공률과 프로덕션 성공률은 다릅니다. 중요한 작업은 관찰 → 리플레이 → 승인 3단계로 시작하세요.
  3. 계정 한도 관리 — Codex는 플랜별 한도를 쉽게 소모합니다. Pro $100 10× 프로모션이 끝나면 체감 한도가 절반으로 줄어드니, 자동화 파이프라인을 구성할 때 상한 초과 시의 폴백(낮은 티어·API 전환)까지 미리 정해두세요.
  4. 플랫폼 락인 — 메모리·플러그인 컨텍스트가 OpenAI 계정에 묶입니다. 중립 라우팅이 필요한 팀은 동일 작업을 Claude Code오픈 웨이트로도 재현 가능한지 교차 테스트를 권장합니다.
  5. Spark의 롤아웃 범위 — 현재 ChatGPT Pro 리서치 프리뷰 한정이고 API에는 열려 있지 않습니다. "실시간 속도"를 팀 서비스에 내장하려는 계획이라면 가용성 변화를 계속 추적해야 합니다.

09Codex를 언제 써야 하나

상황권장이유
macOS 단독 워크스테이션에서 병렬 에이전트Codex백그라운드 컴퓨터 제어의 구조적 우위
야간 배치·밤새 돌리는 잡Codex장시간 자동화 + 메모리 프리뷰
API 없는 레거시 앱의 자동화CodexUI 조작 + Atlas 브라우저
터미널 + 단일 레포에서 깊은 디버깅Claude Code긴 컨텍스트 + xhigh 추론
에디터 중심 소규모 보조CursorIDE 통합 경험
오픈 웨이트 · 에어갭 환경GLM 5.1 / Gemma 4로컬 실행 + 라이선스 여유

요약하면, Codex의 프리미엄은 "사용자 포그라운드를 비워두고도 여러 에이전트가 동시에 돌아간다"는 한 줄에 있습니다. 이 가치를 체감하는 팀은 맥 워크스테이션 중심에 야간 자동화가 많은 곳, 혹은 GUI밖에 없는 외부 앱 자동화가 잦은 곳이에요.

핵심 정리

  • Codex는 2026-04-16 업데이트로 "코딩 CLI"가 아니라 "운영 엔진"으로 재포지셔닝
  • 새 기능 9가지 — macOS 백그라운드 제어, Atlas 브라우저, 이미지 생성, 메모리, 장시간 자동화, 90+ 플러그인, GitHub PR, 멀티 터미널, SSH devbox
  • 기본 GPT-5.4 + 실시간용 GPT-5.3-Codex-Spark (Cerebras WSE-3, 1,000+ tok/s)
  • Plus/Pro Lite/Pro 포함. Pro $100 프로모션으로 2026-05-31까지 Codex 한도 2× (총 10×)
  • 포지션: Cursor(에디터) · Claude Code(터미널) · Codex(데스크톱 에이전트 풀)로 역할 분화
  • 도입 전 샌드박스·권한·감사 로그 설계를 먼저 끝낼 것

같은 주에 풀린 Claude Opus 4.7, Claude Design, GPT-5.4-Cyber를 함께 읽으면 2026년 2분기 "장시간 자율 실행 + 운영 엔진" 경쟁 축이 선명해집니다. 모델 선택 전반은 Claude vs ChatGPT vs Gemini 실전 비교로 이어집니다.

자주 묻는 질문

Codex for Almost Everything은 언제 공개됐고 무엇을 추가했나요?
OpenAI가 2026년 4월 16일 공개한 Codex 대규모 업데이트입니다. macOS 백그라운드 컴퓨터 제어, Atlas 기반 내장 브라우저, 이미지 생성, 메모리 프리뷰, 장시간 자동화, 90개 이상의 플러그인, GitHub PR 리뷰 워크플로 통합, 멀티 터미널 탭, 원격 devbox SSH 연결을 한꺼번에 추가했습니다. 단순한 코딩 CLI에서 '운영 엔진'으로의 재포지셔닝이 핵심 메시지입니다.
Codex의 macOS 백그라운드 컴퓨터 제어는 정확히 어떻게 동작하나요?
Codex가 사용자와 별개의 자체 커서를 갖고 화면을 보고, 클릭하고, 타이핑할 수 있습니다. 여러 에이전트를 병렬로 돌려도 사용자의 포그라운드 작업을 방해하지 않는 구조이고, API가 없는 앱을 자동화하거나 프론트엔드 앱을 에이전트가 직접 테스트하는 시나리오에 쓰입니다. Federico Viticci는 "지금까지 테스트한 어떤 LLM·데스크톱 에이전트의 컴퓨터 제어 기능보다 뛰어나다"고 평가했습니다.
Codex는 어떤 모델을 기반으로 동작하고 속도는 어떤가요?
기본 모델은 GPT-5.4로, SWE-Bench Pro 57.7%·OSWorld 75%·GDPval 83%의 성능에 $2.50/$15 per 1M tokens의 API 가격을 가집니다. 빠른 응답이 필요한 실시간 코딩용으로는 Cerebras Wafer Scale Engine 3에서 호스팅되는 경량 변형 GPT-5.3-Codex-Spark초당 1,000 토큰 이상을 내는 "fast mode"로 제공됩니다.
Codex for Almost Everything은 어떤 플랜에서 쓸 수 있나요?
ChatGPT Plus($20/월), Pro Lite($100/월), Pro($200/월) 구독자가 추가 비용 없이 사용 가능하며, 플랜별로 Codex 사용량 한도가 다릅니다. Pro Lite는 Plus 대비 5배, Pro는 5배(2026-05-31까지 프로모션으로 Pro $100 플랜에 한해 2× = 10× 적용)의 Codex 한도를 가집니다. API 사용자는 GPT-5.4 단가($2.50 입력 / $15 출력 per 1M tokens)를 별도로 부담합니다.
Claude Code나 Cursor와 비교하면 Codex의 위치는 어디인가요?
Claude Code가 '터미널 안의 깊은 코딩 에이전트'에 집중한다면, Codex는 이번 업데이트로 '코드 + 브라우저 + 데스크톱 앱 + 플러그인'을 묶는 범용 운영 엔진으로 범위를 넓혔습니다. Cursor는 IDE 중심의 사이드카 경험이 강점이고, Codex는 macOS 단독 앱에서 백그라운드 에이전트를 여러 개 돌리는 경험이 차별 포인트입니다. 같은 코딩 작업을 놓고도 "에디터에서 옆에서 보조받기 = Cursor", "터미널에서 깊이 파기 = Claude Code", "맥에서 손 떼고 여러 에이전트 돌리기 = Codex"에 가깝습니다.