TL;DR Claude Opus 4.7이 4월 16일 정식 출시됐습니다. 가격은 그대로($5/$25 per M tokens)지만 Claude Code 기본 노력 단계가 xhigh로 바뀌었고, Auto Mode가 Max 플랜까지 확대됐습니다. 토크나이저 변경으로 실효 비용이 1.0~1.35배 늘 수 있으니 마이그레이션 전에 테스트가 필요합니다.
이 글에서 다루는 것:
- xhigh 노력 단계가 기본값이 된 이유와 조절 방법
- Max 플랜에서 Auto Mode 활성화하는 법
- Task Budget으로 토큰 사용량 제어하기 (공개 베타)
- /ultrareview 슬래시 커맨드 실전 활용
- 마이그레이션 시 주의할 에러와 해결법
사실 처음엔 별로 기대를 안 했습니다.
4.6에서 4.7로 버전이 하나 올라가는 거니까, 어차피 점진적 개선이겠지 싶었거든요. 그러다 사이드 프로젝트에서 Claude Code를 쓰는데 이상한 걸 느꼈습니다. 제가 설명을 덜 해도 맥락을 더 잘 잡아왔고, 코드를 뜯어보는 깊이가 달랐습니다.
알고 보니 Claude Code의 기본 노력 단계가 xhigh로 바뀐 거였습니다.
아무 설정 없이 claude config set model claude-opus-4-7만 입력했다면, 이미 xhigh로 실행되고 있는 겁니다. 좋은 소식이지만, 동시에 토큰 사용량이 이전보다 늘어날 수 있다는 뜻이기도 합니다. 이 글은 그 차이를 제대로 이해하고, 상황에 맞게 조절하는 방법을 다룹니다.
사전 준비: 플랜과 버전 확인
기능별 플랜 지원 여부
| 기능 | Free | Pro | Max | Enterprise |
|---|---|---|---|---|
| Opus 4.7 사용 | ✗ | ✓ | ✓ | ✓ |
| xhigh 기본값 | — | ✓ | ✓ | ✓ |
| Auto Mode | ✗ | ✗ | ✓ | ✓ |
| /ultrareview (무료 3회/월) | — | ✓ | ✓ | — |
| Task Budget (베타) | ✓ | ✓ | ✓ | ✓ |
Claude Code 버전 확인
claude --version
최신 버전이 아니라면 먼저 업데이트하세요. Opus 4.7 관련 기능은 최신 Claude Code 버전을 기준으로 합니다.
Step 1: 모델 전환
claude config set model claude-opus-4-7
# 전환 후 확인
claude config get model
# 출력: claude-opus-4-7
마이그레이션 전 필수 체크: Opus 4.7은 토크나이저가 변경됐습니다. 동일한 입력이라도 토큰 수가 이전 대비 1.0~1.35배 더 나올 수 있습니다. 비용이 민감한 환경이라면 주요 프롬프트 몇 개로 먼저 테스트해보는 게 좋습니다.
그리고 한 가지 더. temperature, top_p, top_k 같은 샘플링 파라미터를 기본값이 아닌 값으로 설정하면 Opus 4.7에서 에러가 발생합니다. API로 직접 호출하는 코드가 있다면 해당 파라미터를 제거하거나 기본값으로 돌려놔야 합니다.
Step 2: xhigh 노력 단계 이해하기
Claude에는 5단계 노력 레벨이 있습니다: low → medium → high → xhigh → max.
출처: Anthropic | Opus 4.7 노력 단계별 성능 비교
Opus 4.7에서 중요한 포인트 세 가지:
- xhigh = Claude Code 기본값: 별도 설정 없이 Opus 4.7로 전환하면 자동으로 xhigh가 적용됩니다.
- low-effort Opus 4.7 ≈ medium-effort Opus 4.6: 같은 low 설정이어도 전 버전 대비 더 강합니다.
- xhigh는 high 대비 긴 세션에서 토큰 약 2배 소비: 에이전틱 루프가 길수록 차이가 납니다.
상황에 맞게 /effort 커맨드로 직접 조절할 수 있습니다:
/effort low # 빠른 확인, 간단한 질문
/effort high # 일반 개발 작업
/effort xhigh # 기본값. 복잡한 코딩, 리팩토링
/effort max # 가장 어려운 문제
저는 변수명 제안이나 간단한 설명 요청은 /effort high로 낮춰서 씁니다. 코드 리뷰나 버그 추적 같은 복잡한 작업은 xhigh 그대로 두고요. 이렇게 상황별로 구분하니 토큰 낭비가 꽤 줄었습니다.
Step 3: Auto Mode 활성화 (Max 플랜 한정)
Auto Mode는 Claude가 권한 프롬프트 없이 스스로 판단해서 작업을 진행하는 모드입니다. 기존엔 Enterprise 전용이었는데, Opus 4.7부터 Max 플랜까지 확대됐습니다.
출처: Anthropic | Auto Mode 이중 분류기 구조
활성화:
# Claude Code 실행 시 플래그로
claude --auto-mode
# 세션 내에서
/auto
내부 동작 방식이 꽤 흥미롭습니다. 빠른 Haiku 패스가 도구 호출을 "안전/위험/불확실"로 분류하고, 불확실한 경우만 Opus/Sonnet 사고 경로로 넘겨서 판단합니다. 단순한 파일 읽기나 grep 같은 안전한 작업은 바로 실행되고, 위험한 작업은 PermissionDenied 훅이 발동됩니다.
쓰지 않는 게 좋은 상황:
- 프로덕션 코드를 직접 수정하는 작업
- 파일 삭제, DB 변경 등 되돌리기 어려운 작업
개발 환경이나 사이드 프로젝트에서 쓰는 건 편리하지만, 프로덕션 환경에선 아직 신중하게 접근하는 게 맞다고 봅니다. 이건 공식 문서에서도 권장하는 내용입니다.
Claude Code Routines 완전 정리에서 소개한 자동화 워크플로우와 Auto Mode를 함께 쓰면 반복 작업 효율이 크게 올라갑니다.
Step 4: Task Budget으로 토큰 제어하기
Task Budget은 현재 공개 베타입니다. 에이전틱 루프 전체에 소프트 토큰 한도를 설정하는 기능입니다. 한도를 정해두면 Claude가 그 범위 안에서 계획을 세우고 작업합니다.
출처: Anthropic | Task Budget 토큰 관리 플로우
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=128000,
output_config={
"effort": "xhigh",
"task_budget": {
"type": "tokens",
"total": 80000 # 권장 범위: 50,000~128,000
},
},
betas=["task-budgets-2026-03-13"],
messages=[
{"role": "user", "content": "이 코드베이스의 버그를 찾아서 수정해줘."}
],
)
알아두면 좋은 규칙:
- 최소 20,000 토큰: 이 이하로 설정하면 오류가 납니다 ("모델이 의미 있게 계획할 수 없음")
- 소프트 한도: 하드 컷이 아닙니다. 넘어갈 수 있지만 경고가 발생합니다.
- 권장 범위: 작업 복잡도에 따라 50,000~128,000 토큰
긴 코드베이스 분석이나 여러 파일을 수정하는 작업을 자동화할 때 예상치 못한 토큰 폭발을 막는 데 유용합니다.
출처: Anthropic | Opus 4.7 에이전틱 워크플로우
Step 5: /ultrareview 슬래시 커맨드
코드 리뷰가 필요할 때 쓰는 신규 커맨드입니다. Claude Code 세션에서 그냥 입력하면 됩니다:
/ultrareview
변경사항을 처음부터 끝까지 다시 읽으면서 잡아내는 것들:
- 테스트는 통과하지만 엣지 케이스에서 실패하는 로직 오류
- 컴포넌트 간 상호작용에서 발생하는 보안 이슈
- 비동기 코드의 의도치 않은 state 버그
Pro/Max 플랜 사용자는 매달 3회 무료로 쓸 수 있고, 초과분은 Opus 4.7 기본 토큰으로 소비됩니다.
처음엔 솔직히 "그냥 또 다른 리뷰 기능이겠지"라고 생각했습니다. 쓰다 보니 달랐습니다. 특히 비동기 코드에서 숨어있던 race condition을 잡아낸 건 인상적이었습니다. 큰 PR 올리기 전에 무료 3회를 잘 활용하는 게 좋을 것 같습니다.
Claude Code 4월 업데이트 총정리에서 소개한 MCP 500K, 세션 안정성 기능과 조합하면 리뷰 품질이 한 단계 올라갑니다.
자주 발생하는 에러와 해결법
1. 샘플링 파라미터 오류
Error: Non-default sampling parameters are not supported for claude-opus-4-7
Opus 4.7은 temperature, top_p, top_k를 기본값이 아닌 값으로 지정하면 에러가 납니다.
# 이렇게 쓰면 에러
response = client.messages.create(
model="claude-opus-4-7",
temperature=0.7, # ← 오류 발생
messages=[...]
)
# 이렇게 수정 (파라미터 제거)
response = client.messages.create(
model="claude-opus-4-7",
messages=[...]
)
2. Task Budget 최솟값 오류
Error: Task budget must be at least 20,000 tokens
total 값을 20,000 이상으로 설정하면 해결됩니다.
3. 토큰 사용량이 예상보다 많이 나올 때
이건 버그가 아닙니다. 새 토크나이저로 인해 동일한 입력이 더 많은 토큰을 소비합니다. 비용을 줄이려면 /effort high로 낮추거나, Task Budget을 설정하거나, 프롬프트를 좀 더 간결하게 다듬는 방법을 씁니다.
성능 수치 요약
| 벤치마크 | Opus 4.6 | Opus 4.7 | GPT-5.4 |
|---|---|---|---|
| SWE-bench Pro | ~52% | 64.3% | 57.7% |
| CursorBench | 58% | 70% | — |
| XBOW Visual Acuity | ~54% | 98.5% | — |
| BigLaw Bench | — | 90.9% | — |
SWE-bench Pro 기준으로 GPT-5.4(57.7%)를 앞서는 64.3%는 단순한 수치가 아닙니다. 실제로 복잡한 코딩 작업에서 체감이 됩니다. CursorBench도 58% → 70%로 12포인트 올랐고, 이건 AI 코딩 도구를 평가하는 대표적인 벤치마크라 의미 있는 수치입니다.
출처: Anthropic | Opus 4.7 주요 벤치마크 성능
정리: 실천 체크리스트
Opus 4.7로 넘어갈 때 확인할 것들:
claude config set model claude-opus-4-7— 모델 전환- 토크나이저 변경 인지 — 비용 민감 환경은 테스트 먼저
temperature/top_p/top_k코드에서 제거 — API 사용 시 필수- xhigh 기본값 이해 — 작업별로
/effort조절 - Max 플랜이라면 Auto Mode 개발 환경에서 시험
- Task Budget 설정 — 긴 에이전틱 루프에 소프트 한도 부여
- /ultrareview — 큰 PR 전 무료 3회 활용
가격이 그대로인 상태에서 성능이 올랐고, Auto Mode가 Max까지 내려온 건 확실히 반가운 소식입니다. 토크나이저 변경과 샘플링 파라미터 제약만 주의하면, 마이그레이션은 생각보다 간단합니다.
참고 자료
- Introducing Claude Opus 4.7 — Anthropic, 2026년 4월 16일
- Claude Opus 4.7 for Coding Agents: xhigh, /ultrareview & Task Budgets — Verdent Guides, 2026년 4월 기준
- Claude Opus 4.7: Vision, Coding Gains, and xhigh Effort — ClaudeFA.st, 2026년 4월 기준
함께 읽으면 좋은 글:
- Claude Code 4월 업데이트 총정리: /powerup, MCP 500K, 세션 안정성 - Opus 4.7 직전 업데이트 내용 정리
- Claude Code Routines 완전 정리: 크론 없이 스케줄·API·GitHub 웹훅 자동화 - Auto Mode와 함께 활용할 수 있는 자동화 가이드