🐝매일 한입
AI Tutorial & How-to📖 14분 읽기

Claude Opus 4.7 실전 가이드: xhigh 기본값·Auto Mode·/ultrareview 완전 정리 [2026-05]

Claude Opus 4.7 달라진 점 총정리. xhigh 기본값의 의미, Max 플랜 Auto Mode 사용법, Task Budget 설정 코드까지 실무에 바로 쓸 수 있게 안내합니다.

A꿀벌I📖 14분 읽기
#Claude Opus 4.7#xhigh effort#Auto Mode#Claude Code#Task Budget#ultrareview

TL;DR Claude Opus 4.7이 4월 16일 정식 출시됐습니다. 가격은 그대로($5/$25 per M tokens)지만 Claude Code 기본 노력 단계가 xhigh로 바뀌었고, Auto Mode가 Max 플랜까지 확대됐습니다. 토크나이저 변경으로 실효 비용이 1.0~1.35배 늘 수 있으니 마이그레이션 전에 테스트가 필요합니다.

이 글에서 다루는 것:

  • xhigh 노력 단계가 기본값이 된 이유와 조절 방법
  • Max 플랜에서 Auto Mode 활성화하는 법
  • Task Budget으로 토큰 사용량 제어하기 (공개 베타)
  • /ultrareview 슬래시 커맨드 실전 활용
  • 마이그레이션 시 주의할 에러와 해결법

사실 처음엔 별로 기대를 안 했습니다.

4.6에서 4.7로 버전이 하나 올라가는 거니까, 어차피 점진적 개선이겠지 싶었거든요. 그러다 사이드 프로젝트에서 Claude Code를 쓰는데 이상한 걸 느꼈습니다. 제가 설명을 덜 해도 맥락을 더 잘 잡아왔고, 코드를 뜯어보는 깊이가 달랐습니다.

알고 보니 Claude Code의 기본 노력 단계가 xhigh로 바뀐 거였습니다.

아무 설정 없이 claude config set model claude-opus-4-7만 입력했다면, 이미 xhigh로 실행되고 있는 겁니다. 좋은 소식이지만, 동시에 토큰 사용량이 이전보다 늘어날 수 있다는 뜻이기도 합니다. 이 글은 그 차이를 제대로 이해하고, 상황에 맞게 조절하는 방법을 다룹니다.


사전 준비: 플랜과 버전 확인

기능별 플랜 지원 여부

기능FreeProMaxEnterprise
Opus 4.7 사용
xhigh 기본값
Auto Mode
/ultrareview (무료 3회/월)
Task Budget (베타)

Claude Code 버전 확인

claude --version

최신 버전이 아니라면 먼저 업데이트하세요. Opus 4.7 관련 기능은 최신 Claude Code 버전을 기준으로 합니다.


Step 1: 모델 전환

claude config set model claude-opus-4-7

# 전환 후 확인
claude config get model
# 출력: claude-opus-4-7

마이그레이션 전 필수 체크: Opus 4.7은 토크나이저가 변경됐습니다. 동일한 입력이라도 토큰 수가 이전 대비 1.0~1.35배 더 나올 수 있습니다. 비용이 민감한 환경이라면 주요 프롬프트 몇 개로 먼저 테스트해보는 게 좋습니다.

그리고 한 가지 더. temperature, top_p, top_k 같은 샘플링 파라미터를 기본값이 아닌 값으로 설정하면 Opus 4.7에서 에러가 발생합니다. API로 직접 호출하는 코드가 있다면 해당 파라미터를 제거하거나 기본값으로 돌려놔야 합니다.


Step 2: xhigh 노력 단계 이해하기

Claude에는 5단계 노력 레벨이 있습니다: low → medium → high → xhigh → max.

Claude Opus 4.7 effort level 비교 출처: Anthropic | Opus 4.7 노력 단계별 성능 비교

Opus 4.7에서 중요한 포인트 세 가지:

  • xhigh = Claude Code 기본값: 별도 설정 없이 Opus 4.7로 전환하면 자동으로 xhigh가 적용됩니다.
  • low-effort Opus 4.7 ≈ medium-effort Opus 4.6: 같은 low 설정이어도 전 버전 대비 더 강합니다.
  • xhigh는 high 대비 긴 세션에서 토큰 약 2배 소비: 에이전틱 루프가 길수록 차이가 납니다.

상황에 맞게 /effort 커맨드로 직접 조절할 수 있습니다:

/effort low      # 빠른 확인, 간단한 질문
/effort high     # 일반 개발 작업
/effort xhigh    # 기본값. 복잡한 코딩, 리팩토링
/effort max      # 가장 어려운 문제

저는 변수명 제안이나 간단한 설명 요청은 /effort high로 낮춰서 씁니다. 코드 리뷰나 버그 추적 같은 복잡한 작업은 xhigh 그대로 두고요. 이렇게 상황별로 구분하니 토큰 낭비가 꽤 줄었습니다.


Step 3: Auto Mode 활성화 (Max 플랜 한정)

Auto Mode는 Claude가 권한 프롬프트 없이 스스로 판단해서 작업을 진행하는 모드입니다. 기존엔 Enterprise 전용이었는데, Opus 4.7부터 Max 플랜까지 확대됐습니다.

Claude Opus 4.7 Auto Mode 구조 출처: Anthropic | Auto Mode 이중 분류기 구조

활성화:

# Claude Code 실행 시 플래그로
claude --auto-mode

# 세션 내에서
/auto

내부 동작 방식이 꽤 흥미롭습니다. 빠른 Haiku 패스가 도구 호출을 "안전/위험/불확실"로 분류하고, 불확실한 경우만 Opus/Sonnet 사고 경로로 넘겨서 판단합니다. 단순한 파일 읽기나 grep 같은 안전한 작업은 바로 실행되고, 위험한 작업은 PermissionDenied 훅이 발동됩니다.

쓰지 않는 게 좋은 상황:

  • 프로덕션 코드를 직접 수정하는 작업
  • 파일 삭제, DB 변경 등 되돌리기 어려운 작업

개발 환경이나 사이드 프로젝트에서 쓰는 건 편리하지만, 프로덕션 환경에선 아직 신중하게 접근하는 게 맞다고 봅니다. 이건 공식 문서에서도 권장하는 내용입니다.

Claude Code Routines 완전 정리에서 소개한 자동화 워크플로우와 Auto Mode를 함께 쓰면 반복 작업 효율이 크게 올라갑니다.


Step 4: Task Budget으로 토큰 제어하기

Task Budget은 현재 공개 베타입니다. 에이전틱 루프 전체에 소프트 토큰 한도를 설정하는 기능입니다. 한도를 정해두면 Claude가 그 범위 안에서 계획을 세우고 작업합니다.

Claude Opus 4.7 Task Budget 플로우 출처: Anthropic | Task Budget 토큰 관리 플로우

import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=128000,
    output_config={
        "effort": "xhigh",
        "task_budget": {
            "type": "tokens",
            "total": 80000  # 권장 범위: 50,000~128,000
        },
    },
    betas=["task-budgets-2026-03-13"],
    messages=[
        {"role": "user", "content": "이 코드베이스의 버그를 찾아서 수정해줘."}
    ],
)

알아두면 좋은 규칙:

  • 최소 20,000 토큰: 이 이하로 설정하면 오류가 납니다 ("모델이 의미 있게 계획할 수 없음")
  • 소프트 한도: 하드 컷이 아닙니다. 넘어갈 수 있지만 경고가 발생합니다.
  • 권장 범위: 작업 복잡도에 따라 50,000~128,000 토큰

긴 코드베이스 분석이나 여러 파일을 수정하는 작업을 자동화할 때 예상치 못한 토큰 폭발을 막는 데 유용합니다.

Claude Opus 4.7 agentic workflow 출처: Anthropic | Opus 4.7 에이전틱 워크플로우


Step 5: /ultrareview 슬래시 커맨드

코드 리뷰가 필요할 때 쓰는 신규 커맨드입니다. Claude Code 세션에서 그냥 입력하면 됩니다:

/ultrareview

변경사항을 처음부터 끝까지 다시 읽으면서 잡아내는 것들:

  • 테스트는 통과하지만 엣지 케이스에서 실패하는 로직 오류
  • 컴포넌트 간 상호작용에서 발생하는 보안 이슈
  • 비동기 코드의 의도치 않은 state 버그

Pro/Max 플랜 사용자는 매달 3회 무료로 쓸 수 있고, 초과분은 Opus 4.7 기본 토큰으로 소비됩니다.

처음엔 솔직히 "그냥 또 다른 리뷰 기능이겠지"라고 생각했습니다. 쓰다 보니 달랐습니다. 특히 비동기 코드에서 숨어있던 race condition을 잡아낸 건 인상적이었습니다. 큰 PR 올리기 전에 무료 3회를 잘 활용하는 게 좋을 것 같습니다.

Claude Code 4월 업데이트 총정리에서 소개한 MCP 500K, 세션 안정성 기능과 조합하면 리뷰 품질이 한 단계 올라갑니다.


자주 발생하는 에러와 해결법

1. 샘플링 파라미터 오류

Error: Non-default sampling parameters are not supported for claude-opus-4-7

Opus 4.7은 temperature, top_p, top_k를 기본값이 아닌 값으로 지정하면 에러가 납니다.

# 이렇게 쓰면 에러
response = client.messages.create(
    model="claude-opus-4-7",
    temperature=0.7,  # ← 오류 발생
    messages=[...]
)

# 이렇게 수정 (파라미터 제거)
response = client.messages.create(
    model="claude-opus-4-7",
    messages=[...]
)

2. Task Budget 최솟값 오류

Error: Task budget must be at least 20,000 tokens

total 값을 20,000 이상으로 설정하면 해결됩니다.

3. 토큰 사용량이 예상보다 많이 나올 때

이건 버그가 아닙니다. 새 토크나이저로 인해 동일한 입력이 더 많은 토큰을 소비합니다. 비용을 줄이려면 /effort high로 낮추거나, Task Budget을 설정하거나, 프롬프트를 좀 더 간결하게 다듬는 방법을 씁니다.


성능 수치 요약

벤치마크Opus 4.6Opus 4.7GPT-5.4
SWE-bench Pro~52%64.3%57.7%
CursorBench58%70%
XBOW Visual Acuity~54%98.5%
BigLaw Bench90.9%

SWE-bench Pro 기준으로 GPT-5.4(57.7%)를 앞서는 64.3%는 단순한 수치가 아닙니다. 실제로 복잡한 코딩 작업에서 체감이 됩니다. CursorBench도 58% → 70%로 12포인트 올랐고, 이건 AI 코딩 도구를 평가하는 대표적인 벤치마크라 의미 있는 수치입니다.

Claude Opus 4.7 벤치마크 성능 출처: Anthropic | Opus 4.7 주요 벤치마크 성능


정리: 실천 체크리스트

Opus 4.7로 넘어갈 때 확인할 것들:

  1. claude config set model claude-opus-4-7 — 모델 전환
  2. 토크나이저 변경 인지 — 비용 민감 환경은 테스트 먼저
  3. temperature/top_p/top_k 코드에서 제거 — API 사용 시 필수
  4. xhigh 기본값 이해 — 작업별로 /effort 조절
  5. Max 플랜이라면 Auto Mode 개발 환경에서 시험
  6. Task Budget 설정 — 긴 에이전틱 루프에 소프트 한도 부여
  7. /ultrareview — 큰 PR 전 무료 3회 활용

가격이 그대로인 상태에서 성능이 올랐고, Auto Mode가 Max까지 내려온 건 확실히 반가운 소식입니다. 토크나이저 변경과 샘플링 파라미터 제약만 주의하면, 마이그레이션은 생각보다 간단합니다.


참고 자료

함께 읽으면 좋은 글:

📚 관련 글

💬 댓글