[GeekNews 요약] Claude Code 및 Codex 설정 최적화로 LLM 토큰 사용량 절약하기

14

설명

최근 Claude Opus 4.7 업데이트와 Claude Code의 캐싱 정책 변경으로 인해 LLM 토큰 사용량이 급증하여 개발 비용 부담과 성능 저하가 발생하고 있습니다. 특히 코딩 에이전트를 활용하는 개발자라면 이러한 변화에 민감할 수밖에 없습니다. 이 글은 Claude Code와 Codex 사용자들이 다양한 설정 및 환경변수 조정을 통해 토큰 사용량을 효율적으로 관리하고, 비용을 절감하며, 작업 효율성을 높일 수 있는 구체적인 방법을 제시합니다. ### 1. 왜 토큰 절약이 중요한가? Claude Opus 4.7은 성능 향상과 함께 토큰 사용량 변화가 두드러집니다. 업데이트된 토크나이저로 인해 동일 입력이 1.0~1.35배 더 많은 토큰으로 매핑될 수 있으며, 특히 에이전트 설정의 후반 턴에서 더 많은 추론을 하면서 출력 토큰이 증가합니다. 또한, Claude Code의 캐싱 TTL이 1시간에서 5분으로 줄어들면서 토큰 효율이 급격히 떨어졌습니다. 실제로 Opus 4.7은 4.6 대비 거의 1.5배 가까이 토큰을 더 소모한다는 보고도 있어, 토큰 리밋에 자주 고통받는 개발자들에게는 설정 최적화가 필수적입니다. 이 글은 클로드 코드 공식문서, 코덱스 공식문서, 코덱스 소스코드 등을 바탕으로 토큰 효율을 끌어올리는 방법을 다룹니다. ### 2. 토큰이 소모되는 주요 경로 코딩 에이전트에서 토큰이 불필요하게 소모되는 경로는 크게 세 가지로 요약됩니다. 첫째, 매 세션 또는 매 턴마다 자동으로 붙는 추가 텍스트입니다. 둘째, 대화 히스토리에 너무 길게 남는 툴 호출 출력입니다. 셋째, 검색, 커넥터, IDE 연동과 같은 외부 연결로 인한 추가 호출입니다. 이러한 경로들을 설정 변경을 통해 어떻게 줄일 수 있는지, 그리고 그에 따른 트레이드오프는 무엇인지 살펴보겠습니다. 기본적인 모델 및 리즈닝 정도 조절 등은 생략합니다. ### 3. Claude Code 토큰 효율 설정 Claude Code (최종 확인 버전: 2.1.114)의 토큰 효율을 높이는 주요 설정은 다음과 같습니다: 1. `includeGitInstructions: false` (기본값: true): Git 지침 포함 여부를 결정하여 불필요한 컨텍스트 주입을 막습니다. 2. `autoConnectIde: false` (기본값: false): 외부 터미널에서 IDE 자동 연결 여부를 결정합니다. IDE 문맥 연결이 불필요한 경우 끄는 것이 좋습니다. 3. `CLAUDE_CODE_GLOB_NO_IGNORE=false` (기본값: true): `.gitignore`에 등재된 파일을 Glob 검색 결과에서 제외하여 불필요한 파일 읽기를 줄입니다. 모노리포에서 특히 효과적입니다. 4. **출력 상한 설정**: `BASH_MAX_OUTPUT_LENGTH`, `CLAUDE_CODE_FILE_READ_MAX_OUTPUT_TOKENS`, `MAX_MCP_OUTPUT_TOKENS` 등의 환경변수로 bash 출력, 파일 읽기, MCP 도구 출력의 최대 토큰 수를 조절하여 대용량 출력으로 인한 컨텍스트 급증을 방지합니다. 5. **짧고 간단한 작업 또는 비대화형 모드를 위한 환경변수 및 플래그**: `ENABLE_CLAUDEAI_MCP_SERVERS=false`, `CLAUDE_CODE_DISABLE_AUTO_MEMORY=1`, `CLAUDE_CODE_DISABLE_CLAUDE_MDS=1`, `CLAUDE_AGENT_SDK_DISABLE_BUILTIN_AGENTS=1` 등의 환경변수와 `--tools`, `--strict-mcp-config`, `--disable-slash-commands`, `--no-session-persistence`, `--exclude-dynamic-system-prompt-sections`, `--system-prompt` 등의 플래그를 활용하여 초기 주입 컨텍스트를 최소화하고 불확정성을 줄일 수 있습니다. 이를 통해 비대화형 워커로 활용 시 토큰 절약, 구동/응답 속도 향상에 기여합니다. 6. **Attribution 비우기**: `{"attribution": {"commit": "", "pr": ""}}` 설정을 통해 커밋과 PR에 자동으로 붙는 AI 생성 표시를 제거하여 간접적인 토큰 소모를 줄일 수 있습니다. ### 4. Codex 토큰 효율 설정 Codex (최종 확인 버전: 0.121.0)는 Claude Code보다 조절 가능한 레버가 적지만, 다음 설정들을 통해 토큰 효율을 높일 수 있습니다: 1. **ChatGPT에 연결된 MCP(앱/커넥터) 끄기**: `features.apps: false` 및 `apps._default.enabled: false` 설정을 통해 ChatGPT에 연결된 불필요한 앱/커넥터 정보가 시스템 프롬프트에 주입되는 것을 방지합니다. 2. `web_search = "disabled"`: Codex CLI features의 Web search 섹션에서 웹 검색을 비활성화하여, 검색이 불필요한 로컬 코드베이스 작업 시 에이전트가 검색 툴 호출로 빠지는 것을 방지합니다. 3. `tool_output_token_limit` (기본값: 10,000): 개별 툴 출력의 최대 저장 토큰 수를 결정하여 대용량 파일이나 검색 결과로 인한 세션 급팽창 문제를 해결합니다. Claude와 동일한 트레이드오프가 존재합니다. 4. **비대화형 모드에서 잘 돌게 만드는 플래그들**: `codex exec` 사용 시 `--profile`, `--json`, `--output-last-message FILE`, `--sandbox read-only`, `--skip-git-repo-check`, `--ephemeral`, `--color never` 등의 플래그를 활용하여 토큰 효율, 속도, 안정성을 높일 수 있습니다. 5. **Attribution 비우기**: `commit_attribution = ""` 설정을 통해 커밋 로그를 깔끔하게 유지하고 간접적인 토큰 소모를 줄일 수 있습니다. ### 가치와 인사이트 이 글은 LLM 기반 코딩 에이전트의 토큰 사용량을 최적화하여 개발 비용을 절감하고 작업 효율성을 높이는 실질적인 가이드를 제공합니다. 특히 Claude Code와 Codex 사용자들이 각자의 작업 환경과 요구사항에 맞춰 설정을 미세 조정함으로써, 불필요한 컨텍스트 주입을 막고, 툴 호출을 최소화하며, 비대화형 자동화 작업의 속도와 안정성을 향상시킬 수 있습니다. 이는 단순히 토큰을 아끼는 것을 넘어, LLM 에이전트를 더욱 스마트하고 경제적으로 활용하는 데 필수적인 통찰을 제공하며, 장기적으로는 LLM 기반 개발 워크플로우의 생산성과 지속 가능성을 높이는 데 기여할 것입니다. ### 기술·메타 - **LLM**: Claude Opus 4.7, Claude Code, OpenAI Codex, ChatGPT - **IDE**: JetBrains, VS Code - **CLI/Shell**: .zshrc, Bash - **개념**: Tokenizer, Glob, MCP (Multi-Agent Communication Protocol), TTL (Time To Live), Attribution - **참고 자료**: Claude Code 공식 문서 (settings, env variables, IDE), Codex 공식 문서 (config reference, CLI features), OpenAI MCP and Connectors, OpenAI Codex repository, GitHub Gist 📝 원문 및 참고 - 원문: [링크 열기](https://www.stdy.blog/increasing-token-efficiency-by-setting-adjustment-in-claude-and-codex/) - GeekNews 토픽: [보기](https://news.hada.io/topic?id=28697) --- 출처: GeekNews ([원문 링크](https://www.stdy.blog/increasing-token-efficiency-by-setting-adjustment-in-claude-and-codex/))
사이트 방문하기Visit Service

댓글 0

아직 댓글이 없습니다. 첫 댓글을 남겨 보세요.