[GeekNews 요약] Anthropic, Claude Opus 4.7 출시: 셀프 검증, 고해상도 비전, 코딩 능력 13% 향상

25

설명

Anthropic이 최신 모델 Claude Opus 4.7을 정식 출시했습니다. 이 모델은 특히 고급 소프트웨어 엔지니어링 작업에서 Opus 4.6 대비 상당한 발전을 이루었으며, 개발자들이 가장 어려운 코딩 작업을 자신 있게 맡길 수 있도록 설계되었습니다. 셀프 검증 기능, 3.3배 향상된 고해상도 비전, 그리고 벤치마크에서 13% 개선된 코딩 성능을 통해 복잡하고 장기적인 작업을 더욱 엄격하고 일관성 있게 처리합니다. 이번 업데이트는 AI 모델의 신뢰성과 효율성을 한 단계 끌어올려, 실제 업무 환경에서의 활용 가능성을 크게 확장할 것으로 기대됩니다. ### 1. Claude Opus 4.7은 무엇인가 Claude Opus 4.7은 Anthropic의 최신 플래그십 모델로, Opus 4.6의 후속작입니다. 특히 고급 소프트웨어 엔지니어링 분야에서 눈에 띄는 개선을 보이며, 가장 어려운 작업에서도 뛰어난 성능을 발휘합니다. 사용자는 이제 복잡하고 장기적인 코딩 작업을 Opus 4.7에 더욱 신뢰하고 맡길 수 있게 되었습니다. 이 모델은 지침에 정확하게 주의를 기울이고, 보고하기 전에 자체 출력을 검증하는 방법을 고안하여 엄격함과 일관성을 유지합니다. ### 2. 주요 개선 사항 Opus 4.7은 여러 면에서 Opus 4.6을 뛰어넘는 성능을 제공합니다. 셀프 검증 및 일관성 기능을 통해 복잡한 작업을 엄격하게 처리하며, 지침에 세심하게 주의를 기울이고 자체 출력을 검증합니다. 고해상도 비전은 이미지를 3.3배 더 높은 해상도(최대 2,576픽셀, 약 3.75메가픽셀)로 볼 수 있게 하여, 밀도 높은 스크린샷 판독이나 복잡한 다이어그램 데이터 추출 등 세밀한 시각적 정보가 필요한 멀티모달 사용 사례를 지원합니다. 코딩 성능은 93개 코딩 벤치마크에서 Opus 4.6 대비 13% 향상되었으며, 이전 모델들이 해결하지 못했던 4가지 작업도 처리합니다. 또한, 전문적인 작업을 완료할 때 더욱 세련되고 창의적인 결과물을 생성하며, 이전 모델보다 지침을 문자 그대로 따르는 경향이 강해 프롬프트 재조정이 필요할 수 있습니다. 파일 시스템 기반 메모리 기능으로 장기적이고 여러 세션에 걸친 작업에서 중요한 메모를 기억하고 활용하여, 새로운 작업에 필요한 사전 컨텍스트를 줄여줍니다. 안전성 측면에서는 Opus 4.6과 유사한 프로필을 유지하며, 일부 측정에서는 개선되었지만 Mythos Preview가 가장 잘 정렬된 모델로 남아있습니다. ### 3. 사이버 보안 및 안전 Anthropic은 Project Glasswing의 일환으로 AI 모델의 사이버 보안 위험과 이점을 강조하며, Mythos Preview의 출시를 제한하고 덜 강력한 모델에 새로운 사이버 안전 장치를 먼저 테스트하겠다고 밝혔습니다. Opus 4.7은 이러한 첫 번째 모델로, 금지되거나 고위험 사이버 보안 사용을 나타내는 요청을 자동으로 감지하고 차단하는 안전 장치와 함께 출시됩니다. 합법적인 사이버 보안 목적(취약점 연구, 침투 테스트, 레드팀)으로 Opus 4.7을 사용하려는 보안 전문가는 새로운 사이버 검증 프로그램(Cyber Verification Program)에 참여할 수 있습니다. ### 4. 개발자 및 파트너 피드백 초기 액세스 테스터들은 Claude Opus 4.7에 대해 강력한 긍정적 피드백을 보냈습니다. 금융 기술 플랫폼은 속도와 정밀도의 조합이 개발 속도를 가속화할 것이라고 언급했으며, Hex는 Opus 4.7이 데이터 누락 시 올바르게 보고하고 잘못된 대체 정보를 제공하지 않는다고 평가했습니다. Replit은 낮은 비용으로 동일한 품질을 달성하며 로그 분석, 버그 찾기, 수정 제안과 같은 작업에서 더 효율적이고 정확하다고 밝혔습니다. Notion Agent는 복잡한 다단계 워크플로우에서 Opus 4.6 대비 14% 향상된 성능과 더 적은 토큰 사용, 그리고 도구 오류 감소를 통해 진정한 팀원처럼 느껴진다고 강조했습니다. CodeRabbit은 코드 리뷰 워크로드에서 10% 이상의 리콜 향상을 보이며 가장 감지하기 어려운 버그를 찾아낸다고 보고했습니다. Warp는 이전 Claude 모델이 해결하지 못했던 까다로운 동시성 버그를 해결하는 등 현저히 더 철저하다고 평가했습니다. ### 5. 추가 기능 및 마이그레이션 Opus 4.7은 'high'와 'max' 사이에 'xhigh'라는 새로운 노력 수준을 도입하여, 어려운 문제에서 추론과 지연 시간 간의 균형을 더 세밀하게 제어할 수 있게 합니다. Claude Code에서는 모든 플랜의 기본 노력 수준이 'xhigh'로 상향 조정되었습니다. Claude Platform(API)에서는 고해상도 이미지 지원 외에도, 개발자가 장기 실행 작업에서 Claude의 토큰 사용을 안내할 수 있는 '작업 예산(task budgets)' 기능이 공개 베타로 출시되었습니다. Claude Code의 새로운 `/ultrareview` 슬래시 명령은 변경 사항을 검토하고 버그 및 디자인 문제를 식별하는 전용 검토 세션을 제공하며, Max 사용자에게는 Claude가 사용자를 대신하여 결정을 내리는 '자동 모드(auto mode)'가 확장되었습니다. Opus 4.7으로 마이그레이션 시, 업데이트된 토크나이저로 인해 동일한 입력이 더 많은 토큰(약 1.0~1.35배)으로 매핑될 수 있으며, 높은 노력 수준에서 더 많은 추론을 수행하여 더 많은 출력 토큰을 생성할 수 있음을 고려해야 합니다. 사용자는 노력 매개변수 조정, 작업 예산 설정, 모델에 간결함을 요청하는 등의 방법으로 토큰 사용량을 제어할 수 있습니다. ### 가치와 인사이트 Claude Opus 4.7은 개발자와 IT 전문가에게 전례 없는 수준의 자율성, 정확성, 효율성을 제공합니다. 셀프 검증 기능과 향상된 코딩 능력은 복잡하고 장기적인 소프트웨어 개발 프로젝트의 생산성을 혁신적으로 높일 수 있습니다. 고해상도 비전은 시각적 정보에 의존하는 다양한 산업 분야에서 새로운 활용 사례를 창출하며, 정교한 지침 준수와 개선된 메모리 기능은 에이전트 기반 워크플로우의 신뢰성을 크게 향상시킵니다. 특히, 사이버 보안에 대한 Anthropic의 신중한 접근 방식과 함께 출시된 Opus 4.7은 기업 환경에서 AI 모델을 안전하게 통합하고 활용하는 데 중요한 이정표가 될 것입니다. 이는 단순히 더 나은 모델을 넘어, AI가 실제 업무에서 '팀원'으로서 기능하는 새로운 시대를 열고 있습니다. ### 기술·메타 - **API 이름**: `claude-opus-4-7` - **가격**: Opus 4.6과 동일 (입력 토큰 백만 개당 $5, 출력 토큰 백만 개당 $25) - **지원 플랫폼**: Claude 제품군, API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry - **특징**: 업데이트된 토크나이저, 'xhigh' 노력 수준, 작업 예산(베타), `/ultrareview` 명령, 자동 모드(Max 사용자) 📝 원문 및 참고 - 원문: [링크 열기](https://www.anthropic.com/news/claude-opus-4-7) - GeekNews 토픽: [보기](https://news.hada.io/topic?id=28611) --- 출처: GeekNews ([원문 링크](https://www.anthropic.com/news/claude-opus-4-7))
사이트 방문하기Visit Service

댓글 0

아직 댓글이 없습니다. 첫 댓글을 남겨 보세요.