[Hacker News 요약] 정체불명의 Hy3 LLM, OpenRouter 랭킹 상위권 차지 미스터리 분석
29
설명
최근 LLM(대규모 언어 모델) 시장은 새로운 모델의 출시가 봇물 터지듯 이어지며 빠르게 변화하고 있습니다. 이러한 흐름 속에서 다양한 LLM에 단일 API로 접근할 수 있게 해주는 OpenRouter 서비스는 사용자들의 실제 LLM 활용 데이터를 기반으로 모델 랭킹을 공개하며 주목받고 있습니다. 그런데 이 랭킹에서 정체불명의 'Hy3 preview' 모델이 기존 강자들을 제치고 상위권을 차지하는 기이한 현상이 포착되었습니다. 본 글은 이 미스터리한 Hy3 모델의 인기 비결을 파헤치고, LLM 시장의 숨겨진 경제학을 분석합니다.
### 배경 설명
현재 LLM 시장은 기술 발전만큼이나 비용 효율성이 중요한 화두로 떠오르고 있습니다. 특히 에이전트 기반의 코딩 작업 등 복잡한 워크플로우에서는 LLM API 호출 비용이 기하급수적으로 증가할 수 있어, 개발자와 기업들은 성능과 더불어 가격 경쟁력을 면밀히 따지고 있습니다. OpenRouter는 이러한 환경에서 여러 LLM 제공자들의 API를 통합하여 개발자들이 손쉽게 모델을 전환하고 테스트할 수 있는 플랫폼을 제공합니다. 이 과정에서 OpenRouter는 사용자들의 실제 토큰 사용량 데이터를 축적하며, 이는 LLM 랩들이 경쟁상의 이유로 공개하지 않는 귀중한 정보가 됩니다.
이러한 데이터는 단순히 '명시된 가격'만으로는 알 수 없는 LLM의 '실질적인 비용'을 이해하는 데 결정적인 역할을 합니다. 특히 LLM 호출의 비상태성(statelessness)과 이로 인한 입력 토큰의 반복 처리 문제는 '프롬프트 캐싱(Prompt Caching)'이라는 기술로 해결되고 있으며, 이 캐싱 효율이 모델의 최종 비용에 막대한 영향을 미칩니다. 대부분의 LLM API 호출에서 입력 토큰이 전체 비용의 98%를 차지한다는 점을 고려할 때, 캐싱 전략은 LLM 경제학의 핵심 변수로 부상했습니다. 따라서 단순히 모델의 성능이나 명시된 가격만으로 LLM의 가치를 판단하기는 어려우며, 실제 사용 환경에서의 '유효 가격(effective pricing)'을 이해하는 것이 중요해졌습니다.
### 정체불명의 Hy3, 랭킹 상위권에 오르다
OpenRouter 랭킹에서 'Hy3 preview' 모델이 DeepSeek Flash V4와 함께 Claude와 같은 인기 모델을 50% 이상 앞지르며 토큰 사용량 1위를 차지했습니다. Hy3는 중국 대기업 텐센트(Tencent)가 오픈 소스로 공개한 모델로 알려져 있지만, 허깅페이스(Hugging Face) 페이지는 정보가 부족하고 벤치마크 결과도 다른 중국 모델에 비해 인상적이지 않습니다. 심지어 초기에는 무료로 제공되었으나, 유료 전환 후에도 사용량이 꾸준히 유지되며 그 인기가 미스터리로 남아있습니다. 저자의 비과학적인 테스트 결과, Hy3의 품질은 Claude Opus나 GPT-5.5 수준에는 미치지 못하는 것으로 나타났습니다.
### 명시된 가격과 실질 가격의 괴리
처음에는 Hy3가 DeepSeek V4 Flash보다 저렴한 $0.066/1M 입력 토큰(DeepSeek은 $0.10/1M)이라는 점이 인기의 이유로 추정되었습니다. 그러나 LLM API 호출 비용의 대부분(98%)이 입력 토큰에서 발생하며, 이 입력 토큰은 대화가 진행될수록 누적되어 재처리된다는 점이 간과되었습니다. 이를 해결하기 위해 대부분의 LLM 제공자는 '프롬프트 캐싱'을 구현하여 이전에 처리된 입력 토큰을 재사용함으로써 비용을 절감합니다. 문제는 이 캐싱의 효율성과 비용이 제공자마다 크게 다르다는 것입니다.
### LLM 경제학의 핵심: 캐싱 효율
OpenRouter는 캐싱으로 인한 비용 절감 효과를 반영한 '유효 가격'을 제공합니다. DeepSeek V4 Flash의 경우, DeepSeek 자체를 제공자로 사용할 때 캐시 읽기 비용이 입력 비용의 2%에 불과하여, 유효 가격이 1M 입력 토큰당 $0.018까지 떨어집니다. 이는 Hy3 preview의 유효 가격($0.034/1M, 캐시 읽기 비용 44%)보다 거의 두 배 저렴한 수치입니다. DeepSeek은 V4부터 새로운 KV 캐싱 접근 방식을 구현하여 이러한 압도적인 비용 효율성을 달성했습니다. 즉, 명시된 가격만으로는 알 수 없는 '숨겨진' 비용 구조가 존재하며, 캐싱 효율이 LLM의 실제 경제성을 좌우하는 핵심 요소임이 드러났습니다.
### Hy3 인기의 숨겨진 이유와 저자의 추측
Hy3가 DeepSeek V4 Flash보다 비쌈에도 불구하고 인기를 끄는 이유에 대해 저자는 몇 가지 가능성을 제시합니다. 첫째, OpenRouter의 하위 클라이언트나 에이전트가 DeepSeek을 명시적으로 제공자로 지정하는 기능을 지원하지 않을 수 있습니다. 둘째, DeepSeek이 중국 기업이라는 점과 데이터 정책(프롬프트 학습 허용)에 대한 잠재적인 데이터 프라이버시 및 지정학적 우려가 작용할 수 있습니다. 마지막으로, 특정 대규모 애플리케이션이 텐센트와 무관하게 Hy3를 데이터 처리 백본으로 사용하고 있을 가능성도 제기됩니다.
### 가치와 인사이트
이 분석은 LLM 선택 시 단순히 '명시된 가격'이나 '벤치마크 점수'만을 볼 것이 아니라, '실질적인 유효 가격'과 '캐싱 효율'을 반드시 고려해야 함을 시사합니다. 특히 에이전트 기반의 복잡한 워크플로우를 구축하는 개발자나 기업에게는 입력 토큰 비용 절감이 전체 프로젝트 예산에 막대한 영향을 미치므로, 캐싱 전략을 이해하고 활용하는 것이 필수적입니다. 또한, 모델의 성능 외에 제공자의 데이터 정책, 보안, 그리고 지정학적 요인까지 종합적으로 고려하는 다각적인 접근 방식이 중요해졌습니다. 이는 LLM 시장이 단순히 기술 경쟁을 넘어 경제성과 신뢰성이라는 복합적인 가치를 요구하고 있음을 보여줍니다.
### 기술·메타
- LLM (Large Language Model)
- API Aggregator (OpenRouter)
- Prompt Caching / KV Caching
- Agentic AI / Coding Agents
- Token Economics
### 향후 전망
향후 LLM 시장에서는 '유효 가격'과 '캐싱 기술'이 핵심 경쟁 요소로 더욱 부각될 것입니다. DeepSeek과 같이 혁신적인 캐싱 기술을 통해 비용 효율성을 극대화하는 모델들이 시장 점유율을 확대할 가능성이 높습니다. OpenRouter와 같은 API 애그리게이터들은 이러한 유효 가격 정보를 더욱 투명하게 제공하며, 개발자들은 모델 선택 시 이를 적극적으로 활용하게 될 것입니다. 또한, 특정 국가 기반의 LLM 사용에 대한 데이터 프라이버시 및 규제 문제가 지속적으로 논의될 것이며, 이는 모델 채택에 중요한 변수가 될 것입니다. 궁극적으로는 LLM 서비스 제공자들이 가격 책정의 투명성을 높이고, 개발자들은 비용 효율적인 모델을 찾아내는 데 더 많은 노력을 기울이는 방향으로 시장이 진화할 것으로 예상됩니다.
📝 원문 및 참고
- Source: Hacker News
- 토론(HN): [news.ycombinator.com](https://news.ycombinator.com/item?id=48317294)
- 원문: [링크 열기](https://minimaxir.com/2026/05/openrouter-hy3/)
---
출처: Hacker News · [원문 링크](https://minimaxir.com/2026/05/openrouter-hy3/)

댓글 0
아직 댓글이 없습니다. 첫 댓글을 남겨 보세요.