[Hacker News 요약] AI 서브루틴: 브라우저 탭 내에서 실행되는 인증 문제 해결 자동화 스크립트

12

설명

rtrvr.ai에서 선보인 'AI 서브루틴'은 브라우저 내에서 직접 실행되는 자동화 스크립트로, 기존 웹 에이전트가 겪던 인증 및 확장성 문제를 혁신적으로 해결합니다. 이 기술은 한 번의 브라우저 작업 기록으로 토큰 비용 없이 100% 결정론적인 재실행을 가능하게 하며, 실시간 웹페이지에서 인증 정보를 자동으로 전파합니다. 대규모 웹 자동화의 고질적인 난제였던 인증 문제를 해결함으로써, LLM 기반 에이전트의 실용성과 신뢰도를 크게 향상시킵니다. ### 기존 웹 에이전트의 한계와 인증 문제 대부분의 LLM 기반 웹 에이전트는 한두 번의 작업에는 유용하지만, 수천 번 반복해야 하는 대규모 자동화에서는 토큰 비용, 지연 시간, 비결정론적 동작으로 인해 한계에 부딪힙니다. 특히, 쿠키, CSRF 토큰, 세션 토큰 등 복잡한 인증 메커니즘은 외부 프로세스 스크래퍼(Node.js, Playwright 등)가 재구축하기 매우 어려운 '진정한 난제'로 작용합니다. 웹사이트가 인증 방식을 변경하면 기존 스크립트가 쉽게 무력화되는 문제가 발생합니다. ### rtrvr.ai의 인-페이지 실행 방식: 인증 문제 해결 rtrvr.ai는 이 문제를 해결하기 위해 녹화와 재실행을 모두 사용자 브라우저 탭 내에서, 웹페이지 자체의 실행 컨텍스트 안에서 수행합니다. 확장 프로그램이 사용자의 네트워크 요청을 가로채고, 스크립트 실행 시 이 요청들을 페이지의 컨텍스트에서 다시 보냅니다. 이는 동일한 오리진, 쿠키, TLS 세션, 그리고 서명된 헤더를 계산하는 동일한 JavaScript를 사용함을 의미합니다. Puppeteer나 헤드리스 워커 없이 브라우저가 평소처럼 작동하여 인증, CSRF, 서명, 지문 인식 등이 자동으로 전파되므로, 에이전트가 이 복잡한 과정에 직접 관여할 필요가 없습니다. ### 네트워크 캡처의 랭킹 및 트림: 노이즈 속에서 신호 찾기 단순히 네트워크 요청을 기록하는 것만으로는 충분하지 않습니다. 일반적인 브라우징 중에는 수백 개의 요청이 발생하며, 이 중 실제 API 호출은 극히 일부입니다. rtrvr.ai는 LLM이 관련 요청을 식별하기 어렵다는 점을 인지하고, 캡처된 요청들을 랭킹하고 트림하는 과정을 거칩니다. 퍼스트 파티/서드 파티 오리진, DOM 이벤트와의 시간적 상관관계, HTTP 메서드 및 페이로드 형태, 응답 품질 등을 기준으로 점수를 매겨 관련 없는 분석 비콘이나 휘발성 식별자(queryId, doc_id 등)를 제거합니다. 이를 통해 LLM에 전달되는 컨텍스트의 품질을 높여 신뢰성 있는 자동화를 가능하게 합니다. ### 서브루틴의 작동 방식 및 장점 기록된 작업인 '서브루틴'은 에이전트의 도구 세트에 호출 가능한 도구로 등록됩니다. 이는 매크로가 아닌, LLM이 매개변수 선택을 위해 한 번만 호출되고 실제 동작은 스크립트로 실행되는 방식입니다. 이로 인해 핫 패스에서 토큰 비용이 발생하지 않으며, 매번 동일한 입력에 대해 동일한 출력을 보장하는 결정론적 특성을 가집니다. 또한, 동일한 사용자 세션에서 요청이 발생하므로 탐지 가능성이 낮습니다. `rtrvr.*` 헬퍼 네임스페이스는 `rtrvr.find`, `rtrvr.click`, `rtrvr.type`, `rtrvr.request` 등 실제 웹사이트에서 필요한 일반적인 동작을 지원하여 견고한 스크립트 작성을 돕습니다. ### 기존 솔루션과의 차별점 및 미래 비전 rtrvr.ai는 Browser-Use나 Stagehand처럼 LLM을 런타임 액션 경로에 두거나, Libretto처럼 Playwright 스크립트를 생성하는 방식과 다릅니다. rtrvr.ai의 핵심 차별점은 스크립트가 '사용자와 동일한 브라우저 컨텍스트 내에서 실행'된다는 점입니다. 이는 인증 문제를 근본적으로 해결하며, SSO 리디렉션, 토큰 갱신 등 브라우저가 기본적으로 처리하는 모든 인증 방식을 재구현할 필요가 없게 합니다. 궁극적인 목표는 웹의 액션 공간을 확장하는 공유되고 결정론적인 서브루틴 라이브러리를 구축하여, 에이전트가 실제 웹사이트에서 신뢰할 수 있는 작업을 수행할 수 있도록 하는 것입니다. ### 추가 기능 및 사용 방법 이번 릴리스에는 사용자가 이미 지불하고 있는 ChatGPT 또는 Claude 구독을 연동할 수 있는 BYO(Bring Your Own) 기능, WhatsApp을 통한 워크플로우 제어, 지식 기반(Knowledge Base) 및 MCP(Management Control Panel) 업그레이드, 그리고 웹사이트에 에이전트 친화적인 구조를 제공하고 분석 기능을 제공하는 Rover 및 RoverBook이 포함됩니다. rtrvr.ai의 AI 서브루틴을 사용하려면 Chrome 확장 프로그램을 설치하고, 작업을 한 번 기록한 후 서브루틴으로 저장하면 됩니다. 이후 에이전트가 스프레드시트나 목록에 따라 병렬로 작업을 적용할 수 있습니다. ### 가치와 인사이트 rtrvr.ai의 AI 서브루틴은 대규모 웹 자동화에서 가장 큰 걸림돌이었던 '인증' 문제를 브라우저 탭 내 실행이라는 독창적인 방식으로 해결합니다. 이는 LLM 기반 에이전트의 확장성, 신뢰성, 비용 효율성을 혁신적으로 개선하여, '원칙적으로는 가능하지만 실용적이지 않던' 웹 에이전트의 한계를 넘어섭니다. 토큰 비용을 줄이고 결정론적 실행을 보장함으로써, 실제 비즈니스 환경에서 웹 에이전트가 신뢰할 수 있는 '도구'로 자리매김할 수 있는 기반을 마련하며, 웹의 액션 공간을 확장하는 공유 라이브러리 비전은 미래 에이전트 생태계에 큰 영향을 미칠 잠재력을 가지고 있습니다. ### 기술·메타 - Chrome Extension - JavaScript (for Subroutines and `rtrvr.*` helpers) - LLMs (used for parameter selection, not hot path execution) - OAuth (for BYO LLM subscriptions) - Google Sheets (integration example) - PostHog-style analytics (for RoverBook) 📝 원문 및 참고 - Source: Hacker News - 토론(HN): [news.ycombinator.com](https://news.ycombinator.com/item?id=47810533) - 원문: [링크 열기](https://www.rtrvr.ai/blog/ai-subroutines-zero-token-deterministic-automation) --- 출처: Hacker News · [원문 링크](https://www.rtrvr.ai/blog/ai-subroutines-zero-token-deterministic-automation)
사이트 방문하기Visit Service

댓글 0

아직 댓글이 없습니다. 첫 댓글을 남겨 보세요.