AI NEWS

[Techmeme 요약] 트럼프 행정부, AI 모델 'Fable 5' 재출시 앞둔 앤트로픽에 '보안 강화' 요구… 전문가들은 '불가능' 전망

Nedai

운영자

2026.06.17

설명

트럼프 행정부 관계자들이 AI 개발사 앤트로픽(Anthropic)에 자사 AI 모델 'Fable 5'의 보안 취약점 해결을 강력히 요구했습니다. 이는 해당 모델이 '탈옥(jailbreaking)'을 통해 악용될 수 있다는 우려 때문이며, 앤트로픽은 이미 지난주 수출 통제로 모델을 오프라인 상태로 전환한 바 있습니다. 하지만 보안 전문가들은 이러한 요구사항을 완벽히 충족하는 것이 기술적으로 불가능할 수 있다는 회의적인 시각을 내비치고 있습니다. ### 배경 설명 최근 인공지능(AI) 기술이 급속도로 발전하면서, AI 모델의 안전성과 보안에 대한 우려도 커지고 있습니다. 특히, '탈옥(jailbreaking)'은 AI 모델에 의도적으로 잘못된 지시나 질문을 입력하여, 개발자가 설정한 안전 장치나 윤리적 제약을 우회하도록 유도하는 기법입니다. 이를 통해 AI가 본래 수행해서는 안 되는 유해하거나 민감한 정보에 접근하거나, 부적절한 답변을 생성하도록 만들 수 있습니다. 앤트로픽(Anthropic)은 이러한 탈옥 시도에 대한 정부의 우려를 과장된 것으로 보고 있지만, 미국 정부는 국가 안보와 직결될 수 있는 사이버 보안, 화학, 생물학 관련 기능이 악용될 가능성을 심각하게 받아들이고 있습니다. 특히, 국가안보국(NSA)은 'Fable 5' 모델의 보안 장치를 무력화할 수 있는 방법이 존재한다는 결론을 내린 것으로 알려졌습니다. ### 정부, 앤트로픽에 '탈옥 방지' 책임 요구 트럼프 행정부 관계자들은 앤트로픽이 AI 모델 'Fable 5'를 재출시하려면, 사용자가 모델의 보안 장치를 우회할 수 없도록 확실한 조치를 취해야 한다고 주장했습니다. 이는 지난주 앤트로픽이 'Fable 5' 모델을 수출 통제 조치로 인해 오프라인 상태로 전환한 이후 나온 요구입니다. 당시 정부는 '탈옥'을 통한 악용 가능성을 주요 우려 사항으로 지적했습니다. 앤트로픽은 정부의 우려가 과장되었으며 탈옥의 영향이 미미하다고 주장해왔으나, 정부는 국가안보국(NSA)의 분석 결과를 근거로 앤트로픽에게 문제 해결의 책임을 분명히 하고 있습니다. ### 보안 전문가들의 회의적인 전망 하지만 독립적인 사이버 보안 전문가들은 AI 모델의 보안 장치, 즉 '가드레일(guardrails)'이 근본적인 해결책이 되기 어렵다는 입장을 보이고 있습니다. 이들은 숙련된 사용자나 미래의 AI 모델이 이러한 제약을 우회할 방법을 계속 찾아낼 것이므로, 백악관이 요구하는 완벽한 탈옥 방지는 사실상 불가능할 수 있다고 지적합니다. 이는 앤트로픽이 기술적으로 해결해야 할 과제가 매우 어렵거나, 혹은 불가능에 가까울 수 있음을 시사합니다. ### 정부와 AI 기업 간의 입장 차이 앤트로픽은 6월 17일 월요일 상무부와 국가사이버국장실(Office of the National Cyber Director)과의 기술 회의에서 이러한 입장을 재확인했습니다. 하지만 정부 관계자들은 탈옥의 심각성 여부를 논하는 단계를 넘어섰다고 보고 있으며, 앤트로픽이 자체적으로 잠재적 탈옥을 지속적으로 테스트하고 정부에 보고하는 등 더욱 능동적인 자세를 보여야 한다고 강조하고 있습니다. 이는 AI 모델의 안전성 확보에 대한 정부와 기업 간의 책임 소재와 접근 방식에 대한 근본적인 이견을 보여줍니다. ### 가치와 인사이트 이번 사안은 AI 기술의 발전 속도에 비해 규제 및 안전 장치 마련이 뒤처지고 있음을 보여줍니다. 특히, 최첨단 AI 모델의 잠재적 위험성을 어떻게 관리하고 통제할 것인지에 대한 정부와 기술 기업 간의 긴장 관계를 드러냅니다. '탈옥'과 같은 취약점은 AI 모델의 신뢰성과 안전성에 대한 근본적인 질문을 던지며, 향후 AI 규제 논의에 중요한 영향을 미칠 것으로 보입니다. ### 향후 전망 만약 앤트로픽이 정부의 요구사항을 충족시키지 못하거나, 기술적으로 불가능하다는 결론이 내려진다면, 이는 향후 AI 모델 출시 및 규제에 상당한 영향을 미칠 수 있습니다. 정부는 AI 모델의 보안 취약점 발견 및 보고에 대한 더 엄격한 기준을 마련할 수 있으며, 이는 AI 개발사들에게 추가적인 연구 개발 및 보안 투자 부담으로 작용할 것입니다. 또한, 이번 사례는 AI 모델의 '안전성'을 어떻게 정의하고 검증할 것인지에 대한 논의를 가속화할 것입니다. 이는 AI 기술의 상업적 활용뿐만 아니라, 국가 안보 및 사회적 안전과도 직결되는 문제이기에, 향후 관련 법규 및 국제 협약 논의에도 중요한 참고 자료가 될 수 있습니다. 궁극적으로는 AI 기술의 책임 있는 개발과 배포를 위한 새로운 프레임워크 구축의 필요성을 강조하게 될 것입니다. 📝 원문 및 참고 - Source: Techmeme - Techmeme 리버: [techmeme.com](https://www.techmeme.com/260617/p49#a260617p49) - 원문 기사: [링크 열기](https://www.wired.com/story/the-white-house-wants-anthropic-to-block-all-jailbreaks-that-may-not-be-possible/) --- 출처: Techmeme ([Original Article](https://www.wired.com/story/the-white-house-wants-anthropic-to-block-all-jailbreaks-that-may-not-be-possible/))

사이트 방문하기Visit Service

#Techmeme

아직 댓글이 없습니다. 첫 댓글을 남겨 보세요.

신고 · 불법·유해·아동 안전(CSAE) 관련 콘텐츠

AI NEWS 글 목록

복도로 이동 →

제목글쓴이조회

설명

이어서 읽기

댓글 0

AI NEWS 글 목록