최강의 AI 보안 무기, 갑자기 사라진 이유: 미국의 ‘위험한’ 규제 논란

상상해보세요. 최악의 사이버 공격이 눈앞에 닥쳤는데, 우리를 지켜줄 가장 강력한 방어 도구가 정부의 명령으로 갑자기 사용 금지된다면 어떤 기분일까요? 현실에서 이런 일이 벌어졌습니다. 전 세계적으로 사이버 위협이 고조되고 있는 상황에서, 미국의 사이버보안 전문가 수십 명이 정부의 황당한 조치에 항의하며 공개서한을 발표했습니다. 이들은 미국 정부가 AI 개발사 앤스로픽(Anthropic)의 최정예 AI 모델인 Fable과 Mythos에 대해 내린 수출 통제 명령이 “위험하다”고 강력하게 비판하고 나섰습니다. 이 명령은 단순히 특정 기업의 모델 사용을 제한하는 것을 넘어, 자국 안보를 지키는 사이버 방어자들의 손발을 묶는 결과를 초래하고 있다는 점에서 충격적이지 않을 수 없습니다.

앤스로픽은 지난 금요일, 미 정부로부터 Fable과 Mythos 모델의 수출 제한 명령을 받았고, 결국 전 세계 모든 사용자에게 해당 모델에 대한 접근을 중단했습니다. 정부는 ‘국가 안보’를 이유로 들었지만, 앤스로픽조차 구체적인 배경을 설명 듣지 못했다고 합니다. 이 소식은 사이버보안 업계에 일파만파 퍼졌고, 알렉스 스타모스(전 페이스북 보안 책임자), 케이시 엘리스(버그바운티 플랫폼 Bugcrowd 창립자), 존 칼라스(유명 암호학자 및 전 애플 보안 설계 관리자) 등 업계의 내로라하는 베테랑 76명을 포함한 전문가들이 공동으로 백악관에 서한을 보냈습니다. 그들의 메시지는 명확했습니다. “적들이 빠르게 진보하는 상황에서, 타당한 이유 없이 최강의 능력을 방어자들에게서 빼앗는 것은 위험한 일”이라는 것입니다.

최강의 방어 무기, 왜 갑자기 사라졌나?

그렇다면 Fable과 Mythos는 과연 어떤 모델이기에 이토록 큰 논란의 중심에 선 것일까요? 사실 이 모델들은 인공지능이 사이버보안 분야에서 얼마나 혁신적인 역할을 할 수 있는지를 보여주는 대표적인 사례였습니다. 특히 Mythos는 출시 당시부터 보안 취약점 탐지 능력이 너무나 뛰어나서 악의적인 해커나 외국 적대 세력이 이를 이용해 인터넷에 혼란을 야기하는 것을 막기 위해 앤스로픽이 접근을 엄격히 제한해야 한다고 주장했던 모델입니다. 실제로 앤스로픽은 초기에는 약 50개 회사에만 Mythos 접근 권한을 주었고, 최근에야 15개국 150여 개 조직으로 그 대상을 확대했습니다.

그리고 지난주, 앤스로픽은 Mythos의 공개 버전인 Fable을 출시했습니다. 이 모델은 생물학, 화학, 사이버보안 분야에서의 사용을 엄격히 차단하고, 모델을 재현하기 위한 증류(distilling)를 막는 강력한 안전장치(guardrails)를 탑재했습니다. 문제는 이 안전장치가 너무나 엄격해서 많은 사이버보안 전문가들이 “사이버보안과 관련된 어떠한 프롬프트도 사실상 차단된다”는 점을 발견했다는 것입니다. 자, 여기서 개인적으로 흥미로운 역설을 발견합니다. 가장 강력한 보안 모델이 스스로 보안 관련 질문을 차단한다니, 마치 특수부대원에게 방탄복을 입혔는데 그 방탄복이 움직임을 너무 제한해서 전투력을 떨어뜨리는 상황과 비슷하다고 할 수 있습니다. 보안을 위한 안전장치가 오히려 보안 기능을 마비시키는 아이러니랄까요?

정부의 이번 수출 통제 명령은 Fable 모델에 대한 ‘탈옥(jailbreak)’ 방법이 발견되었다는 보고에 근거했을 가능성이 높다고 앤스로픽은 밝혔습니다. 이 탈옥 방법이 Fable의 강력한 Mythos급 기능을 잠금 해제할 수 있다는 내용이었다는 것이죠. 그런데 이 탈옥 주장에 대한 진실 공방이 벌어지면서 상황은 더욱 복잡해집니다.

풀리지 않는 역설: AI 보안, 누구를 위한 규제인가?

오픈 레터 서명자 중 한 명인 카티 무소리스(Katie Moussouris, Luta Security 창립자)는 아마존 연구원들이 작성한 비공개 논문을 검토한 결과, 보고서가 주장하는 ‘실제 탈옥’이 아니었다고 반박했습니다. 그녀의 설명에 따르면, 연구원들은 Fable이 “보안 문제에 대해 코드를 검토하는 것을 처음에는 거부했기 때문에”, 공개적으로 알려진 취약점과 “의도적으로 심어놓은 취약점”이 있는 오픈 소스 코드를 수정하도록 요청했을 뿐이라는 겁니다. 즉, 이는 모델의 안전장치를 우회하여 악용하려 한 것이 아니라, 모델에게 취약점을 찾아 수정하는 ‘방어적인’ 역할을 수행하게 하려 한 것이었다는 말이죠.

무소리스는 자신의 블로그 게시물에서 다음과 같이 강조했습니다. “논문에 묘사된 행동은 의미 있게 수정될 수 없으며, 어떠한 시도도 방어를 위한 모델을 약화시킬 뿐입니다. 방어자들은 AI에게 파일의 버그를 수정하고, 수정이 왜 중요한지 설명하며, 패치가 작동하는지 확인하는 테스트를 작성하도록 요청할 수 있어야 합니다. 이는 안전장치 우회가 아닙니다. 이것이야말로 AI 모델이 방어 보안을 위해 할 수 있는 가장 가치 있는 일, 즉 방어자들이 매일 수행하는 찾기(find), 수정(fix), 테스트(test) 루프를 실행하는 것입니다.”

그녀의 비판은 공개 서한에서도 그대로 반영되었습니다. 전문가들은 아마존 논문에 언급된 모델 기능이 OpenAI의 GPT-5.5, 앤스로픽의 공개된 Claude Opus 4.8과 Sonnet, 심지어 **“Kimi 2.7과 같은 중국 모델”**에서도 재현될 수 있다고 믿는다는 것입니다. 무소리스는 테크크런치와의 인터뷰에서 “논문의 기술을 시연하는 데 사용된 버그는 다른 모델에서도 발견될 수 있습니다. 논문의 방법은 안전장치 우회 기술이지만, Fable의 안전장치가 없는 다른 모델들은 보안 버그를 찾는 직접적인 요청을 거부하지 않을 것이므로 우회가 필요 없습니다.”라고 덧붙였습니다.

솔직히 말해서, 이 지점에서 상황은 더욱 기묘해집니다. 만약 Fable의 ‘탈옥’이라고 불린 행위가 사실상 다른 공개된 모델들도 수행할 수 있는 ‘정상적인 보안 작업’이라면, 그리고 Fable의 안전장치 때문에 오히려 그 작업을 하기 힘들었다면, 정부의 이번 조치는 과연 누구를 위한 것이었을까요? 강력한 방어 도구를 자국 방어자들로부터 빼앗아, 그들을 스스로 무장해제시키는 격이 될 수 있다는 점에서 우려가 깊어집니다. 더군다나, 중국과 같은 잠재적 경쟁국들이 이미 유사한 기능을 갖춘 모델을 개발하고 있거나 사용할 수 있는 상황이라면, 미국의 규제가 자국 안보에 오히려 독이 될 수도 있다는 비판은 너무나 당연한 귀결입니다.

이러한 맥락에서 필자는 이번 사태가 AI 기술 거버넌스에 있어 얼마나 심도 깊은 논의가 필요한지를 여실히 보여준다고 생각합니다. 기술의 발전 속도는 규제의 속도를 훨씬 뛰어넘고 있으며, 때로는 기술에 대한 정확한 이해 없이 막연한 ‘국가 안보’ 프레임으로 접근하는 것이 오히려 기술의 긍정적인 잠재력을 억압하고 경쟁 우위를 잃게 만들 수 있습니다. 전문가들은 투명하고 공정하게 시행되며, 산업 및 학계 전문가들의 과학적 연구에 기반하고, “미국 국민의 안전을 보장하는 데 필요한 최소한의 범위 내에서만” 사용되는 규제를 요구하고 있습니다. 이는 비단 앤스로픽 모델에 국한된 이야기가 아니라, 앞으로 우리가 마주할 수많은 첨단 기술 규제에 대한 중요한 원칙이 되어야 할 것입니다.

결국, 이번 앤스로픽 모델 금지 사태는 단순히 한 기업의 제품 사용 중단을 넘어섭니다. 이는 고도화되는 사이버 위협에 맞서기 위해 AI 기술을 어떻게 활용하고, 또 어떻게 현명하게 규제할 것인가에 대한 근본적인 질문을 던지고 있습니다. 강력한 방어 무기를 손에 쥐었음에도 불구하고, 스스로 그 무기를 내려놓는 선택이 과연 현명한 것인지, 아니면 더 큰 위험을 초래할지 진지하게 고민해야 할 때입니다. 정부와 AI 개발사, 그리고 사이버보안 전문가들 간의 생산적인 대화와 협력이 그 어느 때보다 절실한 시점입니다.

출처

원문 제목: Cybersecurity vets protest ‘dangerous’ US government ban on Anthropic’s most powerful models
출처: AI News & Artificial Intelligence | TechCrunch
원문 기사 보러가기

Article

최강의 AI 보안 무기, 갑자기 사라진 이유: 미국의 ‘위험한’ 규제 논란

최강의 방어 무기, 왜 갑자기 사라졌나?

풀리지 않는 역설: AI 보안, 누구를 위한 규제인가?

출처

Related News

AI의 미래를 좌우할 보이지 않는 웹 데이터의 우주를 탐험하는 새로운 인프라 계층의 등장

사소한 감기, 당신의 인생 5%를 훔쳐갑니다: 기술 거인들이 5억 달러로 '불가능'에 도전하는 이유