AI의 거짓말, 이제 그만! '환각 없는 AI' 시대가 정말 올까?
Published Jun 17, 2026
인공지능, 특히 거대 언어 모델(LLM)이 우리 삶 깊숙이 파고든 지 오래입니다. 이제 검색부터 업무 보조, 콘텐츠 생성까지 AI 없이는 하루가 불편할 정도인데요. 하지만 이 똑똑한 친구들이 때때로 보여주는 ‘결정적인 약점’ 하나가 있습니다. 바로 **환각(Hallucination)**입니다. 있지도 않은 사실을 그럴듯하게 지어내거나, 명백한 오류를 자신감 있게 제시하는 순간들 말이죠. 솔직히 말해서, 이런 경험은 AI에 대한 우리의 신뢰를 송두리째 흔들어 놓습니다. 중요한 의사결정이나 민감한 정보 다루는 일에는 아직 AI를 전적으로 믿기 어렵다고 생각하는 분들이 많을 겁니다. 이처럼 고질적인 문제 앞에서, AI 업계는 오랜 시간 최적의 해결책을 찾아 헤매왔습니다.
이런 배경 속에서, 최근 ‘Probably’라는 흥미로운 스타트업이 안드레센 호로위츠(Andreessen Horowitz)로부터 9백만 달러의 시드 투자를 유치하며 주목을 받고 있습니다. 이들은 단순히 환각을 줄이는 것을 넘어, 아예 “환각과 사실적 오류가 사용자에게 도달하는 것을 막고, 확정적(deterministic) 시스템 수준의 99.99% 정확도를 달성하겠다”는 야심 찬 목표를 내세웠습니다. 정말 놀랍지 않나요? 언뜻 불가능해 보이는 이 목표가 어떻게 가능할지, Probably의 접근 방식을 좀 더 자세히 들여다보겠습니다.
AI의 고질병, ‘환각’과의 전쟁 선포
LLM의 성능이 비약적으로 발전했음에도 불구하고, 환각은 여전히 풀기 어려운 숙제였습니다. 아무리 똑똑한 모델이라도 오류가 불쑥 튀어나오곤 했고, 이런 오류를 잡아낼 방법은 분명 있었지만, 어떤 방식이 가장 효과적인지에 대해서는 여전히 많은 논의가 필요한 상황이었죠. 이런 불확실성은 특히 기업들이 AI를 핵심 비즈니스에 도입하는 데 큰 걸림돌로 작용합니다. 데이터 분석, 금융, 의료, 법률 등 정확성과 신뢰성이 생명인 분야에서는 섣불리 AI를 도입하기가 망설여질 수밖에 없을 테니까요. 만약 AI가 잘못된 데이터를 기반으로 중요한 결정을 내리거나, 치명적인 오정보를 제공한다면 그 파장은 걷잡을 수 없을 겁니다.
Probably의 창업자 피터 엘리아스(Peter Elias)는 이러한 문제를 해결하기 위해, AI 공학의 기본적인 가정들을 재고해야 한다고 말합니다. 그들의 첫 번째 제품은 복잡한 데이터셋에서 빠른 답변을 생성하는 데이터 과학 도구입니다. 이 도구는 생성된 모든 결과에 출처와 개발 과정을 추적할 수 있는 감사 추적(audit trail) 기능을 제공합니다. 이는 AI 도구들 사이에서 점점 더 보편화되고 있는 추세이기도 합니다. 하지만 Probably는 여기서 한 발 더 나아갑니다.
‘데이터 과학 메카 슈트’의 비밀: 약한 모델로 강한 신뢰를 만들다
Probably가 환각을 방지하기 위해 고안한 핵심 기술은 ‘데이터 과학 메카 슈트’라고 엘리아스가 묘사하는 정교한 **하네스 시스템(elaborate harness system)**입니다. 이 시스템은 LLM이 생성한 첫 번째 답변들을 **확정적 검증 시스템(deterministic validator system)**과 대조하여 확인합니다. 만약 LLM의 답변이 원본 데이터셋과 일치하지 않으면, 검증 시스템은 해당 결과를 즉시 돌려보냅니다. 중요한 점은, 이 LLM이 바로 이 검증 시스템에 맞춰 훈련되었다는 것입니다. 즉, 시스템 전체가 빠르고 정확한 답변을 위해 최적화되어 있다는 이야기입니다.
이 접근 방식에서 주목할 만한 점은, 엘리아스의 말처럼 “하네스 엔지니어링이 정교할수록, 모델 자체는 굳이 강할 필요가 없다”는 통찰입니다. 컨텍스트를 충분히 정제하고 모호성을 줄이면, 모델은 올바른 답을 내기 위해 크게 애쓸 필요가 없다는 것이죠. 개인적으로 이 부분은 AI 개발의 패러다임을 바꿀 수 있는 중요한 지점이라고 생각합니다. 우리는 흔히 더 강력한, 더 큰 모델만이 더 나은 성능을 낼 수 있다고 생각하지만, Probably는 외부 시스템의 정교한 제어를 통해 상대적으로 작은 모델로도 최상급의 신뢰성을 확보할 수 있음을 보여주고 있습니다. 이는 곧 AI 모델의 경량화와 자원 효율성이라는 두 마리 토끼를 잡을 수 있다는 의미이기도 합니다. 거대한 모델을 돌리기 위한 천문학적인 컴퓨팅 자원과 에너지가 항상 필요한 것은 아닐 수도 있다는 것이죠.

비용 혁신과 AI의 민주화: 로컬 AI의 가능성
Probably의 이러한 전략은 단순히 정확도 향상에만 그치지 않습니다. 그들의 데이터 과학 도구는 현재 “최신 프론티어 모델보다 네 단계(four classes)나 약한” 모델 위에서 실행됩니다. 이는 다시 말해, 데이터 센터 대신 **로컬 하드웨어(데스크톱 컴퓨터 등)**에서도 충분히 구동될 수 있다는 것을 의미합니다. 이 사실이 왜 그렇게 중요할까요?
첫째, 엄청난 양의 **토큰 비용(token costs)**을 절감할 수 있습니다. AI 사용에 수반되는 비용은 끊임없이 증가하고 있으며, 많은 기업들이 AI 예산을 재검토하고 있는 상황에서 이는 가뭄의 단비와 같은 소식입니다. 기업 입장에서는 AI 도입의 경제적 장벽이 크게 낮아지는 효과를 볼 수 있습니다.
둘째, AI의 민주화에 기여할 수 있습니다. 고성능 AI 모델에 접근하기 위한 비싼 클라우드 인프라가 필수가 아니게 되면서, 중소기업이나 개인 개발자들도 훨씬 저렴한 비용으로 고품질의 AI 솔루션을 활용할 수 있게 됩니다.
셋째, 데이터 프라이버시 및 보안 측면에서도 큰 이점이 있습니다. 민감한 데이터가 외부 데이터 센터로 전송되지 않고 로컬에서 처리될 수 있다는 것은 많은 기업과 사용자들에게 훨씬 더 큰 안도감을 줄 것입니다. 특히 개인 정보 보호 규제가 엄격한 유럽 연합(EU) 등지에서는 이런 로컬 AI 솔루션이 더욱 환영받을 가능성이 높습니다.
엘리아스는 이러한 엔진이 데이터 과학뿐만 아니라 회계, 의료 서비스와 같은 “정확도가 중요한 모든 사용 사례”로 확장될 수 있다고 강조합니다. 생각해 보세요. 의료 진단 보조 시스템이 99.99%의 정확도를 보장하고, 회계 프로그램이 단 하나의 숫자 오류도 없이 데이터를 처리한다면, 우리는 얼마나 더 큰 신뢰를 가지고 AI를 활용할 수 있을까요?
대형 AI 기업들이 놓친 퍼즐 조각?
여기서 엘리아스의 발언 중 매우 흥미로운 대목이 있습니다. 그는 “대형 AI 연구소들이 이런 시도를 아예 하지 않았다는 점이 정말 흥미롭다”고 말합니다. 그러면서 그 이유로 “모델을 더 자주 수정해야 할수록 돈을 더 많이 벌기 때문에, 그들은 이런 방식에 인센티브가 없다”는 다소 도발적인 의견을 제시합니다.
사실 이건 정말 생각할 거리가 많은 지점입니다. 대형 AI 기업들이 막대한 자본과 인력을 투입하여 ‘더 크고 강력한’ 모델을 만드는 데 집중하는 동안, Probably는 ‘더 신뢰할 수 있는’ 모델을 만드는 다른 길을 찾은 셈이니까요. 혹시 대형 AI 기업들이 단순히 기술적 난이도 때문에 환각 문제를 해결하지 못한 것이 아니라, 사업 모델상의 이유로 일정 수준의 불완전성을 용인하고 있었던 것은 아닐까요? 사용자가 오류를 수정하거나 더 많은 추론을 시도할수록 더 많은 토큰이 소비되고, 이는 곧 기업의 수익으로 연결되는 구조라면, 그들의 인센티브는 정확도 100%를 향해 달려가는 것과는 약간 다른 방향일 수 있습니다.
물론 대형 AI 기업들도 윤리적 AI나 안전성 연구에 막대한 투자를 하고 있지만, Probably의 접근 방식은 AI 기술 발전의 방향성에 대한 새로운 질문을 던집니다. 신뢰성이 비용 효율성과 프라이버시까지 아우를 수 있다면, 이것이야말로 우리가 정말 필요로 하는 ‘다음 세대 AI’의 모습이 아닐까 싶습니다. Probably가 제시하는 정확도, 비용 효율성, 그리고 신뢰성이라는 세 가지 가치는 AI가 진정으로 보편화되고 인류에게 이로운 기술로 자리 잡기 위해 반드시 해결해야 할 숙제입니다. 이들의 여정이 앞으로 AI 업계에 어떤 파동을 일으킬지, 정말 기대가 됩니다.
출처
- 원문 제목: Probably raises $9M to build a more reliable kind of AI
- 출처: AI News & Artificial Intelligence | TechCrunch
- 원문 기사 보러가기