클라우드 의존도를 깨다! 멀티버스 컴퓨팅, 초경량 AI 모델로 온디바이스 시대를 열다!
Published Mar 19, 2026
최근 인공지능(AI) 산업 전반에 걸쳐 흥미로우면서도 중요한 변화의 물결이 일고 있습니다. 특히, AI 모델을 구동하는 데 필요한 막대한 컴퓨팅 자원과 그에 따르는 비용 문제는 항상 뜨거운 감자였습니다. 여러 벤처 캐피털(VC) 기업들이 AI 의존 기업들에게 컴퓨팅 용량 약정을 서면으로 확인할 것을 권고할 정도로, AI 공급망 전반에 걸쳐 재정적 불안정성이 감지되는 상황은 더욱 그렇습니다. 이러한 배경 속에서, 외부 컴퓨팅 인프라에 대한 의존도를 근본적으로 줄이는 혁신적인 대안이 주목받고 있습니다. 바로 사용자의 기기에서 직접 구동되는, 더욱 작고 효율적인 AI 모델의 시대가 열리고 있는 것입니다.
지금까지 대부분의 최첨단 AI 모델, 특히 대규모 언어 모델(LLM)은 데이터 센터나 클라우드 제공업체의 강력한 서버에 의존하여 작동해왔습니다. 이는 엄청난 연산 능력을 필요로 할 뿐만 아니라, 상당한 운영 비용과 데이터 보안, 그리고 클라우드 서비스 중단 시의 위험 부담을 수반합니다. 하지만 스페인의 스타트업 **멀티버스 컴퓨팅(Multiverse Computing)**은 이러한 패러다임에 도전하며, AI 기술의 새로운 지평을 열고 있습니다. 그들은 주요 AI 연구소의 모델을 **압축(compression)**하여, 클라우드 연결 없이도 개인 기기에서 직접 실행될 수 있는 효율적인 AI를 현실로 만들고 있습니다.
이러한 움직임은 단순히 비용 절감 차원을 넘어섭니다. 온디바이스(on-device) AI는 데이터가 사용자의 기기를 벗어나지 않도록 함으로써 프라이버시를 강화하고, 네트워크 연결이 불안정하거나 불가능한 환경에서도 AI를 활용할 수 있는 **복원력(resilience)**을 제공합니다. 이는 특히 **에이전트 코딩 워크플로우(agentic coding workflows)**와 같이 AI가 복잡하고 다단계적인 프로그래밍 작업을 자율적으로 완료해야 하는 상황에서 결정적인 이점을 제공합니다. 멀티버스 컴퓨팅의 이번 발표는 이러한 온디바이스 AI의 잠재력을 대중과 기업 모두에게 더욱 넓게 확장하려는 중요한 발걸음으로 평가됩니다.
멀티버스 컴퓨팅의 혁신적인 AI 모델 압축 기술
멀티버스 컴퓨팅은 **양자 영감 압축 기술(quantum-inspired compression technology)**인 CompactifAI를 통해 AI 모델의 효율성을 극대화하는 데 주력해왔습니다. 이 기술은 OpenAI, Meta, DeepSeek, Mistral AI 등 주요 AI 연구소의 대규모 모델들을 훨씬 더 작고 가볍게 만드는 데 성공했으며, 이를 통해 기존 AI 모델이 가진 컴퓨팅 자원 및 비용 문제를 해결하는 데 기여하고 있습니다. 이러한 기술적 진보는 AI의 접근성과 활용성을 대폭 향상시키는 핵심 동력이 되고 있습니다.
- 양자 영감 압축 기술 (CompactifAI): 멀티버스 컴퓨팅의 핵심 기술인 CompactifAI는 AI 모델의 크기를 획기적으로 줄이면서도 성능 저하를 최소화합니다. 이 기술은 마치 데이터의 밀도를 높이는 것과 같아서, 동일한 정보를 더 적은 공간에 담아내어 모델이 더 적은 자원으로 더 빠르게 작동할 수 있도록 만듭니다. 이는 특히 대규모 AI 모델의 고질적인 문제였던 막대한 메모리 및 연산 능력 요구사항을 대폭 완화시켜줍니다.
- 온디바이스 AI의 부상: 클라우드 인프라에 의존하지 않고 사용자의 스마트폰, 태블릿, 혹은 기타 엣지(edge) 기기에서 AI 모델을 직접 실행하는 온디바이스 AI는 최근 몇 년간 급부상하고 있는 트렌드입니다. 멀티버스 컴퓨팅은 이러한 트렌드의 최전선에 서서, 비용 절감, 데이터 프라이버시 강화, 그리고 네트워크 연결 없이도 AI를 사용할 수 있는 복원력이라는 명확한 이점을 제공합니다. 이는 AI 활용 시 발생할 수 있는 잠재적인 클라우드 서비스 중단이나 데이터 유출 위험을 줄이는 데 크게 기여합니다.
- 주요 AI 모델 압축: 멀티버스 컴퓨팅은 OpenAI, Meta, DeepSeek, Mistral AI와 같은 세계 유수의 AI 연구소에서 개발된 모델들을 성공적으로 압축했습니다. 이는 그들의 기술이 특정 아키텍처나 모델에 국한되지 않고 광범위하게 적용될 수 있음을 입증하며, 다양한 산업 분야에서 활용될 수 있는 잠재력을 보여줍니다. 또한, 이러한 대규모 모델의 잠재력을 효율적으로 활용할 수 있게 함으로써, 기존 AI 인프라에 대한 투자를 최적화하는 방안을 제시합니다.
- Gilda 모델 및 HyperNova 60B 2602: 멀티버스 컴퓨팅은 CompactifAI 앱에 Gilda라는 자체 개발 모델을 탑재하여 로컬 및 오프라인 구동이 가능함을 시연하고 있습니다. 또한, gpt-oss-120b를 기반으로 구축된 최신 압축 모델인 HyperNova 60B 2602는 원본 모델보다 더 빠르고 저렴한 비용으로 응답을 제공한다고 주장하고 있습니다. 특히 에이전트 코딩 워크플로우와 같이 복잡하고 다단계적인 프로그래밍 작업을 AI가 자율적으로 처리해야 하는 분야에서 이러한 이점은 더욱 두드러집니다.
- 비용 효율성 및 속도 향상: AI 모델의 압축은 단순히 크기를 줄이는 것을 넘어, 운영 비용을 대폭 절감하고 응답 속도를 향상시키는 효과를 가져옵니다. 기업들은 더 이상 대규모 클라우드 서버에 의존할 필요 없이, 필요한 AI 기능을 자체 인프라에서 효율적으로 구현할 수 있게 됩니다. 이는 곧 컴퓨팅 자원 사용량 감소로 이어져 직접적인 비용 절감 효과를 가져오며, 실시간 응답이 중요한 서비스에서 사용자 경험을 크게 개선할 수 있습니다.

AI 접근성을 확장하는 두 가지 핵심 전략: 앱과 API
멀티버스 컴퓨팅은 자사의 혁신적인 압축 기술을 대중과 기업 모두에게 선보이기 위해 두 가지 핵심 전략을 취했습니다. 바로 CompactifAI 앱의 출시와 API 포털의 개방입니다. 이 두 가지 접근 방식은 온디바이스 AI의 잠재력을 다양한 사용 환경과 비즈니스 요구에 맞춰 제공하려는 멀티버스 컴퓨팅의 의지를 보여줍니다.
- CompactifAI 앱: 이 앱은 ChatGPT나 Mistral의 Le Chat과 유사한 AI 챗 도구로, 사용자들이 질문을 하면 모델이 답변을 제공합니다. 가장 큰 차이점은 멀티버스 컴퓨팅이 Gilda라는 매우 작은 모델을 앱에 내장하여 로컬 및 오프라인에서 구동할 수 있도록 했다는 점입니다. 하지만 모든 모바일 기기가 충분한 RAM과 저장 공간을 가지고 있는 것은 아니기에, 기기 사양이 부족할 경우 앱은 자동으로 클라우드 기반 모델로 전환됩니다. 이 로컬-클라우드 라우팅은 Ash Nazg라는 시스템에 의해 자동 처리되며, 이는 톨킨의 ‘반지의 제왕’에 나오는 절대반지의 문구에서 따온 이름입니다. 다만 클라우드로 라우팅될 경우 온디바이스 AI의 주요 이점인 프라이버시는 상실됩니다.
- 온디바이스 AI 경험: CompactifAI 앱이 제공하는 핵심 경험은 엣지(edge)에서 구동되는 AI입니다. 이는 데이터가 사용자의 기기를 벗어나지 않고, 외부 서버나 클라우드와의 연결 없이 AI 기능을 활용할 수 있음을 의미합니다. 이러한 특징은 민감한 정보를 다루는 환경에서 데이터 프라이버시를 극대화하며, 인터넷 연결이 불안정하거나 아예 없는 곳에서도 AI 서비스를 끊김 없이 이용할 수 있는 유연성을 제공합니다. 하지만 현재 앱의 다운로드 수는 제한적이며, 광범위한 소비자 채택을 위한 준비는 아직 미흡하다는 평가입니다.
- CompactifAI API 포털: 멀티버스 컴퓨팅의 진정한 목표는 **기업(businesses)**에 있습니다. 이를 위해 그들은 개발자와 기업이 자사의 압축 모델에 직접 접근할 수 있도록 하는 셀프 서비스 API 포털을 출시했습니다. 이 포털은 AWS Marketplace와 같은 중간 플랫폼을 거치지 않고 직접 모델에 접근할 수 있게 하며, 기업이 프로덕션 환경에서 AI를 실행하는 데 필요한 투명성과 제어권을 제공합니다. 실시간 사용량 모니터링은 이 API의 핵심 기능 중 하나로, 기업들이 AI 운영 비용을 효율적으로 관리할 수 있도록 돕습니다.
- 기업 솔루션으로서의 가치: 이 API 포털은 기업들이 대규모 언어 모델(LLM)에 대한 의존도를 줄이고, 더 작은 모델을 통해 낮은 컴퓨팅 비용으로 AI를 배포할 수 있는 강력한 대안을 제시합니다. CEO인 엔리케 리자소(Enrique Lizaso)는 이 API가 개발자들에게 압축 모델에 대한 직접적인 접근 권한과 함께 프로덕션 환경에서 모델을 실행하는 데 필요한 투명성과 제어권을 부여한다고 강조했습니다. 이는 기업들이 자체적인 AI 솔루션을 구축하고 최적화하는 데 있어 전례 없는 유연성과 효율성을 제공할 것입니다.
산업 지형 변화와 멀티버스 컴퓨팅의 전략적 위치
멀티버스 컴퓨팅의 등장은 AI 산업의 전반적인 지형에 중요한 변화를 예고하고 있습니다. 지금까지 AI, 특히 LLM은 막대한 컴퓨팅 자원과 클라우드 인프라 없이는 불가능하다는 인식이 지배적이었습니다. 하지만 멀티버스 컴퓨팅과 같은 기업들이 주도하는 소형화 및 효율화 트렌드는 이러한 인식을 바꾸고 있습니다. 이러한 변화는 단순히 기술적 진보를 넘어, AI 기술의 경제성, 접근성, 그리고 안정성에 대한 근본적인 질문을 던지며 산업 전반의 전략적 사고를 요구하고 있습니다.
최근 **미스트랄 AI(Mistral AI)**가 Mistral Small 4 모델을 출시하며 일반 채팅, 코딩, 에이전트 작업 및 추론에 최적화되었다고 발표하고, 기업용 맞춤형 모델 구축 시스템인 Forge를 공개한 것은 이러한 변화의 대표적인 예시입니다. 또한, 애플(Apple)이 Apple Intelligence를 통해 온디바이스 모델과 클라우드 모델을 결합하는 방식으로 이 문제를 해결한 것 역시 멀티버스 컴퓨팅과 유사한 방향성을 보여줍니다. 이는 거대 LLM만이 정답이 아니라는 인식이 점차 확산되고 있으며, 각 사용 사례에 최적화된 “적절한 크기의 AI”에 대한 수요가 증가하고 있음을 시사합니다. 멀티버스 컴퓨팅은 이러한 흐름 속에서 단순한 경쟁자를 넘어, 기존 거대 모델들을 더 효율적으로 활용할 수 있는 혁신적인 솔루션 제공자로서 독특한 위치를 차지하고 있습니다. 그들의 기술은 LLM과 소형 모델 간의 성능 격차를 좁히면서도, 비용과 프라이버시라는 두 마리 토끼를 동시에 잡을 수 있는 가능성을 제시하고 있습니다.
이러한 기술적 진보는 기업들에게 새로운 비즈니스 기회를 열어줄 뿐만 아니라, 기존 비즈니스 모델에도 큰 영향을 미 미칠 것입니다. 예를 들어, 드론, 위성, 그리고 기타 연결성이 보장되지 않는 환경에 AI를 내장하는 것은 이전에는 상상하기 어려웠던 일입니다. 하지만 온디바이스 AI는 이러한 시나리오를 현실화하며, AI의 활용 범위를 혁신적으로 확장합니다. 또한, 금융, 의료, 국방과 같이 데이터 프라이버시와 보안이 최우선시되는 분야에서는 클라우드 연결 없이 로컬에서 작동하는 AI 모델이 강력한 이점을 제공합니다. 멀티버스 컴퓨팅의 솔루션은 기업들이 데이터 주권(data sovereignty)을 유지하면서도 최첨단 AI 기술을 활용할 수 있는 길을 열어주며, 이는 장기적으로 산업 경쟁력 강화에 기여할 것입니다.
온디바이스 AI의 미래와 멀티버스 컴퓨팅의 비전
멀티버스 컴퓨팅의 이번 행보는 AI 기술의 미래 방향성에 대한 중요한 통찰을 제공합니다. 비용 효율성, 강화된 프라이버시, 그리고 견고한 복원력은 현대 기업과 개인 사용자 모두에게 필수적인 요소가 되고 있습니다. 특히 AI 기술이 더욱 다양한 산업과 일상생활에 깊숙이 통합될수록, 중앙 집중식 클라우드 인프라에 대한 의존도를 줄이고 분산된 엣지 컴퓨팅 환경에서 AI를 구동하는 능력은 더욱 중요해질 것입니다. 멀티버스 컴퓨팅은 이러한 미래를 준비하며, 거대하고 값비싼 AI 모델만이 유일한 해결책이 아니라는 점을 분명히 보여주고 있습니다. 그들의 CompactifAI 기술은 AI의 대중화와 민주화를 가속화할 잠재력을 가지고 있습니다.
물론, CompactifAI 앱이 아직 광범위한 소비자 채택을 위해서는 해결해야 할 과제가 남아 있습니다. 모든 모바일 기기가 온디바이스 AI를 완벽하게 지원하기에는 기술적 장벽이 여전히 존재하며, 클라우드 기반 모델로의 전환 시 프라이버시 이점을 상실하는 문제 또한 소비자들이 고려해야 할 부분입니다. 그러나 멀티버스 컴퓨팅의 진정한 가치와 전략적 초점은 기업용 API 포털에 있습니다. 이 포털은 기업들이 자사의 비즈니스 요구에 맞춰 맞춤형 AI 솔루션을 구축하고 배포할 수 있는 강력한 도구를 제공하며, 이는 잠재적으로 수많은 산업 분야에서 혁신을 이끌어낼 것입니다. 이미 Bank of Canada, Bosch, Iberdrola 등 100개 이상의 글로벌 고객사를 확보하고 있는 멀티버스 컴퓨팅은, 5억 유로의 새로운 자금 조달 라운드를 통해 15억 유로 이상의 가치 평가를 받을 것으로 예상되며, 이는 그들의 기술력과 시장 잠재력에 대한 강력한 신뢰를 보여줍니다. 멀티버스 컴퓨팅은 효율적이고 접근 가능한 AI 시대를 향한 여정에서 중요한 리더로 자리매김할 것으로 기대됩니다.
출처
- 원문 제목: Multiverse Computing pushes its compressed AI models into the mainstream
- 출처: AI News & Artificial Intelligence | TechCrunch
- 원문 기사 보러가기