아이폰 시리, 구글 제미니 품고 '숨겨진 대가'를 치르다?
Published Jun 1, 2026
매일 아침 “헤이 시리”를 외치며 날씨를 묻고, 퇴근길엔 “집에 가는 길 안내해 줘”라고 말하는 것이 너무나 익숙한 아이폰 사용자라면, 아마 조만간 시리가 훨씬 더 똑똑해질 것이라는 기대감에 부풀어 있을 것입니다. 그도 그럴 것이, 인공지능(AI)은 이제 더 이상 미래 기술이 아니라 우리가 매 순간 마주하는 현실이 되었으니까요. 챗GPT부터 이미지 생성 AI까지, 우리의 디지털 생활은 이미 AI 없이는 상상하기 어려운 수준에 이르렀습니다. 그런데 유독 애플의 시리만큼은 여전히 어딘가 2% 부족하다는 느낌을 지울 수 없었습니다. “그건 제가 할 수 없는 일입니다”라는 대답을 들을 때면 살짝 답답함마저 느껴지곤 했죠.
하지만 이 모든 것이 곧 바뀔 예정입니다. 애플이 드디어 구글의 강력한 AI 모델인 **제미니(Gemini)**를 아이폰 시리에 탑재하려는 움직임을 보이고 있기 때문입니다. 2024년부터 여러 차례 지연되었던 AI 강화 시리가 드디어 올해 말 모습을 드러낼 것이라는 소식은 아이폰 사용자들에게는 희소식임에 틀림없습니다. 하지만 이 소식 뒤에는 우리가 미처 예상하지 못했던, 혹은 애플이 그토록 지켜내려 했던 가치 하나를 포기해야 할지도 모른다는 중요한 함의가 숨어 있습니다. 애플이 그동안 온디바이스(on-device) AI, 즉 기기 내에서 AI를 처리함으로써 사용자 프라이버시를 최우선으로 지켜왔던 철학에 변화가 생길 가능성이 높기 때문입니다.
온디바이스 AI, 왜 그렇게 어려웠을까요?
애플은 오랫동안 자사 기기에서 AI를 로컬로 실행하는 것의 개인 정보 보호 가치를 강조해 왔습니다. 새로운 칩을 발표할 때마다 애플은 뉴럴 엔진(Neural Engine) 업그레이드를 통해 AI 처리에 최적화되었다고 자랑하곤 했죠. 그래서 우리는 스마트폰이 엄청난 AI 모델을 처리할 수 있을 것이라고 생각하기 쉽습니다. 하지만 사실은 그렇지 않습니다. 화려한 광고 문구와는 달리, 대부분의 스마트폰에 탑재된 GPU는 AI 전용 NPU보다 더 많은 AI 토큰을 처리할 수 있는 경우가 많습니다. 애플의 뉴럴 엔진과 같은 NPU는 효율적인 AI 처리를 위해 설계되었지만, 여전히 거대한 AI 모델을 메모리에 유지할 만한 램(RAM) 용량이 턱없이 부족합니다.
현재 스마트폰에서 실행되는 AI 모델은 기껏해야 수십억 개의 매개변수(parameter)를 가질 뿐입니다. 이는 구글의 최신 제미니 모델이 수조 개의 매개변수를 가진 것과 비교하면 그야말로 ‘새 발의 피’ 수준이죠. 온디바이스 AI 모델은 또한 더 낮은 정밀도로 실행되도록 ‘양자화(quantized)‘되어 속도는 빠르지만, 토큰 생성의 정확도에는 영향을 미칩니다. 이 모든 것은 결국 클라우드 기반 모델보다 “덜 똑똑하게” 느껴지는 AI로 귀결됩니다. 심지어 큰 클라우드 기반 모델조차도 때로는 꽤 엉뚱한 대답을 내놓기도 하니, 온디바이스 AI가 얼마나 어려운 일인지 짐작이 가실 겁니다.
구글은 모바일 기기에 최적화된 제미니 나노(Gemini Nano) 버전을 가지고 있지만, 이는 주로 **매직 큐(Magic Cue)**나 오디오 요약과 같은 ‘상황별 기능’에 맞춰져 있습니다. 하지만 시리는 단순한 기능 수행을 넘어, 사용자와 대화하는 비서여야 합니다. 이처럼 대화형 보조 기능을 위해서는 훨씬 더 강력하고 복잡한 모델이 필요합니다. 구글조차도 안드로이드에서 대화형 제미니를 로컬로 처리하려 하지 않고, 항상 클라우드로 바로 연결합니다. 그렇다면 애플은 어떻게 이 난제를 해결하려 할까요?
애플의 고뇌: 클라우드와 프라이버시 사이에서
구글과의 제미니 통합 계약을 맺은 후, 애플은 구글의 거대한 클라우드 기반 제미니 모델을 ‘증류(distillation)‘하는 작업에 착수했습니다. 증류란 쉽게 말해, 크고 자원 집약적인 모델의 지식을 작고 덜 자원 집약적인 모델에 학습시켜, 마치 큰 모델처럼 작동하게 만드는 과정입니다. 충분한 시간만 주어진다면 유용한 기능을 유지하면서 중요도가 낮은 가중치를 제거할 수 있지만, 그렇다고 클라우드 구성 요소가 완전히 사라지는 것은 아닐 겁니다.
사실 이건 애플에게는 상당히 아이러니한 상황입니다. 그동안 애플은 자사의 하드웨어와 소프트웨어 통합을 통해 사용자 데이터가 기기 밖으로 나가지 않는 ‘온디바이스’ 처리의 중요성을 줄곧 강조해왔습니다. M 시리즈 칩을 기반으로 한 자체 프라이빗 클라우드 컴퓨트(Private Cloud Compute) 인프라를 구축하려 노력한 것도 바로 이러한 이유 때문입니다. 하지만 The Information의 보도에 따르면, 애플은 이 자체 클라우드 인프라에서 구글의 거대한 ‘증류되지 않은(undistilled)’ 제미니 모델을 실행하는 데 어려움을 겪고 있다고 합니다. 이는 애플이 아무리 강력한 M 시리즈 칩을 가지고 있다 해도, 대규모 AI 모델을 자체적으로 구동하는 것이 얼마나 어려운 일인지를 보여주는 대목입니다.

결국, 더 똑똑해진 시리가 출시될 때, 복잡한 작업은 애플의 클라우드 인프라가 아닌, 구글의 클라우드 인프라로 라우팅될 가능성이 높습니다. 물론 구글의 TPU(Tensor Processing Unit)에서 직접 실행되는 것은 아닙니다. 애플은 이를 위해 **엔비디아(Nvidia)**와 협약을 맺고, 엔비디아의 컨피덴셜 컴퓨팅(Confidential Computing) 플랫폼을 사용할 예정이라고 합니다. 컨피덴셜 컴퓨팅은 클라우드에서 데이터가 처리되는 동안에도 엔비디아 GPU 내에서 데이터를 암호화 상태로 유지하여, 애플이 사용자 개인 정보 보호에 여전히 신경 쓰고 있다는 주장을 할 수 있게 해줍니다. 어쩌면 애플은 이 시스템에 자체 ‘프라이빗 클라우드 컴퓨트’라는 브랜드를 계속 사용할지도 모릅니다.
개인적으로 이 부분에서 주목할 점은, 애플이 외부 협력에 적극적으로 나서면서도 자신들의 핵심 가치인 ‘프라이버시’를 지키기 위해 엔비디아의 컨피덴셜 컴퓨팅과 같은 기술적 솔루션까지 도입한다는 점입니다. 이는 단순히 구글의 AI를 가져다 쓰는 것을 넘어, 자신들의 브랜드 이미지와 사용자 신뢰를 유지하기 위한 애플의 필사적인 노력이 엿보이는 대목입니다. 하지만 과연 이러한 복잡한 하이브리드 시스템이 사용자에게 “완벽히 매끄러운(seamless)” 경험을 제공할 수 있을지는 미지수입니다.
더 똑똑해진 시리, 그 대가는 무엇일까요?
아이폰은 아마 개별 시리 요청이 제미니의 어떤 버전(온디바이스 vs. 클라우드)으로 처리되는지 사용자에게 알려주지 않을 겁니다. 로컬 AI와 클라우드 기반 AI에 의존하는 하이브리드 시스템을 설계하는 기기 제조업체들은 항상 경험이 “매끄럽다”고 말하고 싶어 합니다. 하지만 몇 가지 단서는 있을 수 있습니다.
우리는 이미 거대 AI 모델이 토큰을 생성하는 데 오랜 시간이 걸리면서 발생하는 느린 응답 속도에 익숙합니다. 엔비디아의 완전히 암호화된 컨피덴셜 컴퓨팅은 다른 AI 옵션에 비해 처리 속도를 늦춥니다. 시리가 원격 서버와 통신해야 할 때 사용자는 이러한 지연을 더 분명하게 느낄 수 있습니다. 사실, 수백만 달러짜리 서버에서만 실행될 수 있는 최고의 모델을 온디바이스 AI만으로 구현하는 것은 한계가 명확하니까요. 결국 우리가 원하는 “똑똑한” 시리를 위해서는 어느 정도의 클라우드 의존성과 그로 인한 트레이드오프는 피할 수 없는 현실인 것 같습니다.
결론적으로, 아이폰의 시리는 분명 훨씬 더 강력하고 유능해질 것입니다. 구글 제미니의 지능을 등에 업고, 우리의 질문에 더 정확하고 맥락에 맞는 답변을 내놓을 것입니다. 하지만 그 이면에는 애플이 그동안 고수해왔던 온디바이스 AI 우선주의라는 프라이버시 원칙에서 어느 정도 후퇴하고, 클라우드, 심지어는 타사의 클라우드 인프라에 의존해야 하는 복잡한 현실이 존재합니다. 사용자로서는 더 나은 AI 경험을 얻는 대신, 데이터가 기기 밖에서 처리될 수 있다는 가능성을 받아들여야 할지도 모릅니다. 애플이 이러한 기술적, 철학적 타협을 통해 어떤 새로운 사용자 경험을 제시할지, 그리고 사용자들은 이를 어떻게 받아들일지 주목되는 부분입니다. 결국, 더 똑똑해진 시리는 우리에게 ‘편리함’과 ‘프라이버시’ 사이에서 어떤 선택을 할 것인지 묻는 질문을 던지고 있는 셈입니다.
출처
- 원문 제목: Apple working to cram massive Gemini model into iPhone to power new Siri
- 출처: Artificial Intelligence - Ars Technica
- 원문 기사 보러가기