arrow_back

Article

AI의 가장 큰 병목은 '메모리'였다? 한국 스타트업 XCENA가 찾아낸 혁신의 실마리

Published May 30, 2026

최근 몇 년간 AI는 우리의 상상을 초월하는 속도로 발전했습니다. 특히 챗GPT와 같은 대규모 언어 모델(LLM)이 등장하면서, 사람들은 AI가 얼마나 똑똑해질 수 있는지에 대해 경외감을 느꼈죠. 하지만 이 놀라운 지능의 이면에는 엄청난 양의 컴퓨팅 자원과 인프라 비용이 숨어있다는 사실을 아시나요? 거대 AI 모델을 구동하는 데 필요한 GPU는 연일 품귀 현상을 빚고, 그 가격은 천정부지로 치솟고 있습니다. 업계는 너나 할 것 없이 “AI의 병목은 GPU 연산 능력에 있다”고 외치며 더 빠르고 강력한 GPU를 만들기 위해 혈안이 되어 있습니다.

그런데 최근, 이런 통념에 정면으로 도전하는 흥미로운 주장이 제기되었습니다. AI의 진정한 병목 현상은 연산(compute)이 아니라 바로 **메모리(memory)**라는 것이죠. 그리고 이 대담한 주장을 현실로 만들려는 한국의 스타트업이 있습니다. 바로 XCENA입니다. XCENA는 이 혁신적인 아이디어 하나로 최근 시리즈 B 펀딩에서 1억 3,500만 달러(약 1,800억 원)라는 엄청난 투자를 유치하며, AI 인프라 시장에 새로운 파장을 예고하고 있습니다. 이들이 제시하는 메모리 중심 아키텍처는 과연 AI의 미래를 어떻게 바꿀 수 있을까요?

AI, 그 숨겨진 데이터 릴레이 경주와 비효율의 늪

챗GPT에게 질문을 하나 던질 때마다, 그 뒤에서는 마치 육상 경기의 릴레이처럼 숨 가쁜 데이터의 여정이 시작됩니다. 정보는 메모리에서 출발하여 CPU를 거쳐 전처리 과정을 거치고, 다시 GPU로 이동해 고강도 연산을 수행한 뒤, 다시 메모리로 돌아오는 과정을 반복합니다. 그리고 AI가 단어 하나를 생성할 때마다 이 모든 여정이 되풀이되죠. 솔직히 말해서, 이 과정은 생각보다 훨씬 더 비효율적입니다.

문제는 구조적인 비효율성에 있습니다. 데이터는 매번 업계에서 가장 비싸고 전력 소모가 심한 칩들(CPU, GPU)을 경유해야 합니다. 이 잦은 왕복 이동은 엄청난 시간과 비용, 전력을 소모하며 AI 인프라의 확장을 가로막는 주요 원인이 됩니다. CPU와 GPU는 지난 수십 년간 꾸준히 발전하며 똑똑해졌지만, 메모리는 그만큼의 혁신을 이루지 못했습니다. XCENA의 CEO 김진 씨는 인터뷰에서 “CPU와 GPU는 수십 년 동안 더 똑똑해졌지만, 메모리는 그러지 못했다. XCENA는 그것을 바꾸고 싶다”고 말했습니다.

실제로 최근 메모리 가격 상승과 관련 기업들의 주가 강세는 AI 인프라가 메모리 중심 아키텍처로 전환되고 있음을 보여주는 중요한 신호입니다. 이달 들어 전 세계 메모리 칩 시장을 지배하는 삼성전자, SK하이닉스, 마이크론 등 3대 기업이 사상 처음으로 ‘트릴리온 달러(1조 달러)’ 기업 가치를 넘나들었다는 사실만 봐도, 메모리의 중요성이 얼마나 부각되고 있는지 알 수 있습니다. XCENA는 바로 이 지점에서 “추론(inference)은 단순히 연산 문제가 아니라, 점점 더 메모리 스케일링 문제”라는 핵심 비즈니스 명제를 제시하고 있습니다.

XCENA의 혁신적인 해법: 메모리 모듈 속에서 연산을 MX1 칩

XCENA가 이 구조적 비효율성을 해결하기 위해 내놓은 해법은 바로 ‘데이터에 연산을 가져다주는’ 것입니다. XCENA의 핵심 칩인 MX1은 데이터를 메모리 모듈 밖으로 내보낼 필요 없이, 메모리 모듈 내부에서 직접 데이터를 처리합니다. 어떻게 이런 일이 가능할까요?

MX1 칩은 **CXL (Compute Express Link)**이라는 기술을 통해 CPU에 연결됩니다. CXL은 프로세서와 메모리 간의 전용 고속도로와 같은 역할을 하여, 데이터가 CPU와 GPU를 오가는 복잡한 경로를 거치지 않고도 메모리 근처에서 필요한 연산을 수행할 수 있도록 합니다. 김진 CEO는 “GPU가 AI 모델 학습에 필요한 행렬 곱셈에는 탁월하지만, 전처리, KV 캐시 관리(이전 대화 맥락을 저장하여 모델이 다시 처리하지 않도록 하는 시스템), 데이터 캐싱 등 주변 데이터 오케스트레이션의 상당 부분은 여전히 CPU에서 실행된다”고 설명했습니다. XCENA의 칩은 바로 이러한 작업을 메모리 모듈 내에서 직접 처리함으로써, 값비싼 왕복 이동을 없애는 것입니다.

This chip startup just raised $135M on a bet that AI’s biggest bottleneck isn’t compute — it’s memory

그 결과는 놀랍습니다. XCENA는 10대의 서버가 필요했던 작업을 단 1대의 서버에서 잠재적으로 실행할 수 있다고 주장합니다. 이는 AI 인프라 비용에 엄청난 영향을 미칠 수 있음을 의미하며, 투자자들이 XCENA에 열광하는 이유를 충분히 설명해 줍니다. 데이터 솔루션에 대한 수요는 작년 하반기부터 급증하고 있으며, XCENA는 이 타이밍이 자신들에게 유리하게 작용하고 있다고 보고 있습니다.

개인적으로 이 부분에서 주목할 점은, XCENA가 단순히 기존 하드웨어의 성능을 미세하게 개선하는 것을 넘어, AI 연산의 근본적인 아키텍처 패러다임을 바꾸려 한다는 점입니다. 엔비디아와 같은 기업들이 훈련(training) 워크로드를 위한 NPU(Neural Processing Unit) 경쟁을 벌이는 동안, XCENA는 그 모든 것의 아래에 놓인, 메모리 집약적인 계층을 목표로 합니다. 이는 마치 고속도로만 넓히는 것이 아니라, 애초에 목적지까지 가는 더 빠르고 직접적인 길을 만들어내는 것과 같습니다. AI 모델 추론의 실제 비용은 GPU 연산뿐만 아니라, 데이터를 효율적으로 옮기고 관리하는 능력에 크게 좌우된다는 점을 명확히 짚어냈다는 점에서 XCENA의 전략은 매우 통찰력 있다고 생각합니다.

치열한 경쟁 속, XCENA만의 차별점과 미래 비전

물론 이 분야에 XCENA만 뛰어든 것은 아닙니다. Astera Labs, Marvell과 같은 나스닥 상장 기업들도 차세대 메모리 연결 솔루션 개발에 힘쓰고 있습니다. 특히 Marvell은 이미 이 분야에서 활약하고 있는 대규모 established player입니다. 그렇다면 XCENA의 차별점은 무엇일까요? 김진 CEO는 “우리는 수천 개의 코어를 가지고 있다”며 핵심은 지적 재산권에 있다고 강조합니다. Marvell의 접근 방식이 몇 개의 범용 코어에 의존하는 반면, XCENA는 RISC-V 기반으로 구축된, 데이터 처리에 특화된 작고 효율적인 코어 수천 개를 활용합니다.

여기서 끝이 아닙니다. XCENA는 자체적인 내부 메모리 계층, 인터커넥트 버스, 그리고 DRAM 컨트롤러까지 설계합니다. 이는 대부분의 칩 회사들이 심지어 더 큰 경쟁사들조차 일반적으로 외주를 주는 영역입니다. 이러한 수직 통합(vertical integration) 수준은 XCENA가 단순히 부품을 조합하는 것을 넘어, 전체 시스템을 최적화하여 독보적인 성능과 효율성을 달성하려는 의지를 보여줍니다.

업계 흐름을 보면, RISC-V 기반의 커스텀 칩 설계와 깊은 수준의 수직 통합은 특정 애플리케이션에 최적화된 성능과 전력 효율을 극대화하려는 추세와 맞닿아 있습니다. XCENA가 이러한 전략을 선택한 것은, 범용 GPU나 CPU가 해결하지 못하는 AI 인프라의 고질적인 문제를 정면으로 돌파하겠다는 강력한 의지를 보여줍니다. 개발 비용과 복잡성은 상당하겠지만, 성공한다면 경쟁사들이 쉽게 모방할 수 없는 강력한 해자를 구축할 수 있을 것입니다.

XCENA는 2022년 김진 CEO를 비롯해 김도훈 CTO, 김주현 CPO 등 삼성과 SK하이닉스 출신 베테랑들이 공동 설립했습니다. 현재 판교와 써니베일에 90명 이상의 직원이 근무하고 있으며, 국내 벤처캐피털인 아테넘인베스트먼트와 IMM인베스트먼트가 시리즈 B 라운드를 공동 주도했습니다. 이들의 MX1 칩은 아직 프로토타입 단계이지만, 2026년 말까지 삼성 파운드리 라인에서 양산될 예정이며, 2027년부터는 매출을 기대하고 있습니다.

AI의 시대는 이제 막 시작되었습니다. 연산 능력 경쟁이 AI 발전의 핵심으로 여겨지던 시대는 저물고, 이제는 데이터를 얼마나 효율적으로, 그리고 비용 효과적으로 다루느냐가 다음 AI 혁명의 열쇠가 될 것입니다. XCENA와 같은 혁신적인 스타트업들이 제시하는 새로운 접근 방식이 AI 인프라의 미래를 어떻게 재편할지, 그 행보가 정말 기대됩니다.


출처

  • 원문 제목: This chip startup just raised $135M on a bet that AI’s biggest bottleneck isn’t compute — it’s memory
  • 출처: AI News & Artificial Intelligence | TechCrunch
  • 원문 기사 보러가기
Share this story

Related News