비디오 게임 속 디지털 세계, 이제 AI의 현실 모델 훈련장이 되다
Published May 14, 2026
“지금 구축되고 있는 AI 시스템은 물리적 세계가 어떻게 작동하고 사물이 어떻게 움직이는지 이해해야 합니다. 그리고 그 데이터는 본질적으로 비디오 게임에 존재합니다.” 오리진 랩(Origin Lab)의 공동 CEO이자 공동 창업자인 앤-마고 로드(Anne-Margot Rodde)의 이 발언은 현재 AI 분야가 직면한 가장 흥미롭고도 중대한 문제 중 하나를 명확히 보여줍니다. 거대 언어 모델(Large Language Models, LLMs)이 텍스트 기반의 방대한 데이터 덕분에 놀라운 발전을 이룩한 반면, 물리적 세계를 이해하고 상호작용할 수 있는 ‘월드 모델(World Model)’ AI는 여전히 적절한 고품질 데이터 소스를 찾아 헤매고 있었습니다. 이러한 상황에서 비디오 게임 산업이 예상치 못한 구원투수로 등장한 것입니다.
AI 월드 모델, 왜 특별한 데이터가 필요한가?
최근 AI 기술은 가상 공간을 넘어 물리적 세계와 상호작용하는 방향으로 빠르게 진화하고 있습니다. 자율 주행 로봇, 물리적 공간의 객체 모델링 등, 이러한 AI 시스템은 단순히 언어를 이해하는 것을 넘어, 물체의 움직임, 질량, 상호작용, 공간적 특성 등 현실 세계의 복잡한 물리 법칙과 역학을 깊이 있게 학습해야 합니다. 그러나 이러한 학습에 필요한 양질의 훈련 데이터를 확보하는 것은 LLM 데이터 수집과는 완전히 다른 차원의 과제입니다. LLM의 경우 인터넷에 널려 있는 텍스트 데이터를 활용할 수 있었지만, 월드 모델에 필요한 물리 기반 데이터는 쉽게 찾아볼 수 없었기 때문입니다. 많은 연구소들이 필요한 훈련 세트를 구성하기 위해 고군분투해 왔고, 이 과정에서 데이터 병목 현상은 AI 발전의 속도를 저해하는 주된 요인으로 작용했습니다.
여기서 오리진 랩의 등장은 주목할 만합니다. 그들은 이 난제를 해결할 열쇠를 비디오 게임 산업에서 찾았습니다. 수십 년간 수조 원의 자본과 무수한 인력이 투입되어 구축된 비디오 게임은 정교하게 설계된 가상 세계, 실제와 같은 물리 엔진, 다양한 객체 모델링, 캐릭터의 복잡한 움직임 패턴 등 AI 월드 모델 훈련에 최적화된 방대한 데이터를 이미 내포하고 있습니다. 솔직히 말해서, 게임 속 디지털 환경은 현실 세계의 복잡성을 모방하고 재현하는 데 가장 진보된 형태의 가상 공간 중 하나라고 할 수 있습니다.

오리진 랩의 역할: 게임과 AI의 다리 놓기 🌉
오리진 랩은 이러한 통찰을 바탕으로 AI 연구소와 비디오 게임 회사를 연결하는 혁신적인 데이터 마켓플레이스를 구축합니다. 이들은 **라이트스피드 벤처스(Lightspeed Ventures)**가 주도하는 800만 달러(약 109억 원) 규모의 시드 펀딩 라운드를 성공적으로 유치하며 그 잠재력을 입증했습니다. SV 엔젤, 이니악, 세븐 스타즈, FPV 등 유수의 투자사들이 참여했으며, 트위치(Twitch) 공동 창업자 케빈 린(Kevin Lin)과 크루즈(Cruise) 창업자 카일 보그트(Kyle Vogt) 같은 저명한 엔젤 투자자들도 지원에 나섰습니다.
오리진 랩의 비즈니스 모델은 양쪽에 명확한 가치를 제공합니다.
- AI 연구소 측면: 얀 르쿤(Yann LeCun)의 AMI 랩이나 페이페이 리(Fei-Fei Li)의 월드 랩과 같은 월드 모델 중심의 연구소들은 오리진 랩을 통해 고품질의 라이선스 데이터를 구매할 수 있게 됩니다. 이는 더 이상 데이터를 직접 수집하고 정제하는 데 막대한 시간과 자원을 낭비할 필요가 없다는 것을 의미하며, 연구 속도를 획기적으로 가속화할 수 있습니다.
- 비디오 게임 회사 측면: 이미 만들어진 디지털 자산에서 추가 수익을 창출할 수 있는 새로운 길을 열어줍니다. 게임 개발은 막대한 비용이 드는 작업이지만, 개발된 자산은 게임 출시 후에는 새로운 수익 기회를 찾기 어려웠습니다. 이제 오리진 랩을 통해 이 디지털 자산들이 AI 훈련 데이터라는 새로운 가치를 얻게 되는 것입니다. 이는 게임 개발사들에게 추가적인 매출원을 제공하며, 장기적으로는 게임 개발 생태계에도 긍정적인 영향을 미칠 수 있습니다.
오리진 랩은 단순한 중개자 역할에 그치지 않습니다. 그들은 비디오 게임 자산을 AI 훈련 데이터로 작동하는 형태로 변환하는 핵심적인 기술력을 제공합니다. 이는 단순한 렌더링 실행일 수도 있고, 수 시간 분량의 플레이 영상(walkthrough footage)을 자동화하여 데이터로 만드는 복잡한 과정일 수도 있습니다. 앤-마고 로드의 말처럼, “비디오 게임 산업이 엄청나게 가치 있는 데이터를 가지고 있었지만, AI 연구소와 비디오 게임 산업을 연결할 실질적인 방법이나 인프라가 없다는 것이 분명했습니다. 그래서 본질적으로, 우리는 그 다리를 구축했습니다.”
과거의 시행착오와 오리진 랩의 기회
사실, AI 커뮤니티가 비디오 게임 영상을 데이터 소스로 활용하려는 시도는 과거에도 있었습니다. 하지만 라이선스 문제와 데이터 품질 문제가 발목을 잡곤 했죠. 2024년 12월, OpenAI의 비디오 생성 모델인 소라(Sora)의 초기 버전이 인기 비디오 게임 및 스트리머의 푸티지를 그대로 재현하는 것처럼 보이면서 작은 논란을 일으킨 적이 있습니다. 이는 소라가 트위치(Twitch) 스트림 데이터를 학습했을 가능성을 시사했었죠. 아마존 역시 트위치 푸티지를 모델 훈련에 사용하려는 의도를 공개적으로 밝힌 바 있습니다.
이러한 과거 사례들은 비디오 게임 데이터의 가치를 보여줌과 동시에, 라이선스와 데이터 품질, 그리고 윤리적 문제가 얼마나 중요한지를 역설합니다. 오리진 랩은 바로 이 지점에서 차별점을 가집니다. 그들은 단순히 데이터를 수집하는 것을 넘어, 공식적으로 라이선스된 고품질 데이터를 제공함으로써 AI 연구소들이 법적, 윤리적 문제없이 안심하고 훈련 데이터를 사용할 수 있도록 돕습니다.
개인적으로 이 부분에서 주목할 점은, 오리진 랩이 단순한 데이터 판매를 넘어 데이터의 “합법적인 원천(legitimate source)“을 제공한다는 점입니다. AI 모델의 신뢰성과 투명성이 강조되는 시대에, 데이터의 출처와 사용 권한은 매우 중요합니다. 오리진 랩은 이러한 니즈를 정확히 파고들어, 과거의 시행착오를 통해 얻은 교훈을 바탕으로 새로운 표준을 제시하려는 시도로 보입니다. 이는 AI 산업의 성숙도와 함께 데이터 거버넌스의 중요성이 더욱 부각될 것이라는 업계 흐름을 반영한다고 볼 수 있습니다.
라이트스피드의 파트너이자 오리진 투자를 주도한 파라즈 파테미(Faraz Fatemi)는 “주요 연구소에 서비스를 제공하는 데이터 공급업체의 수익 규모가 얼마나 날카롭게 확장될 수 있는지 목격했습니다. 이들은 매우 자본이 풍부한 기업이며, 그들 모두의 병목 현상은 데이터입니다”라고 강조했습니다. 스케일 AI(Scale AI)와 같은 기업의 성공은 이러한 기회를 무시할 수 없음을 보여줍니다. 오리진 랩의 펀딩 성공은 훈련 데이터 시장뿐만 아니라, 주요 AI 연구소에 필수적인 공급업체 역할을 하는 스타트업을 위한 성장하는 시장의 신호탄이라고 생각합니다.
결론: 게임과 AI, 상생의 미래를 그리다
오리진 랩의 출현은 AI 산업의 데이터 확보 방식에 대한 새로운 패러다임을 제시합니다. 비디오 게임 산업의 잠재된 가치를 AI 발전의 핵심 동력으로 활용하려는 이들의 시도는 단순한 비즈니스 모델을 넘어, 두 거대한 산업이 상생하며 혁신을 이끌어낼 수 있는 가능성을 보여줍니다. 물리적 세계를 이해하고 상호작용하는 AI가 우리의 일상에 깊숙이 들어오는 미래는 이제 비디오 게임 속 데이터가 현실화시키는 데 일조할 것입니다.
출처
- 원문 제목: Origin Lab raises $8M to help video game companies sell data to world-model builders
- 출처: AI News & Artificial Intelligence | TechCrunch
- 원문 기사 보러가기