6분 20초 AI 음악: 단순한 길이가 아니다, 생존을 위한 전략이다
Published May 21, 2026
불과 2년 전, AI가 생성할 수 있는 음악의 길이는 고작 몇십 초에 불과했습니다. 짧은 멜로디나 단편적인 사운드 이펙트 제작에나 활용되던 AI 음악 기술은 과연 실용적인 ‘곡’을 만들어낼 수 있을까요? 그런데 지금, 스테이블 디퓨전(Stable Diffusion)의 주역, Stability AI가 이 질문에 대한 충격적인 답을 내놓았습니다. 바로 최대 6분 20초 길이의 전문가급 음악을 생성할 수 있는 Stability Audio 3.0 모델입니다. 2024년에 출시된 Stable Audio 2.0이 생성 가능했던 길이의 두 배 이상이며, 초기 오픈 모델인 Stable Audio Open의 47초와 비교하면 그야말로 상상하기 어려운 비약적인 발전입니다. 이 정도 길이와 완성도라면, AI가 단순한 도구를 넘어 실제 음악 창작의 주류로 진입할 수 있다는 가능성을 보여주는 것이 아닐까요?
압도적인 성장세: ‘길이’의 혁신이 가져올 파장
Stability AI는 Stability Audio 3.0이라는 이름으로 총 네 가지 새로운 모델을 선보였습니다. 소규모 SFX(4.59억 매개변수), 소규모(4.59억 매개변수), 중규모(14억 매개변수), 대규모(27억 매개변수) 모델이 그것입니다. 이 중 소규모 모델 듀오는 온디바이스(on-device) 환경에서 최대 2분 길이의 사운드 및 음악 생성이 가능합니다. 하지만 정말 주목해야 할 부분은 중규모 및 대규모 모델입니다. 이들은 멜로디 구조와 선율적 톤을 유지하면서 무려 6분 20초 길이의 완전한 작곡을 만들어낼 수 있다고 합니다.
사실, 음악을 ‘만든다’는 것은 단순히 음표를 나열하는 것을 넘어, 곡의 기승전결과 감정선을 유지하며 듣는 이를 몰입시키는 스토리텔링 과정입니다. 짧은 AI 생성 음악은 흥미로운 실험작일 수는 있지만, 실제 상업 음악이나 예술 작품으로서는 한계가 명확했죠. 곡의 흐름이 끊기거나, 특정 패턴이 반복되는 단점이 두드러지곤 했습니다. 하지만 Stability Audio 3.0의 6분 20초라는 길이는 다릅니다. 이는 실제 팝송, 재즈, 심지어는 영화 음악의 한 시퀀스로서 충분히 기능할 수 있는 수준입니다. 이전 버전들이 ‘스케치’에 불과했다면, 이번 3.0은 완벽한 ‘캔버스’ 위에 그림을 그릴 수 있게 된 셈이죠. 개인적으로는 이 기술이 단순한 길이의 확장을 넘어, AI가 음악의 본질적인 요소인 **서사성(Narrative)**을 이해하고 구현하기 시작했다는 점에서 더욱 큰 의미를 가진다고 생각합니다. 이제 AI는 음악의 시작과 끝을 넘어, 그 사이의 복잡한 감정 변화와 구조적 완결성까지 책임질 수 있는 단계에 이르렀다는 겁니다.

‘오픈’과 ‘유료’의 전략적 공존: 시장 지배를 위한 투트랙 전략
Stability AI는 이번 Stability Audio 3.0 모델들을 출시하면서 매우 영리한 전략을 구사하고 있습니다. 소규모 SFX, 소규모, 중규모 모델은 **오픈 웨이트(open weights)**로 제공되어 누구나 사용하고 수정할 수 있도록 했습니다. 이는 개발자와 아티스트 커뮤니티의 참여를 유도하고, 생태계를 확장하며, 기술의 빠른 발전을 촉진하는 데 크게 기여할 것입니다. 과거 Stability AI가 47초 길이의 Stable Audio Open을 공개했을 때처럼, 수많은 크리에이터들이 이 기술을 활용하여 예상치 못한 혁신을 만들어낼 가능성이 높죠.
반면, 가장 강력한 대규모 모델은 API 및 유료 자체 호스팅 서비스를 통해서만 이용 가능하며, 100만 달러 이상의 수익을 내는 기업들은 엔터프라이즈 라이선스를 취득해야 합니다. 솔직히 말해서, 이 투트랙 전략은 시장을 선도하려는 Stability AI의 야심을 명확히 보여줍니다. 오픈 소스를 통해 광범위한 사용자 기반을 확보하고 기술 발전을 가속화하는 동시에, 최첨단 기술에 대한 접근성을 제한하여 수익 모델을 구축하겠다는 의도죠. 이는 이미 수많은 AI 스타트업들이 채택하고 있는 방식이기도 합니다. 저렴하거나 무료로 핵심 기능을 제공하여 시장을 확대하고, 더 고도화된 기능이나 전문적인 지원은 유료 모델로 전환하는 방식입니다. 사실 이건 AI 모델을 개발하는 데 막대한 비용이 소요되는 현실을 고려했을 때, 지속 가능한 성장을 위한 필수적인 선택이기도 합니다.
AI 음악의 뜨거운 감자: 저작권과 ‘정당한’ 데이터
AI 음악 분야에서 기술 발전만큼이나 뜨거운 감자는 바로 저작권 문제입니다. Google이나 ElevenLabs 같은 많은 기업들이 음악 생성 모델과 도구를 출시하고 있지만, Suno와 Udio가 겪고 있는 소송전에서 알 수 있듯이, 데이터 라이선싱과 음반사와의 파트너십이 서비스의 장기적인 생존에 핵심적인 요소가 될 수 있습니다. 무단으로 저작권이 있는 음악을 학습 데이터로 사용하는 것이 법적으로 큰 문제가 될 수 있다는 경고인 셈이죠.
이런 상황에서 Stability AI의 행보는 확실히 차별화됩니다. Stability AI는 지난해 워너 뮤직 그룹(Warner Music Group) 및 유니버설 뮤직 그룹(Universal Music Group)과 모델 및 음악 창작 도구 개발을 위한 계약을 체결했습니다. 그리고 이번 최신 오디오 모델 세트는 **“완전히 라이선스 된 데이터(fully licensed data)“**를 기반으로 구축되었다고 강조합니다. 이 부분에서 주목할 점은 Stability AI가 저작권 문제를 회피하거나 무시하는 대신, 기존 음악 산업의 주요 플레이어들과 정면으로 부딪혀 협력 관계를 구축하고 있다는 사실입니다. 개인적으로는 이것이 AI 음악 스타트업들이 장기적으로 생존하고 성공하기 위한 가장 현실적이고 현명한 전략이라고 생각합니다. 저작권 논란에 휩싸여 서비스 자체가 위태로워지는 것보다는, 합법적인 틀 안에서 상생 모델을 모색하는 것이 훨씬 안정적이기 때문입니다.
더 나아가, Stability AI는 전문 음악가들을 위한 새로운 제품군을 개발 중이며, 유니버설 오디오(Universal Audio) 및 펜더(Fender)의 전 최고 디지털 책임자였던 에단 카플란(Ethan Kaplan)을 영입하여 전문 음악 사업부를 이끌게 했습니다. Suno가 전 멀린(Merlin) CEO 제레미 시로타(Jeremy Sirota)를 영입하고, ElevenLabs가 인디 음악 퍼블리셔 코발트(Kobalt) 출신 데릭 쿠르노이어(Derek Cournoyer)를 영입하는 등, 다른 AI 기업들도 음악 산업 전문가들을 영입하며 ‘정통성’과 ‘전문성’을 강화하려는 추세를 보이고 있습니다. 이는 AI 음악 기술이 단순히 기술적 도구를 넘어, 실제 음악 시장에 깊숙이 침투하고 기존 산업과의 접점을 확대하려는 의지를 보여주는 명백한 신호입니다. 과거에는 AI가 음악 산업을 파괴할 것이라는 막연한 우려가 많았지만, 이제는 협력과 공존의 가능성을 모색하고 있는 것이죠.
미래 음악 산업의 변곡점
Stability Audio 3.0의 출시는 AI 음악 기술이 또 하나의 중요한 변곡점에 도달했음을 알리는 신호탄입니다. 6분 20초라는 길이는 AI가 단순한 실험을 넘어 실제 상업적, 예술적 영역에서 충분히 활용될 수 있는 잠재력을 입증합니다. 그리고 오픈 소스와 유료 API를 결합한 전략은 기술의 확산과 수익 모델 구축이라는 두 마리 토끼를 동시에 잡으려는 영리한 시도로 보입니다.
무엇보다 중요한 것은, 저작권 문제에 대한 Stability AI의 접근 방식입니다. 음반사와의 파트너십과 ‘완전히 라이선스 된 데이터’는 논란이 끊이지 않는 AI 학습 데이터 문제에 대한 모범적인 해결책을 제시하며, AI 음악 산업의 지속 가능한 미래를 위한 중요한 이정표가 될 것입니다. 과연 Stability AI가 기술적 우위와 함께 법적 정당성이라는 강력한 무기를 바탕으로 AI 음악 시장의 판도를 뒤흔들 수 있을까요? 음악과 AI의 미래는 이제 예측 불가능한 속도로, 그러나 확실한 방향으로 진화하고 있습니다.
출처
- 원문 제목: Stability AI releases a new audio model that can create 6-minute songs
- 출처: AI News & Artificial Intelligence | TechCrunch
- 원문 기사 보러가기