SUNO의 강력한 경쟁자? 그런데 심지어 오픈소스라구요? Stable Audio: 음악 생성의 패러다임을 바꾸는 잠재 오디오 확산 기술
Stable Audio: 음악 생성의 패러다임을 바꾸는 잠재 오디오 확산 기술
AI 기반 음악 생성 기술이 빠르게 발전하는 가운데, Stable Audio는 그 중에서도 혁신적인 도약으로 주목받고 있습니다. Stability AI의 연구소 Harmonai에서 개발한 이 기술은 기존의 오디오 생성 모델에서 제기된 주요 문제들을 해결하며, 음악 산업 전반에 새로운 가능성을 열고 있습니다.
기존의 오디오 확산 모델은 고정된 길이의 오디오 클립만 생성할 수 있는 한계가 있었습니다. 이로 인해 전체 곡을 생성하거나 다양한 길이의 음악을 만들 때 유연성이 부족했으며, 특히 곡의 중간에서 시작하거나 어색한 구절을 만드는 문제가 빈번하게 발생했습니다.
그러나 Stable Audio는 오디오의 길이와 시작점을 자유롭게 설정할 수 있는 타이밍 조절 기능을 도입해, 이 같은 한계를 뛰어넘었습니다. 이를 통해 창작자들은 더욱 자연스러운 음악을 제작할 수 있게 되었습니다.
Stable Audio는 AudioSparx와 같은 주요 음악 공급자가 제공한 80만 개 이상의 음악 및 사운드 파일을 데이터셋으로 활용해 훈련되었습니다. 이로 인해 더욱 다양한 스타일과 질감의 오디오를 생성할 수 있으며, 44.1kHz 샘플 레이트에서 95초 분량의 스테레오 오디오를 NVIDIA A100 GPU에서 단 1초 이내에 생성할 수 있는 빠른 처리 속도를 자랑합니다.
이 기술의 잠재력은 단순한 오디오 생성에 그치지 않습니다. 음악, 게임, 영화, 광고와 같은 여러 분야에서 고품질의 맞춤형 배경 음악을 빠르게 생성할 수 있으며, AI가 창의적인 프로세스에 더욱 깊이 관여할 수 있는 기반을 제공합니다. 특히 사용자들은 Stable Audio의 유연성과 제어 가능성 덕분에 보다 섬세하고 복잡한 음악적 요구 사항을 충족할 수 있습니다.
향후 Stable Audio는 모델 아키텍처와 훈련 절차를 개선하여 출력 품질과 제어 가능성을 더욱 향상시킬 예정입니다. 또한, 오픈 소스 커뮤니티와 협력해 오디오 생성 모델의 훈련 코드를 공개함으로써, 더 많은 연구자와 개발자가 이 기술을 발전시키는 데 기여할 수 있는 환경을 조성할 계획입니다.
AI 기술이 음악 제작의 새로운 지평을 열고 있는 지금, Stable Audio는 그 중심에서 미래의 음악 생태계를 재정의하고 있습니다. 창작자들은 이 새로운 기술을 통해 보다 유연하고 창의적인 방식으로 음악을 탐구할 수 있을 것이며, AI 음악 생성의 진화는 이제 막 시작되었습니다.
아래 링크를 통해 직접 확인해보실 수 있습니다 :)
편하게 자신만의 음악을 만들어보는건 어떨까요!
https://www.stableaudio.com/generate