Demucs 로컬 설치: 무료 AI 스템 분리 설정 가이드

Demucs는 오늘날 대부분의 전문 스템 분리 도구를 구동하는 AI 모델입니다 — StemSplit 포함. 이 가이드는 설치부터 아키텍처까지 커스텀 모델 훈련까지 모든 것을 다루며 호기심 많은 음악가와 ML 엔지니어 모두를 위해 작성되었습니다.

요약: Demucs는 Meta AI의 하이브리드 트랜스포머 모델로 오디오를 보컬, 드럼, 베이스 및 기타 악기로 분리합니다. pip install -U demucs로 설치하고, demucs your_song.mp3로 실행하고, 몇 분 안에 스튜디오 품질의 스템을 받으세요. 최상의 결과를 위해 GPU 가속과 함께 htdemucs_ft 모델을 사용하세요.

Demucs란?

Demucs (Deep Extractor for Music Sources)는 음악 소스 분리를 위해 Meta AI Research에서 개발한 오픈 소스 AI 모델입니다. 혼합된 오디오 트랙을 가져와 분리된 스템을 출력합니다 — 일반적으로 보컬, 드럼, 베이스 및 "기타" (그 외 모든 것).

Demucs가 중요한 이유:

최첨단 품질: MUSDB18-HQ 벤치마크에서 9.20 dB의 SDR (Signal-to-Distortion Ratio) 달성 — 이전 모델보다 높음
파형 기반 처리: 스펙트로그램뿐만 아니라 원시 오디오에서 직접 작동하여 위상 정보 보존
오픈 소스: MIT 라이선스, 상업적 및 개인적 사용 무료
실전 테스트됨: 대부분의 전문 스템 분리 서비스 구동

최신 버전인 Hybrid Transformer Demucs (HTDemucs)는 네 번째 주요 반복을 나타내며 시간 도메인과 주파수 도메인 처리의 장점을 결합합니다.

진화: v1 → v4

Demucs의 진화를 이해하면 왜 그렇게 잘 작동하는지 설명하는 데 도움이 됩니다.

Demucs v1 (2019)

원래 Demucs는 파형에서 직접 작동하는 U-Net 아키텍처를 도입했습니다 — 스펙트로그램 전용 방법에서 벗어남. 주요 혁신:

활성화를 위한 Gated Linear Units (GLUs)
인코더와 디코더 사이의 양방향 LSTM
인코더에서 디코더 레이어로의 스킵 연결

아키텍처: BiLSTM이 있는 순수 파형 U-Net
SDR: MUSDB18에서 ~6.3 dB
혁신: 첫 번째 경쟁력 있는 파형 전용 모델

Demucs v2 (2020)

깊이 및 훈련 개선:

더 깊은 인코더/디코더 (6 레이어 → 7 레이어)
더 나은 가중치 초기화
데이터 증강 개선

SDR: MUSDB18에서 ~6.8 dB
혁신: 파형 모델이 스펙트로그램 방법과 경쟁할 수 있음을 입증

Demucs v3 / Hybrid Demucs (2021)

돌파구: 스펙트로그램과 파형 처리 결합:

이중 U-Net 아키텍처 (시간 도메인용 하나, 주파수 도메인용 하나)
분기 간 공유 표현
병목에서 교차 도메인 융합

SDR: MUSDB18에서 ~7.5 dB
혁신: 양쪽의 장점 — 스펙트로그램 정밀도 + 파형 위상

Demucs v4 / HTDemucs (2022-2023)

현재 최첨단, 트랜스포머 추가:

인코더와 디코더 모두에 트랜스포머 레이어
시간 및 스펙트럼 분기 간 교차 주의
장거리 종속성을 위한 자기 주의

SDR: MUSDB18-HQ에서 9.20 dB
혁신: 트랜스포머가 장거리 음악 구조 캡처

사용 가능한 모델 비교

Demucs는 여러 사전 훈련된 모델을 제공합니다. 비교 방법은 다음과 같습니다:

모델	스템	SDR (보컬)	SDR (평균)	속도	VRAM	최적 용도
`htdemucs`	4	8.99 dB	7.66 dB	빠름	~4GB	일반 사용, 좋은 균형
`htdemucs_ft`	4	9.20 dB	7.93 dB	느림	~6GB	최고 품질
`htdemucs_6s`	6	8.83 dB	N/A	중간	~5GB	기타/피아노 분리
`mdx`	4	8.5 dB	7.2 dB	빠름	~3GB	낮은 VRAM 시스템
`mdx_extra`	4	8.7 dB	7.4 dB	중간	~4GB	mdx보다 나음
`mdx_q`	4	8.3 dB	7.0 dB	가장 빠름	~2GB	빠른 미리보기

시스템 요구 사항

최소 요구 사항

구성 요소	최소	권장
CPU	최신 x86_64	4+ 코어
RAM	8 GB	16 GB
GPU	없음 (CPU 작동)	NVIDIA 4GB+ VRAM
저장소	2 GB	5 GB (모델용)
Python	3.8+	3.10+

처리 시간 추정

44.1kHz의 4분 스테레오 트랙의 경우:

하드웨어	htdemucs	htdemucs_ft
NVIDIA RTX 4090	~30초	~60초
NVIDIA RTX 3080	~45초	~90초
NVIDIA RTX 3060	~90초	~180초
Apple M1 Pro	~120초	~240초
Intel i7 (CPU)	~8분	~15분
Intel i5 (CPU)	~15분	~25분

설치 가이드

옵션 1: pip (가장 간단)

트랙을 분리하고 싶은 대부분의 사용자를 위해:

# 가상 환경 만들기 (권장)
python3 -m venv demucs_env
source demucs_env/bin/activate  # Windows: demucs_env\Scripts\activate

# Demucs 설치
pip install -U demucs

# 설치 확인
demucs --help

옵션 2: Conda (GPU에 권장)

GPU 가속 및 ML 개발을 위해:

# 저장소 복제
git clone https://github.com/facebookresearch/demucs
cd demucs

# 환경 만들기 (하나 선택)
conda env update -f environment-cuda.yml  # NVIDIA GPU용
conda env update -f environment-cpu.yml   # CPU 전용

# 환경 활성화
conda activate demucs

# 개발 모드로 설치
pip install -e .

# GPU 감지 확인 (PyTorch: https://pytorch.org/)
python -c "import torch; print(f'CUDA available: {torch.cuda.is_available()}')"

플랫폼별 참고 사항

macOS (Intel)

# FFmpeg 설치 (필수)
# https://ffmpeg.org/download.html에서 다운로드
brew install ffmpeg
pip install -U demucs

macOS (Apple Silicon M1/M2/M3)

# FFmpeg (오디오 처리에 필수)
# 공식 사이트: https://ffmpeg.org/
brew install ffmpeg

# MPS 지원으로 설치 (Metal Performance Shaders)
pip install -U demucs

# MPS 사용 가능한지 확인
python -c "import torch; print(f'MPS available: {torch.backends.mps.is_available()}')"

Demucs 실행 시 --device mps 플래그 사용.

Windows

# Anaconda Prompt 사용:
conda install -c conda-forge ffmpeg
pip install -U demucs soundfile

# CUDA 메모리 문제 방지
set PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:128

Linux (Ubuntu/Debian)

# 시스템 종속성
# FFmpeg: https://ffmpeg.org/
sudo apt-get update
sudo apt-get install ffmpeg libsndfile1

# Demucs 설치
pip install -U demucs

기본 사용법

트랙 분리

가장 간단한 명령:

demucs song.mp3

일반적인 사용 사례

보컬만 추출 (노래방 만들기):

demucs --two-stems vocals song.mp3

출력: vocals.wav 및 no_vocals.wav (인스트루멘탈)

인스트루멘탈만 추출:

demucs --two-stems vocals song.mp3
# 그런 다음 no_vocals.wav 파일 사용

여러 파일 처리:

demucs song1.mp3 song2.mp3 song3.mp3

WAV 대신 MP3로 출력:

demucs --mp3 --mp3-bitrate 320 song.mp3

최고 품질 모델 사용:

demucs -n htdemucs_ft song.mp3

출력 디렉토리 지정:

demucs -o ./my_stems song.mp3

고급 명령줄 옵션

모델 선택

# 특정 모델 사용
demucs -n htdemucs_ft song.mp3     # 최고 품질
demucs -n htdemucs_6s song.mp3     # 6-스템 출력
demucs -n mdx_q song.mp3           # 가장 빠름/작음

장치 제어

# CPU 처리 강제
demucs -d cpu song.mp3

# 특정 GPU 사용
demucs -d cuda:0 song.mp3          # 첫 번째 GPU
demucs -d cuda:1 song.mp3          # 두 번째 GPU

# Apple Silicon
demucs -d mps song.mp3

품질 대 메모리 트레이드오프

# 세그먼트 길이 (초) - 낮을수록 = VRAM 적게, 품질 잠재적으로 나쁨
demucs --segment 10 song.mp3       # 매우 낮은 VRAM용
demucs --segment 40 song.mp3       # 대부분의 모델의 기본값

# 세그먼트 간 겹침 (0-0.99)
demucs --overlap 0.25 song.mp3     # 기본값

# 시프트 - 품질을 ~0.2 SDR 증가시키지만 느림
demucs --shifts 2 song.mp3         # 시간 시프트로 두 번 처리
demucs --shifts 5 song.mp3         # 더 많은 시프트 = 더 나은 품질, 느림

출력 형식

# WAV 옵션
demucs --int24 song.mp3            # 24비트 WAV 출력
demucs --float32 song.mp3          # 32비트 float WAV

# MP3 옵션
demucs --mp3 song.mp3              # 기본 비트레이트
demucs --mp3 --mp3-bitrate 320 song.mp3  # 고품질
demucs --mp3 --mp3-preset 2 song.mp3     # 최고 품질 프리셋

# 클리핑 방지
demucs --clip-mode rescale song.mp3      # 클리핑 방지를 위해 재조정
demucs --clip-mode clamp song.mp3        # 하드 리미트 (기본값)

완전한 예제

최대 품질, GPU 가속:

demucs \
  -n htdemucs_ft \
  -d cuda:0 \
  --shifts 2 \
  --overlap 0.25 \
  --float32 \
  --clip-mode rescale \
  -o ./output \
  song.mp3

Python API 통합

애플리케이션에 Demucs 통합:

기본 프로그래밍 사용

import demucs.separate

# 인수 목록 사용 (CLI처럼)
demucs.separate.main([
    "--mp3",
    "--two-stems", "vocals",
    "-n", "htdemucs",
    "song.mp3"
])

Separator 클래스 사용

from demucs.api import Separator
import torch

# 분리기 초기화
separator = Separator(
    model="htdemucs_ft",
    segment=40,
    shifts=2,
    device="cuda" if torch.cuda.is_available() else "cpu",
    progress=True
)

# 로드 및 분리
origin, separated = separator.separate_audio_file("song.mp3")

# `separated`는 텐서 값이 있는 dict입니다:
# separated["vocals"] -> torch.Tensor
# separated["drums"] -> torch.Tensor
# separated["bass"] -> torch.Tensor
# separated["other"] -> torch.Tensor

# 개별 스템 저장
from demucs.api import save_audio

for stem_name, stem_tensor in separated.items():
    save_audio(
        stem_tensor,
        f"output/{stem_name}.wav",
        samplerate=separator.samplerate,
        clip="rescale"
    )

문제 해결 일반적인 문제

CUDA 메모리 부족

오류:

RuntimeError: CUDA out of memory. Tried to allocate X MiB

해결 방법:

# 더 작은 세그먼트 사용
demucs --segment 10 song.mp3

# 대신 CPU 사용
demucs -d cpu song.mp3

# 더 가벼운 모델 사용
demucs -n mdx_q song.mp3

# PyTorch 메모리 구성 설정 (Windows)
set PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:128

# 또는 Linux/Mac에서
export PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:128

FFmpeg를 찾을 수 없음

오류:

FileNotFoundError: [Errno 2] No such file or directory: 'ffmpeg'

해결 방법:

FFmpeg는 오디오 형식 변환에 필요합니다. 공식 FFmpeg 웹사이트에서 다운로드하거나 다음을 통해 설치:

# macOS
brew install ffmpeg

# Ubuntu/Debian
sudo apt-get install ffmpeg

# Windows (conda를 통해)
conda install -c conda-forge ffmpeg

낮은 분리 품질

증상: 아티팩트, 스템 간 출혈, 흐릿한 출력

해결 방법:

더 높은 품질의 소스 파일 사용:
- 무손실 (WAV, FLAC) > 고비트레이트 MP3 (320kbps) > 저비트레이트 MP3
더 나은 모델 사용:

demucs -n htdemucs_ft song.mp3

시프트 증가 (속도 희생):

demucs --shifts 5 song.mp3

Python 환경과 GPU 드라이버 문제 해결을 원하지 않으신가요? StemSplit은 클라우드에서 최적화된 Demucs를 실행합니다 — 30초 무료 미리보기, 설정 필요 없음.

DIY가 의미 있는 경우

Demucs를 로컬에서 실행하는 것이 의미 있는 경우에 대해 솔직하게 이야기해 봅시다:

시나리오	DIY Demucs	클라우드 서비스 (StemSplit)
처리량	대량 (100곡 이상)	가끔 사용
하드웨어	좋은 GPU가 있음	CPU만 또는 GPU 없음
기술 능력	Python/CLI에 익숙함	GUI 선호
개인 정보 요구 사항	오디오를 로컬에 유지 필요	클라우드 허용 가능
예산	시간은 있지만 돈은 없음	돈은 있지만 시간은 없음
커스터마이징	모델 미세 조정 필요	표준 분리로 충분
지불 전 미리보기	사용 불가	무료 30초 미리보기

비용 비교

DIY Demucs:

하드웨어: $0 (기존) ~ $800+ (GPU 업그레이드)
전기: 곡당 ~$0.01-0.05
시간: 설정 (1-4시간) + 처리 시간
유지 관리: 업데이트, 문제 해결

StemSplit:

설정 없음
사용한 만큼 지불 (크레딧 만료 없음)
몰입 전 무료 미리보기
항상 최신 모델 사용

FAQ

Demucs는 무료인가요?

예. Demucs는 MIT 라이선스 하에 오픈 소스이며 개인 및 상업적 사용이 무료입니다. 모델도 무료로 사용할 수 있습니다.

Demucs를 상업적으로 사용할 수 있나요?

예. MIT 라이선스는 제한 없이 상업적 사용을 허용합니다. 상업 릴리스에서 분리된 스템을 사용하고 Demucs 위에 제품을 구축할 수 있습니다.

Demucs와 Spleeter의 차이점은?

측면	Demucs	Spleeter
개발자	Meta AI	Deezer
아키텍처	하이브리드 트랜스포머	단순 U-Net
품질 (SDR)	~9.2 dB	~5.9 dB
처리	파형 + 스펙트로그램	스펙트로그램만
속도	느림	빠름
출시	2019 (v1), 2023 (v4)	2019

Demucs는 훨씬 높은 품질을 생성하지만 더 많은 계산이 필요합니다.

GPU가 필요한가요?

아니오, 하지만 상당히 도움이 됩니다. CPU 처리는 작동하지만 5-10배 느립니다. 4GB+ VRAM이 있는 최신 NVIDIA GPU가 합리적인 처리 시간에 권장됩니다.

처리는 얼마나 걸리나요?

하드웨어 및 모델에 따라 다릅니다:

GPU (RTX 3080): 4분 노래에 ~45초
CPU (최신 i7): 4분 노래에 ~8-15분

Demucs는 어떤 오디오 형식을 지원하나요?

입력: MP3, WAV, FLAC, OGG, M4A 및 FFmpeg가 디코딩할 수 있는 모든 것. 출력: WAV (기본값), MP3 (--mp3 플래그 포함).

내 스템에 아티팩트가 있는 이유는?

일반적인 원인:

낮은 품질 소스 파일 (320kbps+ 또는 무손실 사용)
크게 압축/제한된 마스터
더 가벼운 모델 사용 (htdemucs_ft 시도)
겹치는 주파수가 있는 복잡하고 밀도 높은 편곡

Demucs는 4개 이상의 스템을 분리할 수 있나요?

예. 6-스템 분리에는 htdemucs_6s 사용:

보컬
드럼
베이스
기타
피아노
기타

Demucs를 어떻게 업데이트하나요?

pip install -U demucs

결론

Demucs는 AI 기반 음악 소스 분리의 최첨단을 나타냅니다. 샘플을 분리하는 프로듀서, 오디오 ML의 경계를 밀어붙이는 연구자, 또는 노래방 트랙을 만들고 싶은 사람이든, 이 기술이 어떻게 작동하는지 이해하면 결과를 더 잘 제어할 수 있습니다.

대부분의 사용자에게 가장 쉬운 경로는 인프라를 처리하는 서비스를 사용하는 것입니다. 파워 사용자 및 ML 실무자에게는 Demucs를 로컬에서 실행하면 최대 제어 및 커스터마이징을 제공합니다.

스템 분리를 시도할 준비가 되셨나요?

기술이 어떻게 작동하는지 보셨습니다. 이제 경험해보세요.

옵션 1: 직접 실행 — 이 가이드를 따라 Demucs를 로컬에 설정하세요.

옵션 2: 설정 건너뛰기 — StemSplit은 클라우드에서 Demucs htdemucs_ft를 실행합니다. 노래를 업로드하고 30초 무료 미리보기하고 스튜디오 품질 스템을 다운로드하세요. Python 필요 없음.

StemSplit 무료로 시도하기 →

Demucs란?

진화: v1 → v4

Demucs v1 (2019)

Demucs v2 (2020)

Demucs v3 / Hybrid Demucs (2021)

Demucs v4 / HTDemucs (2022-2023)

사용 가능한 모델 비교

시스템 요구 사항

최소 요구 사항

처리 시간 추정

설치 가이드

옵션 1: pip (가장 간단)

옵션 2: Conda (GPU에 권장)

플랫폼별 참고 사항

macOS (Intel)

macOS (Apple Silicon M1/M2/M3)

Windows

Linux (Ubuntu/Debian)

기본 사용법

트랙 분리

일반적인 사용 사례

고급 명령줄 옵션

모델 선택

장치 제어

품질 대 메모리 트레이드오프

출력 형식

완전한 예제

Python API 통합

기본 프로그래밍 사용

Separator 클래스 사용

문제 해결 일반적인 문제

CUDA 메모리 부족

FFmpeg를 찾을 수 없음

낮은 분리 품질

DIY가 의미 있는 경우

비용 비교

FAQ

Demucs는 무료인가요?

Demucs를 상업적으로 사용할 수 있나요?

Demucs와 Spleeter의 차이점은?

GPU가 필요한가요?

처리는 얼마나 걸리나요?

Demucs는 어떤 오디오 형식을 지원하나요?

내 스템에 아티팩트가 있는 이유는?

Demucs는 4개 이상의 스템을 분리할 수 있나요?

Demucs를 어떻게 업데이트하나요?

결론

스템 분리를 시도할 준비가 되셨나요?

추가 읽기

Try StemSplit free — 5 minutes on signup

관련 글

Spleeter 대 Demucs: 어느 AI 스템 분리기가 더 나은가? (2026)

Demucs 온라인 튜토리얼: 아무것도 설치하지 않고 스템 분리하는 방법 (2026)

HT-Demucs FT의 ONNX 익스포트 첫 성공 (2026)