AI Stem Splitter: Herhangi Bir Şarkıyı Ayırmak için Tam Kılavuz (2026)

Bitmiş bir şarkı eskiden kilitli bir kutuydu. Miksleme ve mastering tamamlandıktan sonra bireysel enstrümanlar birbirine işlenmiş haldeydi — orijinal çok kanallı kayıt oturumuna erişimin olmadıkça ayrıştırılamazlardı. YZ stem bölme bunu değiştirdi. Bugün kütüphanendeki herhangi bir şarkı bir dakikadan kısa sürede vokal, davul, bas ve melodi olarak ayrıştırılabiliyor; dahası gerçek prodüksiyon çalışmalarında kullanılabilecek kalitede.

Bu kılavuz, YZ ile stem ayırmanın gerçekte nasıl çalıştığını, mevcut modellerin neler yapıp yapamadığını ve en yaygın kullanım senaryolarında en iyi sonuçları nasıl elde edeceğini ele alıyor.

AI Stem Splitter Ne Yapar

Bir stem bölücü, karışık bir ses dosyasını — yani bir şarkının son stereo kaydını — alır ve onu bireysel bileşenlerine ayırır. Standart dört stem ayrıştırması şunları üretir:

Vokal: Ana ses, armoniler, arka vokaller, konuşmalar
Davul: Kick, snare, hi-hat'ler, tom'lar, ziller ve çoğu perküsyon
Bas: Bas gitar, synth bas, sub-bas, 808'ler
Diğer: Geriye kalan her şey — gitarlar, klavyeler, synthesizer'lar, yaylılar, nefesliler, sample'lar

Bazı hizmetler ve araçlar ek ayrımlar sunar (gitarı "diğer" steminden ayırma veya piyanoyu izole etme gibi), ancak dört stem modeli pratik kullanım senaryolarının büyük çoğunluğunu karşılar ve en güvenilir sonuçları üretir.

YZ Gerçekte Nasıl Çalışır

Temel teknolojiyi anlamak, modern sonuçların neden eski araçlardan çok daha iyi olduğunu açıklamaya yardımcı olur — ve bazı parçaların neden hâlâ diğerlerinden daha temiz ayrıştığını.

Eğitim Aşaması

YZ stem ayrıştırma modelleri, "doğru cevabın" (orijinal izole stemlerin) bilindiği, profesyonelce ayrılmış çok kanallı kayıtların büyük veri setleri üzerinde eğitilir. Model, her enstrüman sınıfının karakteristik kalıplarını tanımayı öğrenir: insan sesinin harmonik zarfı, bir snare davulunun transient imzası, bir 808'in sub-bas içeriği. Bu eğitim, milyonlarca örnek üzerinde bir kez, çevrimdışı olarak gerçekleşir.

Ayrıştırma Aşaması

Bir şarkı yüklediğinde, model sesi zaman ve frekans boyutlarında eş zamanlı olarak analiz eder. Her zaman-frekans noktasındaki enerjinin hangi stem kategorisine ait olduğuna dair olasılıksal bir anlayış oluşturur. Sonuç, ayrılmış çıktıyı üretmek için uygulanan "maskeler" — temelde sesi bölme talimatları — kümesidir.

Bu, faz iptali gibi eski yaklaşımlardan (yalnızca merkeze panlı içeriklerde çalışır) veya EQ filtrelemesinden (enstrümanları ayırmak yerine enstrüman frekanslarını keser) kategorik olarak farklıdır. YZ ayrıştırma, mekanik dönüşümler değil, öğrenilen kalıplara dayalı bilinçli tahminler yapar.

Neden Dört Stem?

Vokal, davul, bas ve diğer enstrümanlar çoğu kayıtta makul ölçüde ayrı frekans ve tımbre bölgelerini kaplar. YZ'nin her biri için net ayırt edici özellikler öğrenmesi için yeterli kontrast vardır. Daha fazla bölmek — örneğin gitarı klavyelerden ayırmak — mümkündür ancak daha düşük kalite üretir; çünkü bu enstrümanlar daha fazla spektral örtüşme paylaşır, bu da ayrımların öğrenilmesini ve uygulanmasını daha zor hale getirir.

YZ Stem Modellerini Karşılaştırma

Stem ayrıştırma kalitesi beş yılda çarpıcı biçimde gelişti. Bir vokal kaldırıcı denediysen ve hayal kırıklığına uğradıysan, büyük olasılıkla eski nesil bir model kullanmışsındır.

Model	Yıl	Öne Çıkan Özellikler
Spleeter (Deezer)	2019	İlk pratik YZ ayırıcı; hızlı ama yalnızca frekans alanında
Demucs v3 (Meta)	2021	İlk zaman alanı modeli; önemli kalite sıçraması
HTDemucs (Meta)	2022	Hibrit mimari; tam stem ayrıştırma için mevcut standart
HTDemucs FT	2022	İnce ayarlı sürüm; dört stem için en iyi sonuçlar
MDX-Net	2021–2023	Yarışmaya optimize edilmiş; özellikle vokal izolasyonunda güçlü
BS-RoFormer	2024	Vokal izolasyonunda güncel sanat durumu

SDR (Sinyal-Bozunum Oranı), MUSDB18 test seti üzerinde desibel cinsinden ölçülen stem ayrıştırma kalitesi için standart kıyaslama ölçütüdür. Daha yüksek, daha temiz demektir:

Model	Vokal SDR	Davul SDR	Bas SDR
Spleeter 4-stem	~6,5 dB	~6,1 dB	~5,6 dB
Demucs v3	~7,3 dB	~7,5 dB	~7,6 dB
HTDemucs FT	~8,7 dB	~9,4 dB	~8,8 dB
BS-RoFormer	~10,9 dB (vokal)	—	—

Her ek SDR desibeli, algısal kalite açısından anlamlı bir iyileşmeyi temsil eder. Spleeter ile HTDemucs FT arasındaki fark büyük — bunlar kademeli iyileştirmeler değil.

StemSplit'in stem bölücüsü HTDemucs FT üzerinde çalışır; bu, genel amaçlı ayrıştırma için vokal, davul, bas ve diğer kalitesinin en iyi dengesini sağlar.

Adım Adım: StemSplit ile Stem Nasıl Bölünür

Yüklemeden Önce

Mevcut en yüksek kaliteli kaynağı kullan. Stem ayrıştırma modelleri, kayıplı sıkıştırmanın attığı ince frekans ayrıntılarını analiz eder:

WAV veya FLAC (kayıpsız): Mümkün olan en iyi giriş
320 kbps'de MP3: Mükemmel — pratikte kayıpsızdan farkı minimal
192 kbps'de MP3: İyi — karmaşık pasajlarda yapay bozulma potansiyeli var
128 kbps veya altında MP3: Kabul edilebilir — elindekilerin hepsi buysa kullan, ancak kalite kaynak tarafından sınırlanacak

Ayrıca parçayı ayırmadan önce BPM'ini ve tonunu not et — remix veya mashup için stemleri kullanmayı planlıyorsan her ikisine de ihtiyacın olacak.

İşlem

StemSplit'in stem bölücüsüne git
Ses dosyasını sürükle bırak veya göz atmak için tıkla — MP3, WAV, FLAC, M4A, OGG, WEBM ve çoğu video formatı destekleniyor
Çıktını seç: Tüm Stemler (vokal, davul, bas, diğer ayrı dosyalar olarak) veya yalnızca vokal ya da enstrümantal gibi belirli bir stem
İşleme için yaklaşık 30–60 saniye bekle
İndirmeden önce kaliteyi doğrulamak için 30 saniyelik önizlemeyi dinle
İhtiyacın olan stemleri WAV veya MP3 olarak indir

Önizleme adımı önemlidir. Bazı parçalar diğerlerinden daha temiz ayrışır — önce dinle, yalnızca memnun olduklarını indir.

Stemlerini Düzenleme

Bir stem kütüphanesi oluşturuyorsan (DJ'ler ve prodüktörler için yaygın), tutarlı isimlendirme ileride zaman kazandırır:

Artist - Track Name/
├── Artist - Track Name [VOCALS].wav
├── Artist - Track Name [DRUMS].wav
├── Artist - Track Name [BASS].wav
├── Artist - Track Name [OTHER].wav
└── Artist - Track Name [FULL].wav

Dosya yöneticinde veya DAW'ında her klasörü BPM ve tonla etiketle.

Stemlerle Neler Yapabilirsin

DJ'ler ve Canlı Performans

Stemler, tam parçalarla mümkün olmayan performans tekniklerini açar. En pratik olanlar:

Acapella drop'lar: Bir parçadan vokali çıkar ve başka bir parçanın enstrümantalinin üzerinde çal. BPM'i eşleştir (modern DJ yazılımıyla kolay) ve tonu (Mixed In Key veya yazılımının ton tespitini kullan). Seyirci beklenmedik bir beat üzerinde tanıdık bir ses duyar.

Strip build'ler: Gerilim yaratmak için drop öncesinde davul ve bası kaldır, ardından yeniden geri getir — tam parçanın geri döndüğündeki etki, yokluğun ardından güçlenir.

Tür geçişleri: Parçalar arasında bas hatlarını değiştir, giden parçanın melodisi hâlâ çalarken gelen parçanın davullarını getir — geçiş tek bir kesim yerine frekans bantları boyunca kademeli olarak gerçekleşir.

En çok kullanılan parçalarını önceden ayırmak, CPU yükünü yönetmek için daha hafif modeller kullanan Rekordbox, Serato ve Traktor'daki yerleşik gerçek zamanlı YZ'den daha iyi kalite sağlar. DJ'e özgü iş akışları hakkında daha fazla ayrıntı için DJ stem kılavuzuna bak.

Müzik Prodüktörleri

Sampling: Bir davul break'ini, vokal hook'unu veya bas hattını temiz bir sample olarak izole et. İzole edilmiş stem, diğer enstrümanlardan sızıntıyla uğraşmadan tam miksten çok daha kolay kırpılır ve pitch edilir.

Remixleme: Tüm orijinal öğeleri al ve etraflarında yeni bir aranjman kur. Orijinal vokali tutabilir ve altındaki prodüksiyonu tamamen değiştirebilirsin.

Referans miksleme: Mühendisin bu öğelere nasıl davrandığını analiz etmek için ticari olarak mikslenmiş bir parçanın davul veya basını izole et — transient yanıt, kompresyon karakteri, tam miksde duymak zor olan düşük frekans kararları.

Müzisyenler için Pratik ve Öğrenme

Enstrümanını kaldır: Gitar, bas, piyano veya davul çalıyorsan, diğer stemleri izole et ve onlarla birlikte pratik yap. Eksik parça sen oluyorsun.

Deşifre: Tek bir enstrümanı izole etmek, deşifre etmeyi çok daha kolay hale getirir. Bir bas hattını deşifre etmek için bas stemini döngüye al ya da tam miksle rekabet etmeden karmaşık bir ritmi öğrenmek için davul stemini döngüye al.

Kulak eğitimi: Davul stemini dinle ve davulcunun ne yaptığını tespit et. Bas stemini dinle ve kick davuluyla nasıl ilişkili olduğunu duy. Enstrümanlar arasındaki ilişki, ayrı olduklarında çok daha duyulabilir.

İçerik Üreticileri

Cover'lar: Bir cover videosu için orijinal prodüksiyon kalitesi korunmuş olarak izole edilmiş enstrümantalı backing track olarak kullan — MIDI rekreasyonundan çok daha iyidir.

Müzik eğitim içeriği: Efektlerin ne yaptığını göstermek için ham stemleri bitmiş miksle karşılaştır. Belirli bir tekniğin izole edilmiş halde nasıl duyulduğunu göstermek için davul stemini çıkar.

Karaoke: Yüksek kaliteli bir karaoke parçası için vokali kaldır. Karaoke oluşturma kılavuzu tam iş akışını kapsar.

Kalite Beklentileri: Ne İyi Çalışır, Ne Çalışmaz

En İyi Sonuçlar

Modern ticari pop, R&B, hip-hop: İyi tanımlanmış frekans bölgelerini kaplayan belirgin enstrümanlarla net aranjmanlar. Bunlar temiz ayrışır.
Organik vokalli elektronik müzik: Sentezlenmiş enstrümanlar, YZ'nin insan sesinden net şekilde ayırt edebileceği öngörülebilir tımbre profillerine sahiptir.
Tek sesli akustik kayıtlar: Daha az karmaşıklık, daha az belirsiz frekans örtüşmesi anlamına gelir.

Daha Zorlu Durumlar

Vokalde ağır reverb olan parçalar: Reverb kuyrukları vokal enerjisini enstrümanların frekans aralığına yayar. Kuru vokal temiz ayrışır, ancak enstrümentale reverb sızıntısı yaygındır.
Orta frekanslarda çok sayıda enstrümanla yoğun aranjmanlar: Daha fazla frekans örtüşmesi, daha belirsiz tahminler ve daha fazla yapay bozulma potansiyeli anlamına gelir.
Classic rock ve eski kayıtlar: Değişken stereo görüntüleme, ağır gitar doygunluğu ve orijinal mikslerindeki sınırlı frekans ayrımı.

Yapay Bozulmayı Ne Zaman Beklemeli

YZ ayrıştırma mükemmel değildir. Yaygın yapay bozulma türleri:

Sessiz pasajlarda "titreme": Model, düşük enerjili bir sinyalin hangi steme ait olduğundan emin değildir. Yoğun mikslerın sessiz bölümlerinde en çok duyulur.
Enstrüman sızıntısı: Bir gitar harmoniği, frekansı zil içeriğiyle örtüştüğü için davul steminde hafifçe belirir.
Yanlış stemdeki reverb kuyrukları: Yukarıda belirtildiği gibi, reverb yayılması beklenmedik sızıntının en yaygın nedenidir.

Çoğu pratik uygulama için — pratik, karaoke, remixleme — bu yapay bozulmalar minimaldir. En iyi ayrışan parçalarda sonuçlar, orijinal stüdyo stemlerinden ayırt edilemez olabilir.

Araç Seçimi

StemSplit

Model: HTDemucs FT
Erişim: Tarayıcı tabanlı, kurulum gerektirmez
Fiyatlandırma: Parça başı ödeme, ücretsiz 30 saniyelik önizleme
En iyi kullanım: Kurulum gerektirmeden profesyonel kalitede stemler isteyen herkes — ara sıra kullanım, DJ stem kütüphaneleri, pratik yapan müzisyenler

Stem splitter'ı dene →

Ultimate Vocal Remover (UVR)

Model: Çoklu (HTDemucs FT, BS-RoFormer, MDX-Net ve diğerleri)
Erişim: Masaüstü uygulaması — Windows, macOS, Linux
Fiyatlandırma: Ücretsiz (açık kaynak)
En iyi kullanım: Maksimum kontrol isteyen ve parça başı maliyet istemeyenler için güçlü GPU'ya sahip teknik kullanıcılar. Büyük kütüphanelerin toplu işlenmesi.

LALAL.AI

Model: Tescilli "Orion" modeli
Erişim: Tarayıcı + masaüstü uygulaması
Fiyatlandırma: Abonelik ($15–90/ay) veya kredi paketleri
En iyi kullanım: 4'ten fazla steme ihtiyaç duyan (LALAL.AI 10'a kadar sunar) veya entegrasyonlar için API erişimi gerektiren yoğun kullanıcılar

Moises

Model: Tescilli
Erişim: Tarayıcı + mobil uygulama (iOS/Android)
Fiyatlandırma: Ücretsiz katman + $4–14/ay
En iyi kullanım: Stem ayrıştırmanın yanı sıra pratik araçlar isteyen müzisyenler — Moises, aynı uygulamada akor tespiti, ton tespiti ve tempo araçlarını içerir. Kalite HTDemucs FT'nin biraz altındadır.

iZotope RX

Model: Tescilli YZ (Music Rebalance modülü)
Erişim: Masaüstü DAW eklentisi/bağımsız
Fiyatlandırma: Standart paket için $399+
En iyi kullanım: Restorasyon çalışması için RX'e zaten sahip olan ve stem ayrıştırmayı ek bir yetenek olarak isteyen ses mühendisleri

Yasal Hususlar

Stem ayrıştırma teknik bir işlemdir — içeriğin telif hakkı durumunu değiştirmez. Telif hakkıyla korunan bir kaydın ayrılmış stemleri, orijinaliyle aynı haklara sahiptir.

Genellikle lisans olmadan kabul edilebilir:

Kişisel kullanım — pratik, öğrenme, özel karaoke
Akademik veya araştırma analizi
Kendi prodüksiyonların için referans materyali oluşturma (stemleri dağıtmadan)

Lisans gerektirir veya telif hakkı soruları doğurur:

Orijinal stemleri kullanan ticari bir remix yayınlamak
Telif hakkıyla korunan bir kayıttan izole edilmiş stemleri kamuya açık olarak dağıtmak
Ticari amaçlar için stemleri video ile senkronize kullanmak

Teknoloji yasaldır. Çıktıyla ne yaptığın, kayıtlı müziğin herhangi bir kullanımında olduğu gibi, yargı alanındaki telif hakkı mevzuatıyla yönetilir.

Sıkça Sorulan Sorular

YZ ile ayrılmış stemler orijinal stüdyo stemleri kadar temiz mi? Hayır — kayıt oturumundan gelen orijinal stüdyo stemleri hiç mikslenmediğinden her zaman daha temiz olacak. YZ ayrıştırma, zaten mikslenmiş bir sinyal hakkında tahminler yapıyor ve bazı frekans içerikleri stemler arasında paylaşılıyor. Çoğu pratik kullanım için YZ stemleri fazlasıyla yeterlidir; kritik profesyonel çalışmalar için, mevcut olduğunda orijinal stemler tercih edilir.

Hangi stemi temiz ayırmak en zordur? "Diğer" stemi (vokal, davul veya bas olmayan her şey) en heterojen kategoridir — gitarları, klavyeleri, synthesizer'ları, yaylıları ve aranjmandaki diğer şeyleri içerir. Çok farklı karakterlere sahip enstrümanları içerdiği ve tutarlı bir akustik profile değil, dışlama yoluyla tanımlandığı için vokal veya davuldan biraz daha fazla yapay bozulma potansiyeline sahip olma eğilimindedir.

Bir stemden stem ayırabilir miyim? (örn. "diğer" stemi gitar ve piyano olarak bölmek) YZ ayrıştırma en iyi orijinal mikslenmiş kayıtta çalışır. Zaten ayrılmış bir stemi yeniden ayırmaya çalışmak, sinyal ilk geçişte zaten bozulduğundan ve model artık yapay bozulma içeren bir girdiyle çalıştığından çok daha kötü sonuçlar üretir. "Diğer" stemi içindeki enstrümanlar için, orijinal miks üzerinde çalıştırılan özel bir model kullanmak daha iyidir.

Stem ayrıştırma DJ yazılımının gerçek zamanlı yaptığıyla nasıl karşılaştırılır? Rekordbox (Stems Modu) ve Serato gibi yazılımlar, canlı set sırasında CPU'nu aşırı yüklemeden gerçek zamanlı çalışacak şekilde özel olarak tasarlanmış daha hafif YZ modelleri kullanır. Kalite dengesi gerçektir — HTDemucs FT'den önceden ayrılmış stemler, özellikle vokal için, eşdeğer donanımda gerçek zamanlı ayrıştırmadan belirgin biçimde daha temizdir. Doğru seçim iş akışına bağlıdır: önemli parçaları önceden ayır, geri kalanı için gerçek zamanı kullan.

Eski faz iptali yaklaşımına ne oldu? Faz iptali (bir stereo kanalı ters çevirme ve toplama), YZ modelleri pratik hale gelmeden önceki standart teknikti. Yalnızca her iki stereo kanalda da kesinlikle özdeş olan içeriği iptal eder — ki bu, reverb, genişletme ve stereo efektlerin bulunduğu modern kayıtlarda neredeyse hiçbir zaman tam vokali kapsamaz. YZ modelleri bunu geçersiz kıldı çünkü ses kaynaklarını tanımlama ve ayırma gerçek görevinde daha iyiler.

Herhangi Bir Şarkıyı Stemlere Böl

StemSplit'in stem bölücüsü HTDemucs FT'yi tarayıcında çalıştırır — profesyonel çevrimdışı stem ayrıştırma için kullanılan aynı model.

Her parça için ücretsiz 30 saniyelik önizleme
Vokal, davul, bas ve diğerlerini ayrı WAV dosyaları olarak indir
Kurulum yok, abonelik gerekmiyor

Stem Splitter'ı Ücretsiz Dene →