自動BPM・キー検出機能：仕組みと使い方（2025年）

多くのDJやプロデューサーは、音楽ライブラリにBPMやキーを手動でタグ付けするのに何時間も費やしています。すべてのトラックが自動的に正確で一貫性のあるメタデータを備えていたらどうでしょうか？

要約: StemSplitは、業界標準のPythonライブラリ「librosa」を使用して、処理されたすべての楽曲のBPM（テンポ）と音楽キーを自動検出します。このデータはジョブ詳細ページに表示され、APIおよびRapidAPIエンドポイント経由で利用可能です。BPM検出は精度のために60秒を分析し、キー検出はクロマ特徴とキープロファイル相関を使用して120秒を分析します。

BPM・キー検出とは？

**BPM（Beats Per Minute）**は、トラックのテンポ（ビートの速さ）を示します。曲間でテンポを合わせる必要があるDJや、トラックの正確な速度を知りたいプロデューサーにとって不可欠です。

音楽キーは、楽曲の調性中心を識別します（例：「Cメジャー」や「Aマイナー」）。ハーモニックミキシングで、DJが互換性のあるキー間でトランジションを行い、よりスムーズなブレンドを実現するために重要です。

BPMとキーのメタデータを組み合わせることで、音楽の整理と作業方法が変わります。推測や手動入力は不要です。

StemSplitのBPM・キー検出の仕組み

この機能は、Spotify、YouTube Music、主要な音楽制作ソフトウェアで使用されているlibrosaを使用して構築しました。選択理由と仕組みを説明します。

なぜlibrosaなのか？

業界標準: librosaは、Pythonでの音楽情報検索の事実上の標準です。以下のサービスで使用されています：

Spotify（オーディオ分析）
YouTube Music（コンテンツ識別）
研究機関（音楽情報検索）
プロフェッショナルオーディオソフトウェア（テンポ/キー検出）

実証された精度: librosaのアルゴリズムは、数十年にわたる音楽情報検索の研究に基づいています。数百万曲でテストされ、学術研究を通じて改良されています。

オープンソースでメンテナンス継続: プロプライエタリソリューションとは異なり、librosaはオープンソースで、積極的にメンテナンスされ、その方法について透明性があります。検出の仕組みを正確に確認できます。

BPM検出プロセス

BPM検出は、60秒のオーディオを分析します。精度と速度のバランスが取れた最適な時間です。

仕組み:

オンスet検出 — 音楽イベント（ビート、音符、過渡）の開始を識別
テンポ推定 — オンスet間の間隔を分析して基本テンポを特定
ビートトラッキング — 実際のビートパターンを追跡してテンポ推定を精緻化

結果：小数点以下1桁に丸められた正確なBPM値（例：128.3 BPM）。

なぜ60秒なのか？ 研究によると、60秒は信頼性の高いテンポ検出に十分な音楽コンテンツを捉えます。より短いサンプル（20秒未満）は、特にテンポ変化がある場合に不正確になる可能性があります。より長いサンプル（60秒超）は、追加時間が精度を大幅に向上させないため、収益逓減があります。

キー検出プロセス

キー検出は、最大精度のために120秒のオーディオを分析します。

仕組み:

クロマ特徴抽出 — ピッチクラスプロファイル（どの音符が存在するか）を分析
時間平均 — 安定性のために時間全体でクロマ特徴を平均化
キープロファイル相関 — クロマプロファイルをメジャー/マイナーキーテンプレート（Krumhansl-Schmucklerプロファイル）と比較
モード検出 — 相関の強さに基づいてキーがメジャーかマイナーかを判定

結果：「C」「Am」「F#」「Dm」などのキー署名。

なぜ120秒なのか？ キー検出はBPMよりも多くのオーディオが必要です。ハーモニックコンテンツは楽曲全体で変化する可能性があるためです。120秒により、単一のセクションだけでなく、全体的なハーモニック特性を捉えることができます。これは、キー変更や複雑なハーモニック進行がある楽曲で特に重要です。

BPM・キーの表示場所

ジョブ詳細ページ

完了したすべてのジョブで、BPMとキーがページ上部に目立つように表示されます。タイトルと再生時間の直後に表示され、見逃せないスタイルのバッジで表示されます。

表示対象:

アップロードされたステム分離ジョブ
YouTubeジョブ
SoundCloudジョブ

APIレスポンス

BPMとキーは、すべてのジョブタイプのaudioMetadataフィールドに含まれています。

APIエンドポイント:

GET /api/v1/jobs/{id} — audioMetadata.bpmとaudioMetadata.keyを返す
GET /api/v1/youtube-jobs/{id} — audioMetadata.bpmとaudioMetadata.keyを返す
GET /api/v1/soundcloud-jobs/{id} — audioMetadata.bpmとaudioMetadata.keyを返す

RapidAPIエンドポイント:

GET /rapidapi/v1/jobs/{id} — audioMetadata.bpmとaudioMetadata.keyを返す
GET /rapidapi/v1/youtube-jobs/{id} — audioMetadata.bpmとaudioMetadata.keyを返す
GET /rapidapi/v1/soundcloud-jobs/{id} — audioMetadata.bpmとaudioMetadata.keyを返す

完全なAPIドキュメントについては、開発者リファレンスを参照してください。

BPM・キーデータが必要なアプリを構築していますか？ 当社のAPIにより、このメタデータにプログラムで簡単にアクセスできます。開発者ドキュメントをご覧ください。

精度と制限事項

BPM検出の精度

良好に機能するもの:

明確で一貫したテンポ
よく制作された商業リリース
リズミカルな要素が目立つ楽曲

課題:

テンポ変化がある楽曲（ルバート、アッチェレランド）
非常に遅いまたは非常に速いテンポ（60-200 BPMの範囲外）
アンビエントまたはリズム的に曖昧な音楽

典型的な精度: ほとんどの商業音楽で±1 BPM以内。

キー検出の精度

良好に機能するもの:

明確な調性中心がある楽曲
標準的なメジャー/マイナーキー
よく制作された商業リリース

課題:

モーダル音楽（ドリアン、ミクソリディアンなど）— 相対的なメジャー/マイナーを検出する可能性
頻繁にキーが変わる楽曲
無調または高度に半音階的な音楽
非常に短い楽曲（30秒未満）

典型的な精度: 標準的なポップ/ロック/エレクトロニック音楽で85-95%の正確なキー識別。

FAQ

BPM検出の精度はどの程度ですか？

一貫したテンポを持つほとんどの商業音楽で、BPM検出は±1 BPM以内で正確です。テンポ変化や曖昧なリズムがある楽曲は、精度が低くなる可能性があります。

キー検出の精度はどの程度ですか？

キー検出は、標準的なポップ、ロック、エレクトロニック音楽で85-95%の精度を達成します。モーダル音楽や頻繁にキーが変わる楽曲は、精度が低くなる可能性があります。

BPM・キー検出を無効にできますか？

はい — アップロードされたファイルのみ。アップロードインターフェースの「オーディオ分析を有効にする」トグルを使用してください。YouTubeとSoundCloudジョブは常にBPM・キー検出を含みます。

楽曲がキーやテンポを変更する場合はどうなりますか？

検出は主要なキーとテンポを識別します。楽曲の大部分を支配するものです。変更がある楽曲では、最も顕著な値を報告します。

このデータはAPI経由で利用可能ですか？

はい。BPMとキーは、すべてのジョブタイプのaudioMetadataフィールドに含まれています。完全なAPIドキュメントについては、開発者リファレンスを参照してください。

StemSplitは検出にどのライブラリを使用していますか？

librosaを使用しています — 音楽情報検索の業界標準Pythonライブラリです。Spotify、YouTube Music、主要なオーディオソフトウェアで使用されているのと同じライブラリです。

まとめ

自動BPM・キー検出により、音楽の作業方法が変わります。手動タグ付けや推測は不要です。StemSplitで処理されたすべての楽曲には、正確なテンポとキーメタデータが含まれています。DJセット、制作、またはアプリケーションで使用する準備が整っています。

トラックをミキシング、リミックスを計画、または音楽アプリを構築する場合でも、BPM・キーデータが自動的に利用可能になることで、時間を節約し、新しい創造的な可能性を開きます。

BPM・キー検出の使用を開始

StemSplitで処理するすべての楽曲に、自動BPM・キー検出が含まれます。

✅ librosaで動作 — 業界標準の精度
✅ APIおよびRapidAPI経由で利用可能
✅ ジョブページに目立つように表示
✅ アップロード、YouTube、SoundCloudに対応

BPM・キー検出付きステム分離を試す →