Spleeter とは

楽曲音源をパートごとに分離し、ボーカル抽出・ボーカルカット(オフボーカル音源作成)などができるツール「Spleeter」(発音は「スプリーター」であって「スプリッター」ではないと思われます)。

AI(機械学習)による分離を行うため、従来型のボーカルカットソフトよりも圧倒的にきれいに分離できます。

本家 Spleeter は使い方が難しいのですが、現在は簡単に使える Windows GUI アプリがあります。

(補足)
以前はインストール不要の Web サービス型 Spleeter(ブラウザで使える Spleeter)があったのですが、現在は見当たらないようです。Web サービス型は現れては消え、安定していないイメージがあります。

インストール

Spleeter アプリはいくつかありますが、使いやすいのは Makenweb のアプリ(SpleeterGUI)だと思います。

DownloadMakenweb のサイトからアプリをダウンロードします。ページ中程にある「Download installer MSI file」をクリックします。

Installダウンロードした MSI ファイル(SpleeterGUI_V2.9.2.msi)をダブルクリックするとインストーラーが起動します。しばらく待っていると「Next」ボタンが押せるようになるので、先に進めていくことでインストールが完了します。管理者権限が必要です。

使い方

Langスタートメニューから SpleeterGUI を起動します。

Language メニューから日本語を選ぶことで日本語画面になります。

(補足)
日本語表記がちょっと微妙なので、修正版を開発者の方にお送りしました。
ソースコードにはマージされたのですが、残念ながら、まだリリースアプリには反映されていないようで、微妙なままです。

App「分離するパーツ」で音源を何種類に分離するかを選べます。「二」でボーカル+オフボーカルです。「五」にするとドラムなどさらに細かく分離できます。

曲の長さが 10 分を越える場合は、「曲の最大長」を増やします。

「に保存」ボタンをクリックして、分離後のファイルを出力するフォルダーを選びます。

Workingここまでの準備を終えたら、楽曲ファイルをドラッグ&ドロップすると分離が行われます。

楽曲ファイルのフォーマットは
  • WAVE
  • FLAC
  • MP3
  • OGG
  • M4A
  • WMA
に対応しているようです。

完了音が鳴ると、分離された音源ファイルが、出力先フォルダーに保存されています。

「vocals.wav」がボーカル抽出音源、「accompaniment.wav」がボーカルカット(オフボーカル)音源です。

私の環境では、5 分 26 秒の楽曲を分離するのに約 15 秒~16 秒ほどかかりました。

なお、出力される WAVE ファイルのサンプリングレートは 44.1 kHz になります(元が 48 kHz でも強制リサンプリングされます)。

感想

個人の主観ですが、従来型のボーカルカットソフトとは比べものにならないほど高精度でボーカルカットできます。異次元と言っても良いと思っています。

従来は、ボーカルのパンが中央であることが多いことを利用して、パンが中央のものを中心にカットしていました。このため、ボーカルが左右にあるとうまくカットできませんし、そもそも中央でも今ひとつだったりしました。

Spleeter は AI で人間の声そのものを認識してカットしているので、ボーカルが中央かどうかに関わらず安定してカットできます。

メインボーカルはほとんどカットできますし、コーラスもカットされることが多いです。

Spleeter のクセとしては、歌唱が始まった直後の部分は、ボーカルがカットされずに少し残る場合があります。「うさぎおいし」の「う」が割と強めに残り、「さ」がうっすらと残り、「ぎ」以降がきれいにカットされる、というような感じです。とはいえ、いつもこうなるわけではなく、ほとんどはちゃんとカットされます。

関連記事


更新履歴

  • 2022/09/10 初版。
  • 2022/09/10 関連記事記載。
  • 2023/05/22 関連記事追記。