Spleeter とは
楽曲音源をパートごとに分離し、ボーカル抽出・ボーカルカット(オフボーカル音源作成)などができるツール「Spleeter」(発音は「スプリーター」であって「スプリッター」ではないと思われます)。
AI(機械学習)による分離を行うため、従来型のボーカルカットソフトよりも圧倒的にきれいに分離できます。
本家 Spleeter は使い方が難しいのですが、現在は簡単に使える Windows GUI アプリがあります。
(補足)以前はインストール不要の Web サービス型 Spleeter(ブラウザで使える Spleeter)があったのですが、現在は見当たらないようです。Web サービス型は現れては消え、安定していないイメージがあります。
インストール
Spleeter アプリはいくつかありますが、使いやすいのは Makenweb のアプリ(SpleeterGUI)だと思います。
Makenweb のサイトからアプリをダウンロードします。ページ中程にある「Download installer MSI file」をクリックします。
ダウンロードした MSI ファイル(SpleeterGUI_V2.9.2.msi)をダブルクリックするとインストーラーが起動します。しばらく待っていると「Next」ボタンが押せるようになるので、先に進めていくことでインストールが完了します。管理者権限が必要です。
使い方
Language メニューから日本語を選ぶことで日本語画面になります。
(補足)日本語表記がちょっと微妙なので、修正版を開発者の方にお送りしました。ソースコードにはマージされたのですが、残念ながら、まだリリースアプリには反映されていないようで、微妙なままです。
曲の長さが 10 分を越える場合は、「曲の最大長」を増やします。
「に保存」ボタンをクリックして、分離後のファイルを出力するフォルダーを選びます。
楽曲ファイルのフォーマットは
- WAVE
- FLAC
- MP3
- OGG
- M4A
- WMA
に対応しているようです。
完了音が鳴ると、分離された音源ファイルが、出力先フォルダーに保存されています。
「vocals.wav」がボーカル抽出音源、「accompaniment.wav」がボーカルカット(オフボーカル)音源です。
私の環境では、5 分 26 秒の楽曲を分離するのに約 15 秒~16 秒ほどかかりました。
なお、出力される WAVE ファイルのサンプリングレートは 44.1 kHz になります(元が 48 kHz でも強制リサンプリングされます)。
感想
個人の主観ですが、従来型のボーカルカットソフトとは比べものにならないほど高精度でボーカルカットできます。異次元と言っても良いと思っています。
従来は、ボーカルのパンが中央であることが多いことを利用して、パンが中央のものを中心にカットしていました。このため、ボーカルが左右にあるとうまくカットできませんし、そもそも中央でも今ひとつだったりしました。
Spleeter は AI で人間の声そのものを認識してカットしているので、ボーカルが中央かどうかに関わらず安定してカットできます。
メインボーカルはほとんどカットできますし、コーラスもカットされることが多いです。
Spleeter のクセとしては、歌唱が始まった直後の部分は、ボーカルがカットされずに少し残る場合があります。「うさぎおいし」の「う」が割と強めに残り、「さ」がうっすらと残り、「ぎ」以降がきれいにカットされる、というような感じです。とはいえ、いつもこうなるわけではなく、ほとんどはちゃんとカットされます。
関連記事
更新履歴
- 2022/09/10 初版。
- 2022/09/10 関連記事記載。
- 2023/05/22 関連記事追記。