デルタさん主催の UTAU 調声系技術交流会という Skype 上のイベントに参加。

その名の通り、UTAU の調声をどうやっているかのノウハウをみんなで交換する内容だが、それだけにはとどまらない。最近話題の CV-VC のイロハから、普段使っているプラグイン、お薦め音源まで幅広い内容で話ができ、とても楽しかった。

その中で推薦された天月りよんという音源は、可愛いながらも落ち着きのある声質で、気に入った。今度使ってみたい。

交流会は ROM 専でも参加可能な気軽な会なので、興味のある人は、次回開催される際に覗いてみてはどうだろう。

さて、俺はその中で、「手軽な HANASU 調声」ということで、普段の自分の調声方法を紹介させてもらった。そのときの内容を簡単にまとめておくので、よければどうぞ。

手軽な HANASU 調声が欲しい理由

各種プラグインや bot などを公開する際、その紹介をニコニコ動画に投稿している。例えば、右の鼻歌採譜プラグイン紹介動画などだ。

動画中で UTAU 音源に HANA してもらうのだが、いろいろ紹介しようと思うと、セリフの数はかなり多くなる。

何十個ものセリフを 1 から調声していたのでは、とても時間がかかってしまう。しかも、やりたいことは調声ではなく紹介なので、HANASU をいじくるのにあまり時間はかけたくない。

スキルのある人ならば、ピッチ曲線を 1 から書いても早いのかもしれないが、そういうスキルがなくても、なるべくちゃちゃっと HANA させる方法ということで実戦しているのが、以下の方法だ。

STEP 1:セリフの入力

歌詞入力まずは、UTAU にセリフ(歌詞)を入力するところからスタート。例として、上記の鼻歌採譜プラグイン動画の 0:40 あたりで使っている、ぱみゅの「実際にはこんな感じです」を用いる。

HANASU の場合、テンポは結構早い。上記動画の中では、ぱみゅはのんびりしゃべっているほうだが、それでも、テンポ 220 の 8 分音符を使っている。交流会の中では、テンポを 600 くらいにして、その代わりに音長を長めにしているという情報もあった。

右の写真(クリックで拡大する)にあるように、「実際にはこんな感じです」のセリフ歌詞は「RRじRさいにわこんなかんじですRR」となる。小さい「っ」は休符 1 つ、助詞の「は」は発音通り「わ」。前後の休符は、入れておく方が何かと都合が良いので入れている。余談だが、うちの環境だと、なぜか日本語歌詞が文字化けしてしまう……。

使用する音源が連続音の場合は、歌詞も連続音にする。

STEP 2:セリフの録音

DS800次に、同じセリフを自分で話して録音する。リニア PCM(WAVE ファイル)で録音できるオリンパス DS-800 のようなボイスレコーダーを使って録音したあと、パソコンに転送するか、または、パソコンのマイク入力を SoundEngine などで録音すると良いだろう。

録音時のポイントはズバリ、UTAU でのテンポと合わせてセリフをしゃべること。

先頭の休符も含めて、すべてのセリフを数回再生して、イヤホンで聴くと、テンポが体感できる。その後で、UTAU の再生に合わせて自分がセリフをしゃべり、それを録音すると、タイミングが合いやすい。先頭の休符を含めて再生することで、入りのタイミングがさらに合いやすくなるだろう。

うまく録音できたら、パソコンにデータを転送し、SoundEngine などの波形編集ソフトで、先頭の無音部分を切り捨てておく。

STEP 3:うたりすの利用

うたりす再び UTAU に戻り、先頭の休符を除く音符を選択し、プラグインのうたりすを起動する。

さきほど準備した WAVE ファイルをドラッグ&ドロップで指定する。

移調は、自分と音源の性別が同じ場合は 0、自分が男性で音源が女性の場合は 12、自分が女性で音源が男性の場合は -12 が 1 つの目安となる。あとで結果を聴きながらベストな移調量を探ると良いだろう。

うたりす通過後スタートボタンをクリックすると、WAVE ファイルの内容が解析され、UTAU の音符にピッチ情報が反映される。

うちの環境だと、一度音符の選択を解除してから、再度音符を選択して、再生すれば、ぱみゅが HANA してくれる。

この状態でもそこそこの HANASU になるが、ピッチが破綻している箇所などを、次で修正する。

STEP 4:微修正

完成目で見て解るように、上の写真だと、ピッチ曲線がはるか上に飛び出ているところがあるので、そういう箇所をひらべったくなるように修正する。また、音量が不自然に小さいところも修正する。

たまに、イメージしているしゃべりと全く異なるしゃべりになることがあるが、その場合は、うたりすの「オフセット」を 50 ミリ秒単位くらいで調整するといいだろう(プラスだけではなくマイナスも指定できる)。

微修正を経た完成図が右だ。

1 から手動で HANASU の調声をしようと思ってもどうピッチを調声したら良いのか分からないが、この方法であれば、手作業は少しなので、だいぶ簡単になる。

セリフが多い場合は、最初に全部録音を済ませておき、パソコン上の作業はその後にすると、作業がまとまってやりやすい。

なお、うたりすの詳しい使い方については、うたりすのヘルプを参照されたい。うたりすからも表示できる。