UTAU 関連の情報共有を目的に、UTAU 勉強会が神田で開催されたので、参加してきた。
Twitter にも投げたが、改めて概要をここにまとめてみる。
勉強会はリレー講義形式で行われた。6 人の講師役が、それぞれのテーマについて説明を行う。各講師の持ち時間は 30 分という比較的短い時間だったが、資料等を用いながら時間いっぱい語っていた。
以下、各講師の内容と、それに対する感想などを。
ピッチの特徴的な遷移を、ピッチ曲線の形から「V ピッチ」「A ピッチ」などと名付けて分類。それぞれの型の発声上の特徴や、マッチする曲調などを解説。
例えば V ピッチは、音符の先頭(子音部)のピッチが一瞬落ち込み、ピッチ曲線が V 字を描く。声の安定感・迫真度が増すので、カッコイイ歌い方・スピード感のある歌い方に向いている、という具合だ。
ピッチ以外にも、リズム感やニュアンスなどの説明もあった。
調声パターンを分かりやすく分類してもらえるというのは参考になる。例えば、うたりすで肉声のピッチを抽出すると、確かに V ピッチなどの曲線が出てくるが、単に出てきた曲線を眺めるだけなのと、特徴をざっと把握しているのでは、その後の調声のやりやすさに大きな違いが出ると思う。
UTAU 音源を製作するには、声を録音するだけではなく、発音のタイミングを指定する oto.ini を作成する必要がある。oto.ini を作るのは大変なのだが、setParam というツールを使うと、少しやりやすくなる。
setParam の画面の見方や、操作方法などについて、説明していた。
俺自身は原音設定をしたことがないが、それでも、巽さんの口から溢れてくる経験豊富感は感じ取れた。
setParam では、原音がスペクトラム表示されるが、そのスペクトラムは、ア行、カ行といった行毎に特徴がある。それぞれの行で、スペクトラム上のどの位置に各種設定値をセットすればよいか、という実践的な内容。
たいていの場合、スペクトラムの見た目から設定を行えば、ほどほど良い設定が行える。その上で、実際に音を聞きながら細かい調整をする、という 2 段階方式にすることで、大幅に設定時間を短縮できるようだ。
理論で目安、感覚で微調整というのは、効率も良く、かつ、品質もしっかりしたものができそうな印象で、音源ユーザー側としても、嬉しい内容だった。
CVVC 音源は、連続音音源と比べると、録音に要する時間が少ない。時間が少なくて済むから、声質のブレも少ないし、多音階などにもチャレンジしやすいという。
ただ、メリットばかりとはいかない。録音時間が少ないのは、重複している発音を極限まで削っているからなのだが、逆に言えば、1 つのミスが多くの箇所に波及するということでもある。また、きちんと原音設定を理解していないと設定が難しいとのこと。
音源利用者側にとっては、音源製作者のメリットが間接的に享受できるものの、どちらかといえば、ノートが細切れになったりピッチをいじりにくくなったりというデメリットのほうが多い印象だ。
企画を実現していくに当たって大切なのは、目的、スケジュール、ルール(成果物フォーマットなど)の 3 点。これをしっかりと定めてから、思い切ってコンピしたい人にアタックすると良いとのこと。また、金銭関連はトラブルのもとなので、収入をどう扱い、費用負担は誰がするのかをしっかりと明言しておくべきとのこと。
共同開催者との意思疎通は大切で、文字(メール・チャット)よりも音声(通話)、音声よりも対面で、きちんと話し合おう。実際には会うのはなかなか大変だが、せめて通話はしたいと俺も思う(コンピに限らず)。Skype 等タダで通話できる時代になったわけだし。
保健体育 P はとても発表慣れというか、講義慣れしている感じだった。本職なのかと思ったが、どうやら違うとのこと。
UTAU 音源は、単独音から始まり、表情音や連続音、CVVC など、さまざまなバリエーションが出てきた。しかし、連続音が登場したときの感動みたいなものが、最近は無いとのこと。そんな中で、大きな可能性があるものとして、DLL 音源を挙げていた。
DLL 音源というのは、音声再生を音源側が把握&コントロールできる音源。例えば、低い音は野太く、高い音はか細く、というように、音高によって音の細さを変えたりすることも実現できる。
音源のバージョンアップも管理できる。今までの音源は、新バージョンを公開しても、ユーザーがそれを使ってくれるとは限らない。DLL 音源であれば、新バージョンを強制的に使わせることが可能だ。
他にも、音源使用日数によって使える音素を徐々に解放して増やしていったりとか、音源ガチャ(ガチャで引いた音素だけ使える)みたいなゲーム的要素を入れたりすることもできるなど、可能性は無限大だ。
ただ、聞いている中で気をつけなくてはいけないなと思ったのは、ユーザー目線を忘れたら地雷になるということ。音源側がすべてを握っているからこそ、ユーザーに配慮する必要がある。
UTAU 界隈の不思議さも合わせて加味する必要があって、UTAU 界隈ではなぜか、必ずしもクオリティーの高い物が求められるわけではない。例えば、音源をバージョンアップして、良い機材で品質の高い音源を作り直しましたと言っても、昔の古い機材で作った音源の方が好きという人がいる。常に最新の音源を提供するタイプの DLL 音源は、意外と歓迎されないかもしれない。
次回は、音源の中の人の話も聞いてみたい。録音時に苦労するところ、使用している機材を選んだ理由、録音のコツなど。あるいは、キーホルダーみたいなグッズを作っている人もいるので、そういう人の話なども。
プラグイン作者としては、他のプラグイン作者の話も気になるところ。どんな環境で、どのくらい時間掛けてプラグインを作っているのか。大変なところは何か。ユーザーからのフィードバックの扱いをどうしているか、などなど。
Twitter にも投げたが、改めて概要をここにまとめてみる。
勉強会はリレー講義形式で行われた。6 人の講師役が、それぞれのテーマについて説明を行う。各講師の持ち時間は 30 分という比較的短い時間だったが、資料等を用いながら時間いっぱい語っていた。
以下、各講師の内容と、それに対する感想などを。
"調声する"ってなんなんだ!~様々な調声法の考察~
- 講師:きっとかっとさん
- 資料:Twitter より(2014/12/31 までとのこと)
ピッチの特徴的な遷移を、ピッチ曲線の形から「V ピッチ」「A ピッチ」などと名付けて分類。それぞれの型の発声上の特徴や、マッチする曲調などを解説。
例えば V ピッチは、音符の先頭(子音部)のピッチが一瞬落ち込み、ピッチ曲線が V 字を描く。声の安定感・迫真度が増すので、カッコイイ歌い方・スピード感のある歌い方に向いている、という具合だ。
ピッチ以外にも、リズム感やニュアンスなどの説明もあった。
調声パターンを分かりやすく分類してもらえるというのは参考になる。例えば、うたりすで肉声のピッチを抽出すると、確かに V ピッチなどの曲線が出てくるが、単に出てきた曲線を眺めるだけなのと、特徴をざっと把握しているのでは、その後の調声のやりやすさに大きな違いが出ると思う。
setParam を用いた原音設定の解説
- 講師:巽さん
- 資料:slideshare
UTAU 音源を製作するには、声を録音するだけではなく、発音のタイミングを指定する oto.ini を作成する必要がある。oto.ini を作るのは大変なのだが、setParam というツールを使うと、少しやりやすくなる。
setParam の画面の見方や、操作方法などについて、説明していた。
俺自身は原音設定をしたことがないが、それでも、巽さんの口から溢れてくる経験豊富感は感じ取れた。
速く正確に原音設定する方法
- 講師:Caparo Ulula さん
- 資料:席上配布のみ
setParam では、原音がスペクトラム表示されるが、そのスペクトラムは、ア行、カ行といった行毎に特徴がある。それぞれの行で、スペクトラム上のどの位置に各種設定値をセットすればよいか、という実践的な内容。
たいていの場合、スペクトラムの見た目から設定を行えば、ほどほど良い設定が行える。その上で、実際に音を聞きながら細かい調整をする、という 2 段階方式にすることで、大幅に設定時間を短縮できるようだ。
理論で目安、感覚で微調整というのは、効率も良く、かつ、品質もしっかりしたものができそうな印象で、音源ユーザー側としても、嬉しい内容だった。
CVVC のイロハのイ
おふとん P は、CVVC 音源についての基礎。CVVC 音源は、音源製作者側にメリットのある音源であり、そのメリットを整理して紹介していた。CVVC 音源は、連続音音源と比べると、録音に要する時間が少ない。時間が少なくて済むから、声質のブレも少ないし、多音階などにもチャレンジしやすいという。
ただ、メリットばかりとはいかない。録音時間が少ないのは、重複している発音を極限まで削っているからなのだが、逆に言えば、1 つのミスが多くの箇所に波及するということでもある。また、きちんと原音設定を理解していないと設定が難しいとのこと。
音源利用者側にとっては、音源製作者のメリットが間接的に享受できるものの、どちらかといえば、ノートが細切れになったりピッチをいじりにくくなったりというデメリットのほうが多い印象だ。
たのしいコンピや企画を行うためのたこやき式メソッド
保健体育 P(白亜さん)は、コンピ CD などの企画を立てる際の注意点を解説。企画を実現していくに当たって大切なのは、目的、スケジュール、ルール(成果物フォーマットなど)の 3 点。これをしっかりと定めてから、思い切ってコンピしたい人にアタックすると良いとのこと。また、金銭関連はトラブルのもとなので、収入をどう扱い、費用負担は誰がするのかをしっかりと明言しておくべきとのこと。
共同開催者との意思疎通は大切で、文字(メール・チャット)よりも音声(通話)、音声よりも対面で、きちんと話し合おう。実際には会うのはなかなか大変だが、せめて通話はしたいと俺も思う(コンピに限らず)。Skype 等タダで通話できる時代になったわけだし。
保健体育 P はとても発表慣れというか、講義慣れしている感じだった。本職なのかと思ったが、どうやら違うとのこと。
day after tomorrow
- 講師:まるさん
- 資料:Google Drive
UTAU 音源は、単独音から始まり、表情音や連続音、CVVC など、さまざまなバリエーションが出てきた。しかし、連続音が登場したときの感動みたいなものが、最近は無いとのこと。そんな中で、大きな可能性があるものとして、DLL 音源を挙げていた。
DLL 音源というのは、音声再生を音源側が把握&コントロールできる音源。例えば、低い音は野太く、高い音はか細く、というように、音高によって音の細さを変えたりすることも実現できる。
音源のバージョンアップも管理できる。今までの音源は、新バージョンを公開しても、ユーザーがそれを使ってくれるとは限らない。DLL 音源であれば、新バージョンを強制的に使わせることが可能だ。
他にも、音源使用日数によって使える音素を徐々に解放して増やしていったりとか、音源ガチャ(ガチャで引いた音素だけ使える)みたいなゲーム的要素を入れたりすることもできるなど、可能性は無限大だ。
ただ、聞いている中で気をつけなくてはいけないなと思ったのは、ユーザー目線を忘れたら地雷になるということ。音源側がすべてを握っているからこそ、ユーザーに配慮する必要がある。
UTAU 界隈の不思議さも合わせて加味する必要があって、UTAU 界隈ではなぜか、必ずしもクオリティーの高い物が求められるわけではない。例えば、音源をバージョンアップして、良い機材で品質の高い音源を作り直しましたと言っても、昔の古い機材で作った音源の方が好きという人がいる。常に最新の音源を提供するタイプの DLL 音源は、意外と歓迎されないかもしれない。
まとめ
合計 3 時間分、バラエティーに富んだトピックの勉強会は面白かった。説明の雰囲気も講師それぞれ異なり、そこも味がある。運営の皆様、本当にお疲れ様でした。次回は、音源の中の人の話も聞いてみたい。録音時に苦労するところ、使用している機材を選んだ理由、録音のコツなど。あるいは、キーホルダーみたいなグッズを作っている人もいるので、そういう人の話なども。
プラグイン作者としては、他のプラグイン作者の話も気になるところ。どんな環境で、どのくらい時間掛けてプラグインを作っているのか。大変なところは何か。ユーザーからのフィードバックの扱いをどうしているか、などなど。
参考資料
- 第 1 回 UTAU 勉強会 in 神田 告知サイト
- パンフレット(PDF)
- UTAU 勉強会準備会 運営 Twitter
- #utaustudy01 Twitter ハッシュタグ
- 中継タイムシフトコミュニティー
- アンケート