テキストスピーチソフト(棒読みちゃんなど)の音声に UTAU 音源を使うためのツール「唄詠」の作り(内部構造)を変えている。

現行の唄詠は、言ってみればオールインワンパッケージ型。システムへの音源登録、テキストスピーチソフトとの連携、文章から音声への変換(調声)、ユーザーインターフェイスなどを、すべて一手に引き受けている。

これはこれでメリットがある。開発工数が比較的少なく済む、試行錯誤に伴う内部構造を変更しやすい、効率の良いコードを書きやすい、UI を作りやすい、などなどだ。

しかし、唄詠は次のステージに入った。

これまでは基礎体力を上げることを中心に開発していた。きちんとシステムと連携すること、任意の文章をとりあえず読めること、応答性が実用の範囲内であること、などなど。

しかし、今後は、調声部分の比重が高まってくる。

調声プラグイン方式での音源情報画面そうなってくると、調声部分だけ独立させた構造となる
  • 調声プラグイン方式

の方がメリットが大きくなってくる。


現行の唄詠は、スーパー棒読み状態だが、今後、多少は自然な読み方をしてくれる調声をしたいと思っている。多くのユーザーは、新しい調声を好むだろうが、例えば既にスーパー棒読みで作品を作り始めてしまっているユーザーは、その作品の完成まではスーパー棒読みを使い続けたいかもしれない。

調声プラグイン方式にしておけば、現行のスーパー棒読みも残しておくことで、ユーザーに好きな調声を選んでもらうことができる。

また、期待したいのは、独自の調声エンジンを開発・公開してくれる人が現れること。

唄詠と同じようなソフトを 1 から開発するのは、それなりに骨が折れる作業で、要求される知識の種類も多い。ユーザーにとっても、複数の似たようなソフトをインストールするのは面倒であろう。

しかし、調声プラグイン方式であれば、開発者は調声の部分だけを開発すれば良いことになる。開発のハードルは格段に下がるし、ユーザー側の負担も少ない。

面白い話し方、流暢な話し方、デスボイス、悲鳴、ワイワイガヤガヤ演出……。いろんな話し方をプラグインとして開発していただければ、もっと HANASU が楽しく便利になると思う。