唄詠アイコンワンタッチで UTAU 音源による読み上げを行えるツール「唄詠(うたよみ)」。いわゆる自動 HANASU ツール。

同様のことを行うのにはいくつかやり方があるが、その中で唄詠の特徴はと言うと、細かいところを除けばおよそ以下のようなところだと思う。
  • 漢字かな交じり文を書いて再生ボタンを押すだけ、というシンプルな操作で読み上げが可能。
  • 調声作業が一切不要なので手間がかからない。
  • UTAU 音源そのものを使用して発音するので、声のイメージが UTAU に近い。
  • ほぼリアルタイムでの読み上げが可能。
棒読みちゃん唄詠のプログラム的な立ち位置は、テキストスピーチソフト(棒読みちゃんなど)の声として UTAU 音源を割り当てる、というところになる。UTAU エディタに音符を置いていくという従来の UTAU のやり方ではなく、棒読みちゃんや Softalk といった「読み上げソフト」からのアプローチだ。

このことから、ゆっくり関連のツールを UTAU 音源で活用できるようになり、例えば以下のような事が可能になる。
  • ニコニコ動画や生放送のコメントを UTAU 音源で読み上げる。
  • ゆっくり MovieMaker でゆっくり実況ならぬ UTAU 音源実況動画を作成する。

唄詠を初めて公開したのは、ちょうど 1 年前の 2014 年 1 月。今までの歴史を簡単に振り返ってみると、

  • Ver 1.0:1/1 に完成。読み上げソフトからのアプローチという仕組みの基礎を確立。
  • Ver 1.8:多少のアクセントの概念などを導入し初公開。原音 WAVE をそのまま使っていたので発音は稚拙。
  • Ver 3.0:UTAU 音源の原音設定を活用するようになり、発音がまともになった。単独音のみ対応で、読み上げ可能なのは基本的にひらがな・カタカナのみ。
  • Ver 3.2:漢字かな交じり文の読み上げが可能になった。
  • Ver 4.0:連続音音源に対応。
  • Ver 4.4:resampler フラグ、音域、速度など、話し方に変化を付けられるようになった。
  • Ver 5.2:リアルタイム読み上げが可能になった。
  • Ver 5.8:自動バージョンアップ機能を搭載。
  • Ver 6.0:調声プラグイン機構を導入。
という感じだ。

今後予定している、唄詠の大きな改良点は、以下のようなもの。

まずはセキュリティーアップデート。

以前からアナウンスしているように、唄詠の開発に用いているツール(C++Builder XE3 Starter)には画像関連の脆弱性があり、唄詠もこの影響を受ける。C++Builder の一部のバージョンでは脆弱性への対応が行われたが、XE3 Starter について脆弱性が放置されているので、すぐに唄詠の改善を行うことができない。とはいえ、春くらいまでにはなんとか改善したいと考えている。

続いて、発音改善第 1 弾。

現在の唄詠は、ものすごくロボロボしく発音するので、多少は丸く柔らかく発音できるようにしたいと考えている。ただし、第 1 弾の改善は応急的なもので、あまり時間をかけずに夏くらいまでにやりたい。

最後が、発音改善第 2 弾。

皆様のご協力を頂きながら、より人間っぽい発音を研究していきたい。これにはかなりの時間がかかることが想定される。なかなか実現は難しいと思うが、2015 年内に何かしらの成果が出せれば良いなと思う。

今年も唄詠をよろしくお願いします。