ワンタッチで UTAU 音源による読み上げを行えるツール「唄詠(うたよみ)」。いわゆる自動 HANASU ツール。
同様のことを行うのにはいくつかやり方があるが、その中で唄詠の特徴はと言うと、細かいところを除けばおよそ以下のようなところだと思う。
このことから、ゆっくり関連のツールを UTAU 音源で活用できるようになり、例えば以下のような事が可能になる。
今後予定している、唄詠の大きな改良点は、以下のようなもの。
まずはセキュリティーアップデート。
以前からアナウンスしているように、唄詠の開発に用いているツール(C++Builder XE3 Starter)には画像関連の脆弱性があり、唄詠もこの影響を受ける。C++Builder の一部のバージョンでは脆弱性への対応が行われたが、XE3 Starter について脆弱性が放置されているので、すぐに唄詠の改善を行うことができない。とはいえ、春くらいまでにはなんとか改善したいと考えている。
続いて、発音改善第 1 弾。
現在の唄詠は、ものすごくロボロボしく発音するので、多少は丸く柔らかく発音できるようにしたいと考えている。ただし、第 1 弾の改善は応急的なもので、あまり時間をかけずに夏くらいまでにやりたい。
最後が、発音改善第 2 弾。
皆様のご協力を頂きながら、より人間っぽい発音を研究していきたい。これにはかなりの時間がかかることが想定される。なかなか実現は難しいと思うが、2015 年内に何かしらの成果が出せれば良いなと思う。
今年も唄詠をよろしくお願いします。
同様のことを行うのにはいくつかやり方があるが、その中で唄詠の特徴はと言うと、細かいところを除けばおよそ以下のようなところだと思う。
- 漢字かな交じり文を書いて再生ボタンを押すだけ、というシンプルな操作で読み上げが可能。
- 調声作業が一切不要なので手間がかからない。
- UTAU 音源そのものを使用して発音するので、声のイメージが UTAU に近い。
- ほぼリアルタイムでの読み上げが可能。
このことから、ゆっくり関連のツールを UTAU 音源で活用できるようになり、例えば以下のような事が可能になる。
- ニコニコ動画や生放送のコメントを UTAU 音源で読み上げる。
- ゆっくり MovieMaker でゆっくり実況ならぬ UTAU 音源実況動画を作成する。
唄詠を初めて公開したのは、ちょうど 1 年前の 2014 年 1 月。今までの歴史を簡単に振り返ってみると、
- Ver 1.0:1/1 に完成。読み上げソフトからのアプローチという仕組みの基礎を確立。
- Ver 1.8:多少のアクセントの概念などを導入し初公開。原音 WAVE をそのまま使っていたので発音は稚拙。
- Ver 3.0:UTAU 音源の原音設定を活用するようになり、発音がまともになった。単独音のみ対応で、読み上げ可能なのは基本的にひらがな・カタカナのみ。
- Ver 3.2:漢字かな交じり文の読み上げが可能になった。
- Ver 4.0:連続音音源に対応。
- Ver 4.4:resampler フラグ、音域、速度など、話し方に変化を付けられるようになった。
- Ver 5.2:リアルタイム読み上げが可能になった。
- Ver 5.8:自動バージョンアップ機能を搭載。
- Ver 6.0:調声プラグイン機構を導入。
今後予定している、唄詠の大きな改良点は、以下のようなもの。
まずはセキュリティーアップデート。
以前からアナウンスしているように、唄詠の開発に用いているツール(C++Builder XE3 Starter)には画像関連の脆弱性があり、唄詠もこの影響を受ける。C++Builder の一部のバージョンでは脆弱性への対応が行われたが、XE3 Starter について脆弱性が放置されているので、すぐに唄詠の改善を行うことができない。とはいえ、春くらいまでにはなんとか改善したいと考えている。
続いて、発音改善第 1 弾。
現在の唄詠は、ものすごくロボロボしく発音するので、多少は丸く柔らかく発音できるようにしたいと考えている。ただし、第 1 弾の改善は応急的なもので、あまり時間をかけずに夏くらいまでにやりたい。
最後が、発音改善第 2 弾。
皆様のご協力を頂きながら、より人間っぽい発音を研究していきたい。これにはかなりの時間がかかることが想定される。なかなか実現は難しいと思うが、2015 年内に何かしらの成果が出せれば良いなと思う。
今年も唄詠をよろしくお願いします。