唄詠

唄詠 Ver 7.62 を公開

SofTalkVoice「唄詠」(うたよみ)の新バージョン、Ver 7.62 を公開しました。

唄詠は、UTAU 音源を使ってのトーク(HANASU)を自動化するツールです。従来、UTAU 音源にお話しをさせるためには、UTAU 画面上での地道な調整作業が必要でしたが、唄詠を使うと、テキストスピーチソフトに文章を入力するだけでお話しが可能となり、とても簡単です。

ご参考に、唄詠による読み上げのサンプルを下に挙げます。
台詞:晴れた日は、湖まで出かけて、ほとりを散歩してみましょう。気持ちよい風を浴びて、魚の跳ねる音を聞けば、すっきり朗らかになれます。


他にも唄詠を使用した事例については、 唄詠のコンテンツツリーをご覧ください。

更新内容

今回のバージョンアップは、細かい改善です。

唄詠の公式サイト移転に対応しました。

他にも、ヘルプ関連のメニューを整理したり、エラー表示を強化したりしました。

更新・インストール方法

唄詠の設定 唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

アップデートを開始する旨のメッセージが表示されたら、必ず、テキストスピーチソフトおよび、唄詠を終了してから、アップデートをおこなってください。

これから初めて唄詠を使う方や、手動でアップデートしたい方は、下記サイトからどうぞ。

関連リンク


唄詠での moresampler の使い方

UTAU 音源自動トークツール「唄詠」で、音声合成エンジンに moresampler を使う方法のまとめです。唄詠 Ver 7.24、moresampler 0.7.0 にて確認しています。

moresampler をダウンロード・解凍します。

moresampler を解凍すると含まれている「moreconfig.txt」をメモ帳などで開き、「Output settings」のところを「resampler-compatibility on」に修正します(デフォルトでは off になっている)。
# === Output settings ===
output-sampling-rate 44100
output-bit-depth 16
resampler-compatibility on

唄詠を起動し(管理者権限で起動することを推奨します)、「新規登録」ボタンをクリック。

音源の新規登録音源の新規登録ウィンドウが開きますので、oto.ini に好きな音源の oto.ini を指定します。

続いて、調声プラグイン(やまなみ)の「設定」ボタンをクリック。

やまなみやまなみの設定ウィンドウが開きますので、「wavtool の場所」では、UTAU に付属している wavtool.exe を指定します。

「resampler の場所」では、先ほど解凍したファイルに含まれている moresampler.exe を指定します。

「試聴」ボタンをクリックすると、moresampler で合成された音声を聞くことができます。

「OK」ボタンをクリックして、音源を登録すれば完了です。

唄詠と moresampler を使った HANASU の例を以下に挙げます。

なお、音声合成エンジンを moresampler にすると、本家 UTAU での合成ではなくなります。UTAU 音源の利用規約に「本家 UTAU でのみ使用可」のような制限がある場合は moresampler は使えませんので、個々の UTAU 音源の利用規約を確認してお使いください。

唄詠使用動画ご紹介(シリーズ物)

唄詠題字UTAU 音源で簡単におしゃべりができるツール「唄詠」。唄詠を利用したトークの入った動画は、現在 90 以上。その中から、少しずつご紹介させていただきます。

唄詠を利用した動画は、唄詠簡易説明書動画のコンテンツツリーで見ることができますので、そこからピックアップしています。今回は、シリーズ物(同じシリーズの中で、唄詠を使用したものが 2 つ以上)をご紹介します。

【栄冠ナイン】 弦巻さん不在の私利私欲ナイン シリーズ

「実況パワフルプロ野球 2014」の実況動画。おまかせ指示禁止という縛りの中で、甲子園優勝を目指します。

重音テトの他、VOICEROID 系、CeVIO 系、ゆっくりなど、合成音声オールスター感があり、楽しい動画です。

2016/04/29 現在、最も頻繁に更新されているシリーズです。



PSO2 シオンのアークス生活 シリーズ

「PHANTASY STAR ONLINE 2」実況動画。シリーズは、過去にタイムスリップしたところからスタートします。

ガチムチ系のネタが含まれるので、苦手な方はご注意。



【HANASU】室内で植物を育てませんか? シリーズ

室内での植物の育て方に関するチュートリアル動画。

桃音モモと甘藍が、ゆるーく育て方を教えてくれます。身近な植物なのに知らないことも多く、植物好きに限らず楽しい発見がある動画です。

実用系の唄詠使用動画は珍しく、今後の展開にも期待です。



【刀剣乱舞】ググればいいんだろう? シリーズ

タイトルとは裏腹に、ググってはいけない系の単語を紹介する動画。

ググると出てきてしまう怖~いページなどが紹介されています。心臓の弱い方はご注意。



【PAYDAY2】無法地帯上に任侠は疾る シリーズ

強盗や麻薬運搬などの任務をこなす犯罪集団をテーマにした「PAYDAY2」の実況動画。

唄詠以外にも、CeVIO 系、VOICEROID 系など、さまざまな合成音声が登場します。



終わりに

他にも、シリーズものはまだまだありますので、別途紹介の機会を捉えていきたいと思います。

今後も唄詠を利用した動画が増えていくのを楽しみにしています。

なお、冒頭の題字は、シオン様に作成いただきました。ありがとうございました。

他の紹介記事


唄詠のこれまでと 2016 年以降の予定

誰でも簡単に、UTAU 音源におしゃべりさせられるツール「唄詠」。

同様のことを行えるソリューションがいくつかある中で、唄詠の特徴を再掲すると、
  • 漢字かな交じり文を書いて再生ボタンを押すだけ、というシンプルな操作で読み上げが可能。
  • 調声作業が一切不要なので手間がかからない。
  • UTAU 音源そのものを使用して発音するので、声のイメージが UTAU に近い。
  • ほぼリアルタイムでの読み上げが可能。

唄詠は 2014 年 1 月に産声を上げて以来、着実に進歩してきた。昨年(2015 年)のトピックを振り返ってみると、以下のようになるだろうか。

まずは、新しい調声プラグイン「やまなみ」のリリース。当初の調声プラグイン「ダブルフラット」は非常にロボロボしい発音を特徴としていたが、やまなみは、ニュートラルな読み上げをコンセプトとしている。調声プラグインが 2  つに増えたことで、表現の選択肢が広がった。レーシングゲーム「幻走スカイドリフト」の実況動画は、やまなみを使ってアフレコをしている。

調声プラグインはどなたでも開発可能で、SDK も公開されている。

2015 年は唄詠を取り巻く環境にも大きな変化があった。

UTAU 音源配布者から唄詠への「いいね」である唄詠使用支援中タグを作っていただいた。詳細は支援サイトをご覧頂きたいが、UTAU 音源配布者も UTAU 利用者も、お互いがおしゃべりを楽しめるような仕組みを作っていただいている。

現時点でタグの件数は 200 以上にのぼるが、1 つのツールにすぎない唄詠に対して、これほどのご支援をいただいていることは、言葉では表せないくらいの喜びである。

そのようなご支援へのお礼も兼ねて、かつ、UTAU のおしゃべりをさらに便利にすべく、UTAU 音源 声質検索サイトをオープンした。

UTAU 音源の数は膨大だが、「しゃべった場合の声の雰囲気」を重視して希望の音源を探せるサイトは、これまでほとんどなかった。本サイトは、UTAU 音源声質アンケートの結果や、声の雰囲気を表すタグなど、声質を重視して音源を検索できる数少ないサイトである。サンプルボイスも登録可能で、また、唄詠と連動しているので、利便性も高い。

登録は自由に行えるので、新しい音源や既存音源のサンプルボイスなど、積極的に登録していただけると助かる。

最後に、地味ではあるが「セキュリティーアップデート」も重要な出来事だった。以前の唄詠は、開発環境である C++Builder に由来する脆弱性があったが、これを解消した。安全性の向上もまた、快適な利用のために重要であると考える。

以上が、2015 年の振り返りとなる。

さて、2016 年以降の唄詠の予定であるが、主なものは以下のようになっている。

まずは、第三の調声プラグインの開発。より実用的なしゃべりを目指して、現在研究を行っている。複数のかたにご協力頂いた実験データを基に、さらに唄詠を進化させたい。とはいえ、これはかなり時間のかかる作業で、1 年間では終わらないかもしれない。本丸の攻略には時間がかかる。

既存の調声プラグインのレベルアップも図っていきたい。最近の UTAU 音源は語尾息や表情音源などを搭載し、表現力が高まってきている。そういう要素を取り入れて発音できるようになれば、面白いのではないだろうか。また、よく使われるフレーズ・文章などは、定型文として予め最適な調声をほどこしておくと、効果的かもしれない。もちろん、無声化や疑問文対応などの基本的なところは着実に進めていきたい。

特定のアプリとの相性問題ではあるものの、現時点では、YMM と組み合わせた時の発音があまりよろしくない。このあたりも改善に取り組んでいきたい。

今後とも、唄詠をよろしくお願いします。

関連リンク


唄詠 Ver 7.24 を公開

SofTalkVoice「唄詠」(うたよみ)の新バージョン、Ver 7.24 を公開しました。

唄詠は、UTAU 音源を使ってのトーク(HANASU)を自動化するツールです。従来、UTAU 音源にお話しをさせるためには、UTAU 画面上での地道な調整作業が必要でしたが、唄詠を使うと、テキストスピーチソフトに文章を入力するだけでお話しが可能となり、とても簡単です。

ご参考に、唄詠による読み上げのサンプルを下に挙げます。
台詞:晴れた日は、湖まで出かけて、ほとりを散歩してみましょう。気持ちよい風を浴びて、魚の跳ねる音を聞けば、すっきり朗らかになれます。


他にも唄詠を使用した事例については、 唄詠のコンテンツツリーをご覧ください。

更新内容

梓歌オリ今回のバージョンアップは、不具合の修正です。

一部の環境で、新規登録ボタンなどを押した際にフリーズすることがありましたが、これを解消しました。

更新・インストール方法

唄詠の設定 唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

アップデートを開始する旨のメッセージが表示されたら、必ず、テキストスピーチソフトおよび、唄詠を終了してから、アップデートをおこなってください。

これから初めて唄詠を使う方や、手動でアップデートしたい方は、下記サイトからどうぞ。

関連リンク


唄詠使用動画ご紹介(どういうことなの、バイオハザード、解説)

唄詠題字UTAU 音源で簡単におしゃべりができるツール「唄詠」。唄詠を利用したトークの入った動画が増えてきたので(現時点で 50 以上)、少しずつご紹介させていただきます。

唄詠を利用した動画は、唄詠簡易説明書動画のコンテンツツリーで見ることができますので、そこからピックアップしています。

どういうことなの!? / 夏緒つくね(UTAU)



くちばし P の名曲「どういうことなの!?」を、夏緒つくねが歌います。

この動画には、イントロ部分があります。夏緒らむね・つくね兄弟が、歌うことになった経緯を話しています。弟さんのほうがしっかりしているようですね。

会話に唄詠が使われています。

【UTAU吹き替え】バイオハザード6【ゆっくり実況プレイ】 1/2



バイオハザードの実況プレイなのですが……。よりによって CV が響震路というのが笑ってしまいます。しかし、解説を聞いてみると、ネタ役というわけではなく、音源の充実度で選ばれているようです。

シェリー役は楓歌コトなので、真面目な感じです。

[ゆっくり解説]UTAUを“ゆっくり”にして「ゆっくりMoviemaker3」で使う方法



SHINTA 以外による初の唄詠解説動画です。

私が唄詠解説動画を作ると、どうしても一定のパターンになってしまいます。他の方に作っていただくと、新たな視点から唄詠を知ることができたり、私の動画ではとうてい手が届かない部分を説明していただいたりしていて、大変助かります。

終わりに

今後も唄詠を利用した動画が増えていくのを楽しみにしています。

なお、冒頭の題字は、シオン様に作成いただきました。ありがとうございました。

他の紹介記事

UTAU 音源声質検索(2015/08)

UTAU 音源を、話し声の声質で検索できるサイト、UTAU 音源 声質検索

おかげさまで、公開してからわずか 10 日間で、たくさんの登録・更新をしていただきまして、現時点で、101 件の登録があります。

主な更新情報

日音クレル 通常(無印)音源句音コノ。 爽を使った唄詠ボイスにすごいのが登場しました。


クレルさんとコノ。さんの掛け合いとなっているのですが、クレルさんとコノ。さんのテンションの差が面白いです。間の取り方も上手い。

また、梅兎のサンプルボイスが数多く登録されました。

最近新規に登録された主な音源は、以下です。

UTAU 音源声質検索について

UTAU 音源声質検索は、UTAU 音源を「しゃべった時の声質」で検索できるサイトです。声質を表すタグや、UTAU 音源声質アンケートの結果などで検索できます。

サンプルボイスも聴けるので、目的の声質に合致する音源を探しやすいかと思います。

対象となる音源は、自動 HANASU ツールである「唄詠」を支援する気持ちを表明している、「唄詠使用支援中」タグ付きの音源です。

手軽に UTAU 音源でトークできる「唄詠」に「いいね」と思って下さる音源配布者の方は、配布動画に唄詠使用支援中タグロックをお願いできればと思います。

リンク



唄詠 Ver 7.21 を公開

SofTalkVoice「唄詠」(うたよみ)の新バージョン、Ver 7.21 を公開しました。

唄詠は、UTAU 音源を使ってのトーク(HANASU)を自動化するツールです。従来、UTAU 音源にお話しをさせるためには、UTAU 画面上での地道な調整作業が必要でしたが、唄詠を使うと、テキストスピーチソフトに文章を入力するだけでお話しが可能となり、とても簡単です。

ご参考に、唄詠による読み上げのサンプルを下に挙げます。
台詞:晴れた日は、湖まで出かけて、ほとりを散歩してみましょう。気持ちよい風を浴びて、魚の跳ねる音を聞けば、すっきり朗らかになれます。


他にも唄詠を使用した事例については、 唄詠のコンテンツツリーをご覧ください。

更新内容

音源情報ダイアログ今回のバージョンアップでは、音源情報登録ダイアログから、音源検索ページ「UTAU 音源 声質検索」にジャンプできるようになっています。

また、音源情報ダイアログの音素種別判定が強化されています。

更新・インストール方法

唄詠の設定 唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

アップデートを開始する旨のメッセージが表示されたら、テキストスピーチソフトおよび、唄詠を終了して下さい。

これから初めて唄詠を使う方や、手動でアップデートしたい方は、下記サイトからどうぞ。

関連リンク


UTAU 音源を声の雰囲気で検索できるサイト開設

数ある UTAU 音源を、「声質」(声の雰囲気)で整理・検索できるサイトを開設しました。

声質の中でも、「しゃべったときの声質」に焦点を当てています。

検索フォームで、声質の情報(声質を表すタグや、UTAU 音源声質アンケートの結果など)を入力すると、条件に合う音源を検索することができます。

検索結果からすぐに、「しゃべった時のボイスサンプル」を聞くことができます。

UTAU 音源自動ナレーションツール「唄詠(うたよみ)」を使っていると、「こんな声でしゃべってくれる音源ないかなぁ」と思うことがよくあると思います。本サイトは、そのような時に役立つサイトを目指しています。検索対象となる音源は、唄詠使用支援中の音源です。

登録・編集はどなたでもできますので、是非、情報の充実にご協力をお願いします。現在の登録件数は 81 件です。

唄詠使用支援中の UTAU 音源をご紹介(2015/07)

UTAU 音源 声質検索サイトを公開しましたので、今後はそちらで検索ください。

UTAU 音源による自動ナレーションツール「唄詠(うたよみ)」。

唄詠ユーザーの芋川さん【唄詠使用支援中】をひろめよう!という応援サイトを作って下さったおかげで、唄詠使用支援中の表明をしてくださっている UTAU 音源が増えてきています。

ここでは、唄詠使用支援中の UTAU 音源を一覧形式でご紹介させていただきます(全 69 音源)。

前回まで、または、今回の調査時点において、ニコニコ動画の唄詠使用支援中タグを「タグロック」してくださっている音源、および、ホームページ上で唄詠使用支援を表明して下さっている音源を挙げています。音源名をクリックするとホームページに行けます。実際に各 UTAU 音源を利用する際は、各 UTAU 音源の利用規約をご確認の上、ご利用下さい。

一部の項目は入力できておらず、完全な一覧表になっていませんが、折を見て更新してきます。

なお、明示的に唄詠使用支援中を表明して下さっていなくても、唄詠の開発にご協力いただいたり、利用規約上唄詠での使用も可能ですと仰っていただいている音源さん・中の人さんも数多くいらっしゃいます。ありがとうございます。

また、新たに唄詠をご支援頂ける音源の方は、冒頭のサイトをご覧の上、唄詠使用支援中タグロックなどをお願いします。

あ行 か行 さ行 た行 な行 
は行 ま行 や行 ら行 わ行  

あ行 (12)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
明月リトあかつきりと単独音:TmBox
-明月リト
明月リルあかつきりる--明月リル
惡音キンあくねきん---
浅尾木タダミあさおきただみ-B4:中性的な男性、力強く叫ぶ-
梓歌オリあずかおり---
飽音モネあねもね---
天月しょうあまつきしょうmodel-SR:TmBox
型番不明:TmBox 0:10~
B1:中性的な男の子、ハキハキとした元気さ
(連続音)他
syouicon
天月りよんあまつきりよん連続音:TmBox
G2:若い女の子、澄んだ優しいRiyon
梅兎うめと---
虚音イフうろねいふ連続音:TmBox
M4:大人の男性、力強く叫ぶ
(連続音)他
虚音イフ
王縄ムカデおおなわむかで---
折人おると---

か行 (9)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
神音ノノ♂♀かみねのの---
君影あまのきみかげあまの-G2:若い女の子、澄んだ優しい-
君影クロトきみかげくろと-M4:大人の男性、力強く叫ぶ
(連続音)他
clotho
君影ちはなきみかげちはな-L2:幼い女児、澄んだ優しい-
句音コノ。くおんこの爽、暗、楽他:ニコ動 0:00~B1:中性的な男性、ハキハキとした元気さ句音コノ。
砕音ガイくだきねがい1.00:TmBox
-砕音ガイ
卒音メルくらりねめる---
黒堵ビスクくろとびすく連続音*2焼き目:TmBox
G3:若い女の子、感傷的で悲しげbisque
郡ゆたこおりゆた---

さ行 (10)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
雑音イズざつねのいず---
汐音タトしおねたと---
式大元しきたいげん通常音源:TmBox
M1:大人の男性、ハキハキとした元気さshiki
湿気リエしっけりえ---
霜月エマしもつきえま3 音階連続音:TmBox
F1:大人の女性、ハキハキとした元気さema
唱地ヨエしょうじよえまどろみ:TmBox
まどろみ:ニコ動 1:35~
G4:若い女の子、力強く叫ぶ
(連続音)他
唱地ヨエ
星牙コウせいがこう---
星牙ソラせいがそらTmBox
-sora
星牙レイせいがれい---
蒼湖マウそうこまう---

た行 (7)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
竹屋このはたけやこのは---
竹屋このみたけやこのみ---
タナカたなかTmBox
-タナカ
たなかなたたなかなた---
玲縹たまはなだニコ動
1:50~
G2:若い女の子、澄んだ優しい声
(鶸萌葱)他
tama_icon
千歳リフちとせりふ---
トク、とくニコ動
0:05~
--

な行 (3)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
南斗夏姫なんとなつき---
虹歌ソヨにじかそよ---
虹歌リスにじかりすニコ動
0:20~
-虹歌リス

は行 (3)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
葉楼ナツノはろうなつの朗:TmBox
朗:ニコ動 1:20~
-葉楼ナツノ
日音クレルひねくれるニコ動
0:05~
M4:大人の男性、力強く叫ぶ-
藤音サトふじねさとソプラノ:TmBox
-fujine

ま行 (15)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
槙音ほだかまきねほだか---
槙音ほのりまきねほのり---
まとあとままとあとま-G1:若い女の子、ハキハキとした元気さ-
真野キツカまのきつか---
真理音緋炎まりねひえんニコ動
2:10~
-image
真理音譲刃まりねゆずは---
真理音霊羽まりねれう---
結音りりむすびねりりTmBoxF1:大人の女性、ハキハキとした元気さ結音りり
結音るうむすびねるう---
結音れいむすびねれい---
餅寝こめもちねこめ---
餅寝つきもちねつき---
森音むぃもりねむい---
森音めめっともりねめめっと---
森音メメントもりねめめんと---

や行 (5)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
やまだまややまだまやニコ動
0:45~
F4:大人の女性、力強く叫ぶimg
大和内庵やまとうちいおり---
唯月あおいゆいづきあおい---
唯月あかねゆいづきあかねTmBox-akane
紫音さよゆかりねさよ---

ら行 (3)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
螺旋音リボらせんねりぼ連続音:TmBox-ribo
Libraりぶら---
燐音イオりんねいお---

わ行 (1)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
渡音ニワわたりねにわMild:TmBox
-Niwa

ん (1)

音源名ふりがな唄詠発声サンプルUTAU 音源声質アンケートアイコン
んにゃんんにゃん---

唄詠 Ver 7.18 を公開

SofTalkVoice「唄詠」(うたよみ)の新バージョン、Ver 7.18 を公開しました。

唄詠は、UTAU 音源を使ってのトーク(HANASU)を自動化するツールです。従来、UTAU 音源にお話しをさせるためには、UTAU 画面上での地道な調整作業が必要でしたが、唄詠を使うと、テキストスピーチソフトに文章を入力するだけでお話しが可能となり、とても簡単です。

ご参考に、唄詠による読み上げのサンプルを下に挙げます。
台詞:晴れた日は、湖まで出かけて、ほとりを散歩してみましょう。気持ちよい風を浴びて、魚の跳ねる音を聞けば、すっきり朗らかになれます。


更新内容

唄詠_Ver718今回のバージョンアップはマイナーバージョンアップで、以下の不具合修正などが行われています。
  • 明示的に管理者権限で起動しないと、唄詠音源がうまく登録されない場合があるのを修正。
  • タイミングによっては唄詠エンジンがシステムに登録されない場合があるのを修正。
  • oto.ini で同じエイリアスが複数回設定されている場合は、最初の設定を有効と見なすように変更。
  • 設定画面で、エラーダイアログが出続ける場合がある不具合を修正。

なお、今回の修正により、環境によっては、これまで登録した唄詠音源がクリアされてしまう場合があるかと思います。その場合は、大変お手数ですが、再度音源の登録をお願いいたします。

更新・インストール方法

唄詠の設定 唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

アップデートを開始する旨のメッセージが表示されたら、テキストスピーチソフトおよび、唄詠を終了して下さい。

これから初めて唄詠を使う方や、手動でアップデートしたい方は、下記サイトからどうぞ。

関連リンク


唄詠 Ver 7.11 を公開

SofTalkVoice「唄詠」(うたよみ)の新バージョン、Ver 7.11 を公開しました。

唄詠は、UTAU 音源を使ってのトーク(HANASU)を自動化するツールです。従来、UTAU 音源にお話しをさせるためには、UTAU 画面上での地道な調整作業が必要でしたが、唄詠を使うと、テキストスピーチソフトに文章を入力するだけでお話しが可能となり、とても簡単です。

更新内容

音源の新規登録今回のバージョンアップでは、新しい調声プラグイン「やまなみ」を同梱しました。やまなみは「ニュートラルな読み上げ」をコンセプトに開発されたプラグインで、これまでの調声プラグイン「ダブルフラット」よりも少し普通のナレーションに近づいた読み上げを行います。

以下に、プラグインによる読み上げの違いをサンプルとして掲出します。
台詞:晴れた日は、湖まで出かけて、ほとりを散歩してみましょう。気持ちよい風を浴びて、魚の跳ねる音を聞けば、すっきり朗らかになれます。

新しい「やまなみ」調声プラグイン

従来の「ダブルフラット」調声プラグイン

今までに登録した唄詠音源についても、自動的に新しいやまなみプラグインが適用されます。従来のプラグインで読み上げを行いたい場合は、音源登録画面(修正画面)で、ダブルフラット調声プラグインを選択して下さい。

更新・インストール方法

唄詠の設定 唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

これから初めて唄詠を使う方や、手動でアップデートしたい方は、下記サイトからどうぞ。

関連リンク


唄詠使用支援中の UTAU 音源をご紹介(2015/06)

更新しました

UTAU 音源による自動ナレーションツール「唄詠(うたよみ)」。

唄詠ユーザーの芋川さん【唄詠使用支援中】をひろめよう!という応援サイトを作って下さったおかげで、唄詠使用支援中の表明をしてくださっている UTAU 音源が増えてきています。

ここでは、唄詠使用支援中の UTAU 音源を一覧形式でご紹介させていただきます(全 53 音源)。

前回まで、または、今回の調査時点において、ニコニコ動画の唄詠使用支援中タグを「タグロック」してくださっている音源、および、ホームページ上で唄詠使用支援を表明して下さっている音源を挙げています。音源名をクリックするとホームページに行けます。実際に各 UTAU 音源を利用する際は、各 UTAU 音源の利用規約をご確認の上、ご利用下さい。

一部の項目は入力できておらず、完全な一覧表になっていませんが、折を見て更新してきます。

なお、明示的に唄詠使用支援中を表明して下さっていなくても、唄詠の開発にご協力いただいたり、利用規約上唄詠での使用も可能ですと仰っていただいている音源さん・中の人さんも数多くいらっしゃいます。ありがとうございます。

あ行 か行 さ行 た行 な行 
は行 ま行 や行 ら行 わ行  

あ行 (8)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
明月リトあかつきりと--明月リト
明月リルあかつきりる--明月リル
浅尾木タダミあさおきただみ-B4:中性的な男性、力強く叫ぶ-
飽音モネあねもね---
天月しょうあまつきしょうTmBox
0:10~
B1:中性的な男の子、ハキハキとした元気さ
(連続音)他
-
天月りよんあまつきりよんニコ動
5:05~
G2:若い女の子、澄んだ優しいRiyon
梅兎うめと---
虚音イフうろねいふ-M4:大人の男性、力強く叫ぶ
(連続音)他
-

か行 (9)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
神音ノノ♂♀かみねのの---
君影あまのきみかげあまの-G2:若い女の子、澄んだ優しい-
君影クロトきみかげくろと-M4:大人の男性、力強く叫ぶ
(連続音)他
-
君影ちはなきみかげちはな-L2:幼い女児、澄んだ優しい-
句音コノ。くおんこのニコ動
0:00~
B1:中性的な男性、ハキハキとした元気さ句音コノ。
砕音ガイくだきねがいTmBox
-砕音ガイ
卒音メルくらりねめる---
黒堵ビスクくろとびすく-G3:若い女の子、感傷的で悲しげ-
郡ゆたこおりゆた---

さ行 (7)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
雑音イズざつねのいず---
式大元しきたいげん-M1:大人の男性、ハキハキとした元気さ-
霜月エマしもつきえま-F1:大人の女性、ハキハキとした元気さ-
唱地ヨエしょうじよえニコ動
1:35~
G4:若い女の子、力強く叫ぶ
(連続音)他
唱地ヨエ
星牙コウせいがこう---
星牙ソラせいがそら---
星牙レイせいがれい---

た行 (7)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
竹屋このはたけやこのは---
竹屋このみたけやこのみ---
タナカたなかTmBox
-タナカ
たなかなたたなかなた---
玲縹たまはなだニコ動
1:50~
G2:若い女の子、澄んだ優しい声
(鶸萌葱)他
tama_icon
千歳リフちとせりふ---
トク、とくニコ動
0:05~
--

な行 (3)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
南斗夏姫なんとなつき---
虹歌ソヨにじかそよ---
虹歌リスにじかりすニコ動
0:20~
-虹歌リス

は行 (3)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
葉楼ナツノはろうなつのニコ動
1:20~
-葉楼ナツノ
日音クレルひねくれるニコ動
0:05~
M4:大人の男性、力強く叫ぶ-
藤音サトふじねさと---

ま行 (8)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
まとあとままとあとま-G1:若い女の子、ハキハキとした元気さ-
真野キツカまのきつか---
真理音緋炎まりねひえんニコ動
2:10~
-image
真理音譲刃まりねゆずは---
真理音霊羽まりねれう---
結音りりむすびねりりTmBoxF1:大人の女性、ハキハキとした元気さ結音りり
結音るうむすびねるう---
結音れいむすびねれい---

や行 (4)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
やまだまややまだまやニコ動
0:45~
F4:大人の女性、力強く叫ぶimg
唯月あおいゆいづきあおい---
唯月あかねゆいづきあかねTmBox-akane
紫音さよゆかりねさよ---

ら行 (2)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
螺旋音リボらせんねりぼ---
燐音イオりんねいお---

わ行 (1)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
渡音ニワわたりねにわ---

ん (1)

音源名ふりがな唄詠例UTAU 音源声質アンケートアイコン
んにゃんんにゃん---

唄詠ワンポイント Tips:アクセントを指定する

UTAU 音源による自動トークツール「唄詠」。

棒読みちゃんなどのテキストスピーチソフトに漢字仮名交じり文を入力し、再生ボタンを押すだけで、とりあえずしゃべってくれます。

しかし、文章の「アクセント」を指定することで、より自然なしゃべりになる場合があります。今回はワンポイント Tips として、アクセント指定の方法をご紹介します。

ノーマル

今回の例文は、「いつも行くうどん屋さんは、ランチタイムはいつも混んでいるけど、今日はすぐに座れた。」とします。

棒読みちゃんによる自動アクセントまずは、通常のしゃべりから。

棒読みちゃんで唄詠音源を選択して例文を入力し、再生ボタンを押すと、UTAU 音源がしゃべってくれます。

しかし、少しアクセントが変です。例えば、文頭の「いつも」は、人間がしゃべる時は「い」にアクセントがあるものですが、棒読みちゃん経由の唄詠では、「い」にアクセントがありません。

実際の発音を録音しておきましたので、聞いてみて下さい。録音の前半と後半でアクセントが違いますが、通常のしゃべりは前半部分です。後半については後ほど説明します。
  • 録音したサンプル(TmBox:【唄詠】Tips:アクセントの指定(槌音ずも)) ※前半を試聴

少しアクセントを修正

簡単なアクセント修正であれば、棒読みちゃんでも行えます。

文章を入力する欄に、「い'つも行くうどん屋さんは、ランチタイムはいつも混んでいるけど、今日はすぐに座れた。」と入力してみて下さい。先ほどとの違いはただ 1 箇所、先頭の「い」の次に、「'」(半角アポストロフィー)を入れたことです。

詳しくは後ほど説明しますが、半角アポストロフィーを入れると、直前の文字にアクセントが付きます。このため、「いつも」の「い」にアクセントが来て、人間がしゃべるときのようなアクセントになりました。

棒読みちゃんのウィンドウの一番下にある「(6) 音声記号列変換(出力)」という欄を見てみると、ノーマル時は「いつも/いく/うどんや+さん+わ、ランチタイム/わ/いつも/こ'んで/いる+け'ど、きょ'う+わ/すぐ+に/すわ+れた。」となっているのですが、アクセントを指定すると、「い'つも/いく/うどんや+さん+わ、ランチタイム/わ/いつも/こ'んで/いる+け'ど、きょ'う+わ/すぐ+に/すわ+れた。」となっており、指定したアクセントがきちんと出力されていることがわかります。

すべてのアクセントを指定

TextToWav設定全部のアクセントを指定する場合は、棒読みちゃんではなく TextToWav を使います。初めて使う場合は、リンク先にある「TextToWav.zip」をダウンロード・解凍して下さい。

初めて使う場合は、設定を確認しましょう。

「16kHz 16 Bit Mono」となっている箇所を、「44kHz 16 Bit Mono」に変更します。そのままでも動きますが、音質が悪くなってしまいます。

また、「辞書を使う」のチェックが外れている(OFF になっている)ことを確認します。アクセントを手動で指定する場合は、OFF の方が都合が良いです。

ボイス選択コンボボックスで、好きな唄詠音源を選択します。

文章入力欄に、「い'つも/いく/うどんやさんわ、ランチタ'イムわ/い'つも/こ'んで/いる'けど、きょ'うわ/す'ぐに/すわれた。」と入力して、再生ボタンを押して下さい。人間がしゃべる時のアクセントに近いアクセントで読み上げが行われたと思います。

実際の発音を録音したものは、先ほどと同じ TmBox の、後半部分になります(前半がさきほどのノーマルアクセント版です)。
  • 録音したサンプル(TmBox:【唄詠】Tips:アクセントの指定(槌音ずも)) ※後半を試聴

アクセントの指定ルール

アクセントは、半角スラッシュ(/)を区切りとする部分(「アクセント句」と呼びます)ごとに考えます。先ほどの文章の初めの方は「い'つも/いく/うどんやさんわ、」となっていますが、半角スラッシュで区切られる「い'つも」「いく」「うどんやさんわ、」の 3 つのアクセント句に分かれます。

それぞれのアクセント句の中では、特に指定をしない場合、基本的には右肩上がりに近いアクセントになります。先頭にはアクセントがなくて、後ろの文字が盛り上がるイメージです。例えば「いく」では、「い」ではなく「く」のほうが盛り上がります。「うどんやさんわ、」では、「う」は低い発音で、「ど」以降が盛り上がります。

先頭にアクセントを持ってきた場合は、半角アポストロフィー(')を付けます。先ほど述べたように、半角アポストロフィーを入れると、直前の文字にアクセントが付きます。「い'つも」というように「い」の直後に半角アポストロフィーを入れることにより、半角アポストロフィー直前の「い」にアクセントが付きます。

アクセント句の途中にアクセントを置きたい場合は、途中に半角アポストロフィーを入れれば大丈夫です。先の文章の中程にある「いる'けど、」では、アクセント句の途中である「る」の後ろに半角アポストロフィーがあります。これにより、「い」が低く発音され、「る」で盛り上がった後、「けど」は再び低く発音されるようになり、途中が盛り上がるアクセントとなります。

以上のルールを頭に入れて例文を見直してみると、例文のアクセントの付き方が理解できると思います。

アクセントについては、AquesTalk音声記号列仕様書(PDF)に詳しく書かれていますので、参考にどうぞ。

唄詠関連リンク





唄詠新調声プラグイン「やまなみ」開発中

ワンタッチで UTAU 音源のおしゃべりを実現する自動 HANASU ツール「唄詠」。

唄詠は、使用する調声プラグインによって、話し方が変わります。現在、新しい調声プラグインを開発中です。開発コードネームは「やまなみ」。

現行の唄詠に同梱されている調声プラグイン「ダブルフラット」は、一部で能やお経とも言われる、独特の節回しが特徴的な話し方をします。

新しい「やまなみ」は、「ニュートラルな読み上げ」をコンセプトとしており、少し普通のナレーションに近づいた読み上げをする予定です。

開発途中のものですが、テスト読み上げを掲載しておきます。
※いずれの音源も、唄詠使用支援中の表明をいただいている音源です。

まだまだ開発途上なので、今すぐ公開というわけにはいきませんが、なるべく早く公開したいと思っています。

また、「やまなみの次」のプラグインは、いろいろな方にご協力頂きながら、研究をしている段階です。こちらは、完成までにかなりの時間を要する見込みです。

なお、唄詠の調声プラグインは、どなたでも開発できます。SDK を公開しておりますので、これを利用して開発して下さい。

唄詠調声プラグイン SDK Ver 2.00 を公開

UTAU 音源によるトーク(HANASU)を自動化するツール「唄詠」では、調声プラグインと呼ばれるプラグインにより音声合成をしています。

その調声プラグインを開発するための SDK をバージョンアップしました。

今回のバージョンアップでは、「調声プラグインインターフェースバージョン 2」に対応しました。唄詠本体のバージョンアップにより、Ver 7.00 以降、インターフェースバージョンが 2 に上がりましたので、今後調声プラグインを開発する際は、今回の SDK で開発をしてください。


唄詠 Ver 7.01 を公開

唄詠Ver701「唄詠」(うたよみ)の新バージョン、Ver 7.01 を公開しました。

唄詠は、UTAU 音源を使ってのトーク(HANASU)を自動化するツールです。従来、UTAU 音源にお話しをさせるためには、UTAU 画面上での地道な調整作業が必要でしたが、唄詠を使うと、テキストスピーチソフトに文章を入力するだけでお話しが可能となり、とても簡単です。

今回のバージョンアップは、セキュリティーアップデートです。

唄詠は C++Builder で開発しているため、C++Builder の脆弱性 JVNVU#97910946 により、悪意のある画像ファイルの影響を受ける恐れがありました。

今回のバージョンアップで、画像処理部分をすべて C# で書き換えたため、脆弱性の影響を受けなくなり、安全性が高まりました。

安全のため、どなたさまも、速やかに今回のバージョンに更新して下さい。

唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

これから初めて唄詠を使う方や、手動でアップデートしたい方は、下記サイトからどうぞ。

今回のバージョンから、唄詠の実行には .NET Framework 4.5 が必要となります。

なお、アップデート後に、「クラスが登録されていません」というエラーメッセージが表示された場合は、新しい音源を 1 つ登録して下さい。登録後、通常通り使えるようになるかと思います。

関連リンク


唄詠で音源登録がうまくいかない場合の対応方法

音源登録メッセージ唄詠のトラブルシューティングをご紹介します。

唄詠のメインウィンドウから「新規登録」ボタンを押し、UTAU 音源を唄詠用に登録すると、右のように、音源をシステムに登録した旨のメッセージが表示されます。

メインウィンドウしかし、登録が完了したにもかかららず、唄詠のメインウィンドウに音源が表示されず、音源リストが空っぽのままになる、あるいは、読み上げ時に「クラスが登録されていません」というようなエラーになって読み上げができない、という症例が報告されています。

このような状況になった場合は、以下の 3 つのうち、いずれかの回避方法を実践することにより、音源を登録できるようになるかと思いますので、お試し下さい。

回避方法 1:再登録

一旦唄詠を終了して、再度、起動し、同じ音源を登録すると、登録できることがあります。まずはこの方法をお試し下さい。

回避方法 2:管理者権限での起動

唄詠用に音源を登録するには、管理者権限が必要です。通常、唄詠は自動的に管理者権限で動作するようになっていますが、何らかの原因により、うまく管理者権限が取得できないことがあるようです。

そこで、唄詠を起動する際に、管理者権限で起動することにより、音源を登録できるようになります。

やり方
  1. 唄詠右クリックエクスプローラーで唄詠のフォルダを開きます。
  2. 唄詠(UtaYomi.exe)を右クリックし、表示されるメニューから「管理者として実行」をクリック。
  3. 必要に応じて管理者パスワードを入力すると、唄詠が管理者権限で起動します。
  4. あとは通常通りの手順で音源を登録すれば、正常に音源が登録されます。

なお、この方法で音源を登録した場合、テキストスピーチソフトも管理者権限で起動する必要があります。

回避方法 3:VirtualStore 無効化

音源が正常に登録できない原因として、Windows の VirtualStore 機能が悪影響を及ぼしていることが考えられます。VirtualStore 機能が有効になっていると、登録した音源情報と、読み出す音源情報に相違が発生する場合があります。

したがって、VirtualStore 機能を無効化することで、正常に音源が登録できるようになる場合があります。

ただし、VirtualStore 機能を無効にすると、他のアプリケーションがうまく動かなくなる可能性もあり、注意が必要ですので、この方法はあまりお薦めしません。

VirtualStore 無効化のやり方については、インターネット上の情報等を参照して下さい。

次期唄詠のテスター募集 その 3(β)

以前に書いたように、現在、唄詠を 1 から作り直しています。

現在、一通りのテキストスピーチソフトと組み合わせて動作するようになってきており、機能的にも第 2 回より増えてきました。ただ、私以外の環境でも動くのかが不明なので、みなさまのご協力をお願いしたい次第です。どうぞよろしくお願いします。

はじめに注意

今回のテスト(人柱)用バージョン 7.00 β は、動作確認テスト用です。また、今回のバージョンを使用している間は、従来の唄詠は使えません。また、復旧後も従来の唄詠使用に支障をきたす可能性がゼロではありません。

また、今回のバージョンを動作させるには、.NET Framework 4.5 が必要です。

テスト手順

以下の手順で作業をお願いします。

  1. 唄詠 Ver 7.00 β をダウンロード。
  2. ダウンロードした zip を解凍。この時、従来の唄詠とは「違うフォルダ」に解凍して下さい(Program Files などの管理者権限が必要なフォルダは避けて下さい)。
  3. 唄詠(UtaYomi.exe)を起動。
  4. 音源の新規登録「新規登録」ボタンで音源を登録。お好きな音源でどうぞ(前回と違い、連続音でも大丈夫です)。調声プラグインは「ダブルフラット」。
  5. 補足 1:前回から、oto.ini のドラッグ&ドロップに対応しています。

  6. ブロック解除補足 2:「新規登録」ボタンを押した際、「有効な調声プラグインが 1 つも見つかりませんでした。」というエラーが表示される場合は、エクスプローラーで唄詠の Plugins フォルダを開きます。Default.dll 、DefaultSettings.exe を右クリックしてプロパティを開き、「ブロック解除」ボタンを押します。その後唄詠を再起動して下さい。

  7. ダブルフラットの設定「設定」ボタンをクリックして、ダブルフラットプラグインの設定画面を開きます。「試聴」ボタンをクリックして、管理者権限確認後、試聴できるか確認をお願いします。
  8. テキストスピーチソフト(棒読みちゃんなど)を起動し、数文字の文章を入力し、登録した音源でしゃべれるか確認をお願いします。
  9. 音が出なかった場合、一旦唄詠を終了してから、再度唄詠を起動し、4~8をもう 1 度行います。なぜか 2 回やらないとうまくいかない環境があるようです。
  10. 「仮:エクスポート」ボタンを押すと、エクスポートファイル(動作状況を記録したログや設定ファイルなど)を保存できます。

報告

テストの結果を私 SHINTA に教えて下さい。

  • 環境(Windows のバージョン、テキストスピーチソフトの名称、使用した UTAU 音源)
  • DL した唄詠 zip ファイル名(UtaYomi700Beta1.zip など)
  • 動作結果
    • 試聴できたかどうか
    • 文章を再生できたかどうか
    • 1 回の登録で動作したかどうか(2 回の登録が必要だったかどうか)
  • 「有効な調声プラグインが 1 つも見つかりませんでした。」というエラーが出たかどうか。

動作しなかった場合は、エクスポートファイルもお送り頂けると、原因の究明に役立ちますので、よろしければご協力をお願いします。

環境復旧

従来の唄詠(Ver 6 系列)を再び使用するためには、従来の唄詠を起動し、新規登録または修正を行って下さい。1 回でうまくいかない場合は、唄詠の再起動を行いながら数回登録してみてください。

みなさまには大変お手数おかけ致しますが、是非ご協力をお願いします。


唄詠使用支援中の UTAU 音源をご紹介(2015/05)

更新しました

UTAU 音源による自動ナレーションツール「唄詠(うたよみ)」。

唄詠ユーザーの芋川さん【唄詠使用支援中】をひろめよう!という応援サイトを作って下さったおかげで、唄詠使用支援中の表明をしてくださっている UTAU 音源が増えてきています。

そこで今回は、そのような UTAU 音源を一覧形式でご紹介させていただきます(全 32 音源)。

現時点で、ニコニコ動画の唄詠使用支援中タグを「タグロック」してくださっている音源、および、ホームページ上で唄詠使用支援を表明して下さっている音源を挙げています。実際に各 UTAU 音源を利用する際は、各 UTAU 音源の利用規約をご確認の上、ご利用下さい。

なお、明示的に唄詠使用支援中を表明して下さっていなくても、唄詠の開発にご協力いただいたり、利用規約上唄詠での使用も可能ですと仰っていただいている音源さんも数多くいらっしゃいます。ありがとうございます。

あ行 (5)


か行 (5)


さ行 (3)


た行 (6)


な行 (2)


は行 (2)


ま行 (5)


や行 (2)


ら行 (2)


次期唄詠のテスター募集 その 2

以前に書いたように、現在、唄詠を 1 から作り直しています。

まだまだ完成とはほど遠いですが、第 1 回のテスター募集時よりは安定し、一通りのテキストスピーチソフトと組み合わせて動作するようになってきています。ただ、私以外の環境でも動くのかが不明なので、みなさまのご協力をお願いしたい次第です。どうぞよろしくお願いします。

はじめに注意

今回のテスト(人柱)用バージョン 7.00 α は、起動確認用であり、機能はほとんど実装されていません。また、今回のバージョンを使用している間は、従来の唄詠は使えません。また、復旧後も従来の唄詠使用に支障をきたす可能性がゼロではありません。

また、今回のバージョンを動作させるには、.NET Framework 4.5 が必要です。

テスト手順

以下の手順で作業をお願いします。

  1. 唄詠 Ver 7.00 α をダウンロード。
  2. ダウンロードした zip を解凍。この時、従来の唄詠とは「違うフォルダ」に解凍して下さい(Program Files などの管理者権限が必要なフォルダは避けて下さい)。
  3. 唄詠(UtaYomi.exe)を起動。
  4. 「新規登録」ボタンで音源を登録。「音源名」は好きな名前でどうぞ。「oto.ini の場所」では、必ず「単独音」(あ.wav など音素ごとの WAVE ファイルがあるもの)かつ「単音階」の音源を指定して下さい(私はぱみゅで動作確認しています)。「声質」「年代」はお好みで。調声プラグインは「サンプル」。
  5. 補足 1:oto.ini のドラッグ&ドロップに対応しました。
  6. ブロック解除補足 2:「新規登録」ボタンを押した際、「有効な調声プラグインが 1 つも見つかりませんでした。」というエラーが表示される場合は、エクスプローラーで唄詠の Plugins フォルダを開きます。UtaYomiRenderSample.dll を右クリックしてプロパティを開き、「ブロック解除」ボタンを押します。その後唄詠を再起動して下さい。
  7. テキストスピーチソフト(棒読みちゃんなど)を起動し、「かたな」などの「ひらがな」数文字の文章を入力し、登録した音源で「音が出るか」確認をお願いします。まだちゃんとしゃべれません。原音 WAVE がそのまま再生されるだけです。
  8. 音が出なかった場合、一旦唄詠を終了してから、再度唄詠を起動し、4~7をもう 1 度行います。なぜか 2 回やらないとうまくいかない環境があるようです。
  9. 「仮:エクスポート」ボタンを押すと、エクスポートファイル(動作状況を記録したログや設定ファイルなど)を保存できます。

報告

テストの結果を私 SHINTA に教えて下さい。

  • 環境(Windows のバージョン、テキストスピーチソフトの名称、使用した UTAU 音源)
  • DL した唄詠 zip ファイル名(UtaYomi700Alpha11.zip など)
  • 動作結果(1 回の登録で動作した、2 回の登録で動作した、動作しなかったなど)
  • 「有効な調声プラグインが 1 つも見つかりませんでした。」というエラーが出たかどうか。

動作しなかった場合は、エクスポートファイルもお送り頂けると、原因の究明に役立ちますので、よろしければご協力をお願いします。

環境復旧

従来の唄詠(Ver 6 系列)を再び使用するためには、従来の唄詠を起動し、新規登録または修正を行って下さい。1 回でうまくいかない場合は、唄詠の再起動を行いながら数回登録してみてください。

みなさまには大変お手数おかけ致しますが、是非ご協力をお願いします。


唄詠 Ver 6.47 を公開

47「唄詠」(うたよみ)の新バージョン、Ver 6.47 を公開しました。

唄詠は、UTAU 音源を使ってのトーク(HANASU)を自動化するツールです。従来、UTAU 音源にお話しをさせるためには、UTAU 画面上での地道な調整作業が必要でしたが、唄詠を使うと、テキストスピーチソフトに文章を入力するだけでお話しが可能となり、とても簡単です。

今回のバージョンアップは不具合の修正で、話すスピードが速い場合に落ちる不具合などを修正しています。

唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

これから初めて唄詠を使う方や、手動でアップデートしたい方は、下記サイトからどうぞ。
なお、唄詠は C++Builder で開発しているため、JVNVU#97910946 の影響を受けます。不正な画像データを開かないようご注意下さい。

追加情報

ユーザー様が唄詠の支援サイトを作って下さいました。音源や動画などについての情報があります。

唄詠を使用している動画をご覧になりたい場合は、ニコニコ動画で一覧を見ることができます。


C# による SAPI 5 TTS Engine COM コンポーネントの実装(不完全)

.NET Framework 4.5 C# / Visual Studio 2013 にて、Microsoft Speech API (SAPI) 5.4 の TTS エンジンのサンプルコード(テストコード)「TestUtaYomiEngine」を作成した。

不完全ではあるものの、SAPI 音声合成エンジン側の C# コードはあまり見かけないので、参考になるかもしれないと思い公開する。SAPI に限らず、C# の COM コンポーネントは少ないので、そちらの方面でも参考になるかもしれない。

逆に、アドバイス等あれば、是非とも教えて頂きたい。

本サンプルコードの挙動

本サンプルコードは、既に公開している音声合成エンジン「唄詠(うたよみ)」(Ver 6 系)の代替エンジンとして動作する。
入力された文字にかかわらず、「C:\Test.wav」(44.1kHz、16 ビット、モノラル限定)を再生する。

本サンプルコードで動く部分

以下のテキストスピーチソフトとの組み合わせで動作する。これらのアプリは恐らく、SpXXXX 系の純粋な SAPI を使用しているものと思われる。
  • SofTalk
  • TextToWav
  • 棒読みちゃん(フォーマット変更エラーが表示されるが再生は可能)

本サンプルコードで動かない部分

.NET Framework の SpeechSynthesizer クラスを使用しているテキストスピーチソフト(ゆっくり MovieMaker など)との組み合わせでは動作しない。

使い方

  • Ver 6 系の唄詠をインストールし、テキストスピーチソフトと組み合わせて正しく動作することを確認する。
  • サンプルコードを管理者権限でビルドする。Ver 6 系の唄詠エンジンの代わりに、ビルドしたコードが登録される。
  • 44.1kHz、16 ビット、モノラルの WAVE ファイル(UTAU 音源の原音 WAVE を使うと良い)を C:\Test.wav に保存する。
  • テキストスピーチソフトで唄詠音源でしゃべらせると、サンプルコードが動作し、上記 WAVE が再生される。
  • 唄詠以外のソフトのベースとして使う際は、必ず Guid を変更すること。

ダウンロード


ライセンス


関連記事


更新情報

  • 2015/11/21 ダウンロードリンクが切れていたので、サルベージして再公開

次期唄詠デバッグメモ(COM サーバー編)

前回のエントリに書いたように、.NET の SpeechSynthesizer クラスから新唄詠を使おうとすると使えないので、その原因を探っていく。引き続き、massao さんの支援をいただいている。

そもそも、使えないというのはどういうことかというと、クライアントアプリ(テキストスピーチソフト)が SpeechSynthesizer.SelectVoice を唄詠音源指定で呼びだした際に、
ArgumentException:音声を設定できません。一致する音声がインストールされていないか、または音声が無効になっています。
という例外が発生する。

クライアントが SelectVoice を呼ぶと、恐らく別スレッドが起動し、その中で、COM サーバーである唄詠が生成される。生成後、本来であれば SetObjectToken が呼ばれるのだが、これが呼ばれない。今回はその状況をメモとして整理する。

そもそも、SelectVoice された際の新唄詠の動きを、COM サーバーと言って良いのかは不明だ。

現行(Ver 6.xx 系列)の唄詠は C++ で開発しているので、おそらく普通に COM サーバーとして振る舞っている。新唄詠も、SAPI として使われている場合(動作する 3 種類のテキストスピーチソフトから使われる場合)は、QueryInterface に応答しているので、COM サーバーとして振る舞っていると思われる。

しかし、新唄詠が SelectVoice された際は、コンストラクタが呼ばれた後に QueryInterface が呼ばれない。新唄詠も SelectVoice も両方 .NET Framework なので、COM の手順ではなく、名前と型による制御になっているのかもしれない。

とりあえず、現時点でできることは、コンストラクタが呼ばれる際のコールスタックを追うくらいなので、それを整理する。何故か、うちの環境ではコンストラクタが 4 回呼ばれる。登録されている唄詠音源が多いほどコンストラクタも多く呼ばれるが、登録されている唄詠音源は現在 3 つなので、ぴったり数が一致するわけでもないのが謎だ。

ともあれ、コンストラクタが呼ばれたときのコールスタックは以下。

TestUtaYomiEngine.dll!TestUtaYomiEngine.TestUtaYomiTTSEngineObject.TestUtaYomiTTSEngineObject() 行 160    C#
[ネイティブからマネージへの移行]   
mscorlib.dll!System.RuntimeType.CreateInstanceSlow(bool publicOnly, bool skipCheckThis, bool fillCache, ref System.Threading.StackCrawlMark stackMark) 行 5568    C#
mscorlib.dll!System.Activator.CreateInstance(System.Type type, bool nonPublic) 行 206    C#
mscorlib.dll!System.Activator.CreateInstance(System.Type type) 行 147    C#
System.Speech.dll!System.Speech.Internal.ObjectTokens.ObjectToken.CreateObjectFromToken<object>(string name)    不明
System.Speech.dll!System.Speech.Internal.Synthesis.VoiceSynthesis.GetComEngine(System.Speech.Synthesis.VoiceInfo voiceInfo)    不明
System.Speech.dll!System.Speech.Internal.Synthesis.VoiceSynthesis.GetProxyEngine(System.Speech.Synthesis.VoiceInfo voiceInfo)    不明
System.Speech.dll!System.Speech.Internal.Synthesis.VoiceSynthesis.ThreadProc()    不明
mscorlib.dll!System.Threading.ThreadHelper.ThreadStart_Context(object state) 行 74    C#
mscorlib.dll!System.Threading.ExecutionContext.RunInternal(System.Threading.ExecutionContext executionContext, System.Threading.ContextCallback callback, object state, bool preserveSyncCtx) 行 581    C#
mscorlib.dll!System.Threading.ExecutionContext.Run(System.Threading.ExecutionContext executionContext, System.Threading.ContextCallback callback, object state, bool preserveSyncCtx) 行 531    C#
mscorlib.dll!System.Threading.ExecutionContext.Run(System.Threading.ExecutionContext executionContext, System.Threading.ContextCallback callback, object state) 行 520    C#
mscorlib.dll!System.Threading.ThreadHelper.ThreadStart() 行 111    C#


それぞれの関数が返ってきた直後の EAX を見て、関数が成功しているかどうかを判定してみると(0 以外なら成功していると判定)、

CreateInstanceSlow→成功(0x0252153C)
CreateInstance(Type, bool)→成功?(0252153C のまま)
CreateInstance(Type)→成功?(0252153C のまま)
CreateObjectFromToken→成功?(0252153C のまま)
GetComEngine→失敗
GetProxyEngine→失敗

CreateObjectFromToken は成功しているとはいえ、「instanceValue as ISpObjectWithToken」のキャストに失敗しているフシがある。CreateObjectFromToken が想定している ISpObjectWithToken と、新唄詠が実装している ISpObjectWithToken は、名前が同じでも、型が違うと見なされているのではないか。

ICustomTypeProvider で型の偽装をしようかとも思ったが、実装が悪かったのか、キャストの際に ICustomTypeProvider.GetCustomType() が呼ばれなかった。

次期唄詠デバッグメモ(Visual Studio 編)

.NET 版としてリニューアル開発中の次期唄詠だが、依然として苦戦している。

2 週間前よりは状況は改善し、棒読みちゃん・SofTalk・TextToWav の 3 つで動作するようになったが(棒読みちゃんのチャンネルエラーは出るが)、ゆっくり MovieMaker で相変わらず動かない。

動く 3 つのテキストスピーチソフトは、内部的に(おそらく)SAPI を使用している。しかし、ゆっくり MovieMaker は、内部的に SAPI ではなく .NET の SpeechSynthesizer を使用している。

SpeechSynthesizer は SAPI 互換のはずなのだが、なぜ動かないのか。massao さんの多大なるご支援をいただきながら、現在調査中。

.NET の内部を深掘りする必要があり、まずは、そのための Visual Studio の使い方を整理。

.NET Framework の中へステップイン

[VS2010]デバッグ時に.Net Frameworkのソースコードへステップインさせ、アセンブラのコードを表示させるのブログを参照して、Visual Studio 2013 のオプションを設定する。

[ツール→オプション]メニューの中の、デバッグ→全般にて、「.NET Framework ソースのステッピングを有効にする」にチェックを入れる。

COM サーバー(新唄詠エンジン)のコンストラクタ中でブレークさせた場合、デフォルトだと呼びだし履歴が表示されないが、これにより、呼びだし履歴(コールスタック)を見ることができるようになる。

.NET Framework の中も、逆アセンブル状態ではあるが、一応実行を追えるようになる。ただ、うちの環境だと、なぜかステップ実行ができず、1 行 1 行ブレークポイントをはって実行する必要が……。

関数へのステップイン

逆に、テストアプリ側からデバッグを進めたい場合は、.NET の関数を呼んでいる場所で、Shift + Alt + F11。なぜかうちの環境だとメニューに無いが、「関数へのステップイン」。ステップインできる関数の一覧が表示され、クリックすると、.NET Framework の関数であってもその中に入り込んでいける。

逆アセンブル状態でのデバッグ

[デバッグ→ウィンドウ→レジスタ](Ctrl+Alt+G)でレジスタの内容を閲覧できる。

関数の戻り値は EAX レジスタに格納される。呼びだし先関数(値を返す方)でも、呼びだし元関数(値を受け取る方)でも、どちらでも EAX を見れば良い。

次期唄詠の状況整理

現在リニューアル中の次期唄詠について、現在の状況を整理。一言で言うと、あまり芳しくない。

以下、各テキストスピーチソフトと組み合わせた次期唄詠の状況。

with 棒読みちゃん

一応話せるが、チャンネル数変更失敗のエラーが表示される。

唄詠側で通知しているつもりのチャンネル数が、きちんと棒読みちゃん側に伝わっていない模様。恐らく、システムの中枢に関わる根深い問題で、解決には時間がかかりそう。

with SofTalk

操作はサポートされませんというエラーが表示されて話せない。

SofTalk 作者様が、SofTalk の AssemblyCompany に URL があるとこのエラーが発生することを突き止めて下さったが、なぜ唄詠との組み合わせでこうなるのかは不明。こちらも解決には時間がかかりそう。

with ゆっくり MovieMaker

音声合成に失敗しましたというエラーが表示されて話せない。

どうやら、SpeechLib を使っているテキストスピーチソフトだと話せて、SpeechSynthesizer をテキストスピーチソフトだと話せないようだ(YMM は SpeechSynthesizer)。こちらも解決には時間がかかりそう。

with TextToWav

現時点で唯一、問題なく話せる。

次期唄詠のテスター募集

以前に書いたように、現在、唄詠を 1 から作り直しています。

まだまだ完成とはほど遠いどころか、はじめの一歩という感じですが、一部起動するようになってきています。ただ、私以外の環境でも動くのかが不明なので、みなさまのご協力をお願いしたい次第です。どうぞよろしくお願いします。

はじめに注意

今回のテスト(人柱)用バージョン 7.00 α は、起動確認用であり、機能はほとんど実装されていません。また、今回のバージョンを使用している間は、従来の唄詠は使えません。また、復旧後も従来の唄詠使用に支障をきたす可能性がゼロではありません。
また、今回のバージョンを動作させるには、.NET Framework 4.5 が必要です。

テスト手順

以下の手順で作業をお願いします。
  1. 唄詠 Ver 7.00 α をダウンロード。
  2. ダウンロードした zip を解凍。この時、従来の唄詠とは「違うフォルダ」に解凍して下さい(Program Files などの管理者権限が必要なフォルダは避けて下さい)。
  3. 唄詠(UtaYomi.exe)を起動。
  4. 「新規登録」ボタンで音源を登録。「音源名」は好きな名前でどうぞ。「oto.ini の場所」では、必ず「単独音」(あ.wav など音素ごとの WAVE ファイルがあるもの)音源を指定して下さい(私はぱみゅで動作確認しています)。「声質」「年代」はお好みで。調声プラグインは「サンプル」。
  5. 補足 1:oto.ini のドラッグ&ドロップには対応していません。
  6. ブロック解除補足 2:「新規登録」ボタンを押した際、「有効な調声プラグインが 1 つも見つかりませんでした。」というエラーが表示される場合は、エクスプローラーで唄詠の Plugins フォルダを開きます。UtaYomiRenderSample.dll を右クリックしてプロパティを開き、「ブロック解除」ボタンを押します。その後唄詠を再起動して下さい。
  7. テキストスピーチソフト(棒読みちゃんなど)を起動し、「かたな」などの「ひらがな」数文字の文章を入力し、登録した音源で「音が出るか」確認をお願いします。まだちゃんとしゃべれません。原音 WAVE がそのまま再生されるだけです。
  8. 音が出なかった場合、一旦唄詠を終了してから、再度唄詠を起動し、4~7をもう 1 度行います。なぜか 2 回やらないとうまくいかない環境があるようです。
  9. 「仮:エクスポート」ボタンを押すと、エクスポートファイル(動作状況を記録したログや設定ファイルなど)を保存できます。

報告

テストの結果を私 SHINTA に教えて下さい。
  • 環境(Windows のバージョン、テキストスピーチソフトの名称、使用した UTAU 音源)
  • DL した唄詠 zip ファイル名(UtaYomi700Alpha6.zip など)
  • 動作結果(1 回の登録で動作した、2 回の登録で動作した、動作しなかったなど)
  • 「有効な調声プラグインが 1 つも見つかりませんでした。」というエラーが出たかどうか。
動作しなかった場合は、エクスポートファイルもお送り頂けると、原因の究明に役立ちますので、よろしければご協力をお願いします。

環境復旧

従来の唄詠(Ver 6 系列)を再び使用するためには、従来の唄詠を起動し、新規登録または修正を行って下さい。1 回でうまくいかない場合は、唄詠の再起動を行いながら数回登録してみてください。

みなさまには大変お手数おかけ致しますが、是非ご協力をお願いします。

唄詠再構築中

UTAU 音源による自動ナレーションツール「唄詠」を 1 から作り直している。

唄詠のこれまでと 2015 年以降の予定に書いたとおり、唄詠の次のバージョンアップはセキュリティーアップデートである。唄詠の開発に使っている C++Builder の影響によるものだが、実のところ、唄詠で画像を扱っているのは、音源設定画面で UTAU 音源の画像を表示するところくらいなので、影響範囲は狭い。とはいえ、やはり安全に越したことは無い。

対応方法はこちらに書いたとおりいくつかあるが、現在は選択肢 4(C# での開発)を試している。

開発言語そのものが C++ から C# に変わるので、すべて 1 から作り直しとなる。

普通のアプリであっても作り直しとなると大変だが、唄詠はさらに大変。COM やら SAPI やら、いろいろ複雑なのだ。特に、SAPI の中でもエンジン側となると、C# との組み合わせ資料がほとんどなく、そもそも実現可能なのかもよく分からなかった。

それでもなんとか、いろいろ実験をして、唄詠エンジンの原始版が C# で動いたので、実現可能性が高まってきた。

次は、GUI 側の原始版を作って、唄詠全体のフレームワークを C# で実現できそうかどうか、確認したい。

道のりは長そうだ。

唄詠のこれまでと 2015 年以降の予定

唄詠アイコンワンタッチで UTAU 音源による読み上げを行えるツール「唄詠(うたよみ)」。いわゆる自動 HANASU ツール。

同様のことを行うのにはいくつかやり方があるが、その中で唄詠の特徴はと言うと、細かいところを除けばおよそ以下のようなところだと思う。
  • 漢字かな交じり文を書いて再生ボタンを押すだけ、というシンプルな操作で読み上げが可能。
  • 調声作業が一切不要なので手間がかからない。
  • UTAU 音源そのものを使用して発音するので、声のイメージが UTAU に近い。
  • ほぼリアルタイムでの読み上げが可能。
棒読みちゃん唄詠のプログラム的な立ち位置は、テキストスピーチソフト(棒読みちゃんなど)の声として UTAU 音源を割り当てる、というところになる。UTAU エディタに音符を置いていくという従来の UTAU のやり方ではなく、棒読みちゃんや Softalk といった「読み上げソフト」からのアプローチだ。

このことから、ゆっくり関連のツールを UTAU 音源で活用できるようになり、例えば以下のような事が可能になる。
  • ニコニコ動画や生放送のコメントを UTAU 音源で読み上げる。
  • ゆっくり MovieMaker でゆっくり実況ならぬ UTAU 音源実況動画を作成する。

唄詠を初めて公開したのは、ちょうど 1 年前の 2014 年 1 月。今までの歴史を簡単に振り返ってみると、

  • Ver 1.0:1/1 に完成。読み上げソフトからのアプローチという仕組みの基礎を確立。
  • Ver 1.8:多少のアクセントの概念などを導入し初公開。原音 WAVE をそのまま使っていたので発音は稚拙。
  • Ver 3.0:UTAU 音源の原音設定を活用するようになり、発音がまともになった。単独音のみ対応で、読み上げ可能なのは基本的にひらがな・カタカナのみ。
  • Ver 3.2:漢字かな交じり文の読み上げが可能になった。
  • Ver 4.0:連続音音源に対応。
  • Ver 4.4:resampler フラグ、音域、速度など、話し方に変化を付けられるようになった。
  • Ver 5.2:リアルタイム読み上げが可能になった。
  • Ver 5.8:自動バージョンアップ機能を搭載。
  • Ver 6.0:調声プラグイン機構を導入。
という感じだ。

今後予定している、唄詠の大きな改良点は、以下のようなもの。

まずはセキュリティーアップデート。

以前からアナウンスしているように、唄詠の開発に用いているツール(C++Builder XE3 Starter)には画像関連の脆弱性があり、唄詠もこの影響を受ける。C++Builder の一部のバージョンでは脆弱性への対応が行われたが、XE3 Starter について脆弱性が放置されているので、すぐに唄詠の改善を行うことができない。とはいえ、春くらいまでにはなんとか改善したいと考えている。

続いて、発音改善第 1 弾。

現在の唄詠は、ものすごくロボロボしく発音するので、多少は丸く柔らかく発音できるようにしたいと考えている。ただし、第 1 弾の改善は応急的なもので、あまり時間をかけずに夏くらいまでにやりたい。

最後が、発音改善第 2 弾。

皆様のご協力を頂きながら、より人間っぽい発音を研究していきたい。これにはかなりの時間がかかることが想定される。なかなか実現は難しいと思うが、2015 年内に何かしらの成果が出せれば良いなと思う。

今年も唄詠をよろしくお願いします。


唄詠 Ver 6.45 を公開

音源登録情報の修正「唄詠」(うたよみ)の新バージョン、Ver 6.45 を公開しました。

唄詠は UTAU 音源による自動ナレーションツールで、UTAU 音源によるおしゃべり「HANASU」を手軽に行うことができるようになります。

今回はマイナーバージョンアップで、音源登録画面に音素種別(連続音音源など)が表示されるようになったり、マルチスレッド対応が少しだけ強化されたりしています。

唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

手動でアップデートしたい場合や、新規にインストールしたい場合は、下記サイトからどうぞ。

唄詠 Ver 6.41 を公開

UtaYomi_SettingWindow手軽に UTAU 音源でお話ができるようになるツール「唄詠(うたよみ)」をバージョンアップしました。

発音関連では、
  • モジュレーション(mod)が指定可能になりました。
  • 一部の prefix.map に対応できていないバグを修正しました……水音ラルなどが使用可能になりました。
  • 連続音音源使用時に、文章の先頭が発声されないことがあるバグを修正しました。

などが改善されています。


それ以外では、

  • 音源設定のインポート・エクスポートが可能になりました。

という機能が追加になり、OS 再インストール時などの対応が便利になりました。


唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

手動でアップデートしたい場合は、下記サイトからどうぞ。

唄詠マニアックス:多くのファイル達

自動 HANASU ツール「唄詠(うたよみ)」では、Ver 6.14 現在、実行形式のファイル(EXE/DLL)が 6 個もある。わかりやすさから言えば 1 個にまとまっている方が良いのだが、諸事情によりそうなっていない。今回のマニアックスでは、それぞれの実行形式ファイルが何をしているか、解説する。

同梱されている 6 個の実行形式ファイルをフォルダ・アルファベット順に列挙すると、
Updater.exe自動更新ツール
UtaYomi.exe唄詠本体
UtaYomiEngine.dllSAPI エンジン
UtaYomiEngineHelper.dllSAPI エンジンヘルパー
UtaYomiHelper.exe唄詠本体のヘルパー
Plugins\Default.dll調声プラグイン
となる。それぞれのファイルについて以下で説明する。

唄詠本体(UtaYomi.exe)

唄詠アイコン何をもって本体と呼ぶのかは実は難しい問題なのだが、「ユーザーが意識して使うファイル」ということで本体としている。唄詠のヘルプでファイル名に言及している実行形式ファイルは UtaYomi.exe のみであり、逆に、これ以外のファイルは、ユーザーが直接起動しようとしても起動できない。

唄詠本体は、UTAU 音源をシステムに登録するための UI を提供する。登録されている音源の一覧表示、音源の新規登録、修正、削除。

また、唄詠全体の動作に関わる設定も行う。

唄詠本体のヘルパー(UtaYomiHelper.exe)

唄詠本体から必要に応じて自動的に起動される、ヘルパーアプリケーション。音源の新規登録・修正・削除作業を実際に行うのがこのヘルパー。

音源をシステムに登録するには、管理者権限で動作している必要がある。普段から管理者権限でログインしているユーザーの場合は問題ないのだが、一般権限でログインしているユーザーの場合、唄詠本体からでは音源の登録ができない。唄詠本体がヘルパーを管理者権限で起動し(昇格)、管理者権限のヘルパーが音源を登録するという流れになっている。

唄詠本体を常に管理者権限で起動させる設定にしておけばヘルパーは不要なのだが、起動する度に管理者パスワードを入力するというのは煩雑なので、やめている。

また、管理者権限が必要になったときに、唄詠本体が唄詠本体自身を管理者権限で起動するという方法もあると思うが、処理が複雑になりそうだったので、やめている。

結果として、唄詠本体とヘルパーを分離する方式に落ち着いた。

ヘルパーはバックグラウンドで動作するためユーザーからは見えずないが、一度起動されると、唄詠本体が終了するまで常駐している。

なお、ユーザーが間違ってヘルパーを起動した場合、ヘルパーは終了し、代わりに唄詠本体を起動するようになっている。

SAPI エンジン(UtaYomiEngine.dll)

システム側から「SAPI 用音源」として認識されているのがこのファイル。テキストスピーチソフトで唄詠の声を選択し、文章をしゃべらせると、このファイルが実行される。

しかしながら、このファイルは実質ダミーファイルで、次の SAPI エンジンヘルパーが実際の処理を行っている。

このファイルがあるのは、残念ながら俺の技術力が低いせいだ。

唄詠は C++Builder で開発しているが、C++Builder で SAPI エンジン(というか COM コンポーネント)を作るやり方が分からなかった。

そこで、Visual Studio で SAPI エンジンの殻だけ作り、中身の SAPI エンジンヘルパーを C++Builder で作成している。

C++Builder での SAPI エンジンの作り方をご存じの方がいらっしゃいましたら教えていただけると有り難いです。

SAPI エンジンヘルパー(UtaYomiEngineHelper.dll)

実質の SAPI エンジン。

テキストスピーチソフトが何かする度に呼びだされる。声を選択したり、文章をしゃべらせたりといった際に、SAPI エンジンとしての決まり事に従って作業を行う。

実際の音声合成は調声プラグインが行うので、主な作業は、システム側とプラグイン側の橋渡しとしての調整だ。

唄詠はいくつかの文章形式を扱えるが、システム側から受け取った形式を変換・統一してプラグインに渡すということもやっている。

調声プラグイン(Plugins\Default.dll)

Plugins フォルダにある調声プラグインは、文章を音声に変換する音声合成を行う。

Ver 6.14 現在、標準で用意されている調声プラグインは 1 つのみであるが、ユーザーが公開されているプラグインを追加することもできる。また、今後、標準で用意されているプラグインが増える可能性もある。

調声をプラグインでまかなうことにしたのは、様々な調声をユーザーが選べるようにするためだ。詳しくは前回の唄詠マニアックスを参照して欲しい。

自動更新ツール(Updater.exe)

唄詠には、最新バージョンが公開されたら自動的にバージョンアップする機能があるが、それを実現しているのがこの自動更新ツール。バージョンアップだけではなく、最新情報の表示も行う。

この自動更新ツールは唄詠専用というわけではなく、さまざまなアプリケーションで使えるものだ。単体公開もしている。




The Annoying Orange

The Annoying Orange という動画が投稿された。



海外の漫才動画の日本語吹き替え版のようだ。

オレンジがリンゴにちょっかいをだす動画なのだが、海外独特のキャラデザ(?)がなんとも不気味。見た瞬間にかなりのインパクトを受けた。

そんな 2 人(?)がシュールなやりとりを行う。

動画の作りとしては、漫才のタイミングに合わせてそれぞれのセリフのスピードをコントロールしている模様。きちんと手を入れて作ってあるのではないか。

是非一度見てみて欲しい。

この動画は、唄詠(唄詠コンテンツツリーUTAU 音源で手軽に HANA せるツール)を利用した動画の中で、自分以外が投稿した初めての動画。

唄詠を利用した動画第 1 号かどうかは、唄詠簡易説明書動画コンテンツツリー子作品で判定している。先頭 4 つが自分の動画なので、今回の動画が第三者初。



唄詠 Ver 6.14 を公開

UTAU 音源でおしゃべりができるようになる SAPI エンジン「唄詠」(うたよみ)をバージョンアップしました。

今回はバグ修正のための小規模バージョンアップです。音源登録時のバグにより、一部のテキストスピーチソフトで音源名が正しく表示されなくなるバグを修正しました。

唄詠の設定唄詠の設定で「唄詠の最新情報・更新版を自動的に確認する」を有効にしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。

すぐにアップデートしたい場合は、「今すぐ最新情報を確認する」ボタンをクリックすれば、アップデートを開始することができます。

手動でアップデートしたい場合は、下記サイトからどうぞ。

唄詠 Ver 6.12 を公開

ダブルフラットの設定ゆっくり MovieMaker などの声に UTAU 音源を使えるようになる、自動 HANASU ツール「唄詠」(うたよみ)をバージョンアップしました。

調声部分をプラグインとして独立させ、プラグインを自由に選べる構造にしました。現時点ではプラグインは実質 1 種類のみですが、今後プラグインが増えてくれば、唄詠の活用場面がさらに広がっていくと思います。

その他、いくつか細かな使い勝手を向上させています。

唄詠の設定で最新情報を確認するにしている場合、3 日以内に自動的に今回の最新バージョンにアップデートされます。ただし、Windows 8 でお使いの場合は、更新確認ダイアログのボタンが表示されない不具合がありますので、お手数ですが手動でダウンロードをお願いします(Windows 8.1 は問題ありません)。

また、開発者の方々向けに、唄詠の調声プラグインを開発するための SDK を公開いたしましたので、こちらも合わせてご参照下さい。



唄詠開発進捗状況(調声プラグイン方式)

以前の記事に書いたように、現在、唄詠の構造改革を行い、調声部分をプラグインとして分離する仕組みに変更している。およそできあがってきたので、様子をまとめてみる。

ユーザーから見て使い勝手が変わるのは、主に音源登録画面だ。

音源の新規登録これまでは、登録画面で様々な設定をしていたが、次回からは、ここでの設定項目は少なくなり、代わりに、調声プラグインを選ぶようになる。

音源登録画面では、調声プラグインによらない基本的な項目(音源名など)のみを設定するため、項目が減っている。

これまで設定していた UTAU ツールなどの項目は、調声プラグインによっては使用しない(例えば、プラグイン独自に音声合成するかもしれない)ため、項目から外している。

ダブルフラットの設定一方、プラグイン独自の設定ももちろん可能で、「設定」ボタンをクリックすると、プラグインの設定画面が表示される。

右は標準で付属するプラグインの設定画面だが、標準プラグインの調声はこれまでの唄詠と同じなので、設定項目もこれまでと変わらない。安心して使って欲しい。

今後、調声プラグインが新しく登場してくると、それぞれのプラグインによって設定画面も変わってくることになる。

ユーザーから見えないところで、内部構造は大きく変わっている。調声に直接関わるところと、それ以外のところが明確に分離したためだ。

合わせて、内部的な音源情報も変更され、これまでの唄詠で登録した音源は旧音源扱いとなる。とはいえ、これまで登録した音源が使えなくなっては不便なので、旧音源でもきちんと HANA せるようにはしている。

リリースに向けて、詰めの作業を実施中。

唄詠マニアックス:構造改革中である話

テキストスピーチソフト(棒読みちゃんなど)の音声に UTAU 音源を使うためのツール「唄詠」の作り(内部構造)を変えている。

現行の唄詠は、言ってみればオールインワンパッケージ型。システムへの音源登録、テキストスピーチソフトとの連携、文章から音声への変換(調声)、ユーザーインターフェイスなどを、すべて一手に引き受けている。

これはこれでメリットがある。開発工数が比較的少なく済む、試行錯誤に伴う内部構造を変更しやすい、効率の良いコードを書きやすい、UI を作りやすい、などなどだ。

しかし、唄詠は次のステージに入った。

これまでは基礎体力を上げることを中心に開発していた。きちんとシステムと連携すること、任意の文章をとりあえず読めること、応答性が実用の範囲内であること、などなど。

しかし、今後は、調声部分の比重が高まってくる。

調声プラグイン方式での音源情報画面そうなってくると、調声部分だけ独立させた構造となる
  • 調声プラグイン方式

の方がメリットが大きくなってくる。


現行の唄詠は、スーパー棒読み状態だが、今後、多少は自然な読み方をしてくれる調声をしたいと思っている。多くのユーザーは、新しい調声を好むだろうが、例えば既にスーパー棒読みで作品を作り始めてしまっているユーザーは、その作品の完成まではスーパー棒読みを使い続けたいかもしれない。

調声プラグイン方式にしておけば、現行のスーパー棒読みも残しておくことで、ユーザーに好きな調声を選んでもらうことができる。

また、期待したいのは、独自の調声エンジンを開発・公開してくれる人が現れること。

唄詠と同じようなソフトを 1 から開発するのは、それなりに骨が折れる作業で、要求される知識の種類も多い。ユーザーにとっても、複数の似たようなソフトをインストールするのは面倒であろう。

しかし、調声プラグイン方式であれば、開発者は調声の部分だけを開発すれば良いことになる。開発のハードルは格段に下がるし、ユーザー側の負担も少ない。

面白い話し方、流暢な話し方、デスボイス、悲鳴、ワイワイガヤガヤ演出……。いろんな話し方をプラグインとして開発していただければ、もっと HANASU が楽しく便利になると思う。

唄詠 Ver 5.80 を公開

80棒読みちゃんなどの声を大幅に増やせる(UTAU 音源を声にできる)ツール「唄詠(うたよみ)」をバージョンアップしました。

prefix.map に対応。これにより、緋惺や句音コノ。など、全音階にサフィックスが付いている音源でも再生が可能になりました。

また、自動アップデート機能を搭載。今回のバージョンをインストールしておけば、次回以降、唄詠がバージョンアップされた際は自動的にアップデートが行われるため、便利です。


唄詠 Ver 5.61 を公開

61自動 HANASU ツール「唄詠(うたよみ)」をバージョンアップしました。

音源情報登録・修正時に、空の oto.ini を指定すると、読み上げが行えないバグを修正しました。

多音階音源などでは、音源のトップフォルダに空の oto.ini をおくことが多く、そのようなケースに対応しました。

これにより、灯月アカリなどを使用可能になりました。

なお、現時点で prefixmap には対応していませんので、すべての音階にサフィックスが付いている緋惺などの音源はまだ使えません。

その他の改善点として、唄詠の最新情報を表示する機能を付けました。バージョンアップなどがあった場合にその情報が表示されます。


唄詠 Ver 5.55 を公開

唄詠_SettingWindow自動 HANASU ツール「唄詠(うたよみ)」をバージョンアップしました。

主な改良点は、
  • 音声合成速度の高速化(マルチスレッドレンダリングと逐次合成)
  • 連続音音源での読み上げでケロることがあるのを改善。
  • 音源情報登録・修正時の試聴機能を搭載。
  • 音源情報登録・修正時の音域選択で、ピアノ画面による直感的な指定方法を搭載。

目玉は高速化です。

複数の文字を同時に合成するマルチスレッドレンダリングでは、こちらの記事のように、8 スレッド CPU で約 5 倍近い高速化を実現しています。

また、逐次合成モードを搭載したことにより、テキストスピーチソフトとの相性はあるものの、長い文章でも一瞬で発声できるようになりました。どのテキストスピーチソフトで逐次合成が有効かは、ヘルプを参考にして下さい。

地味ながら重要な改善点としては、連続音音源でのケロりを改善しました。連続音音源で、今までよりも自然にしゃべってくれるようになりました。


唄詠の高速化について

自動 HANASU ツール「唄詠」について、高速化すべく作業中。

手法としてはよくある方法で、UTAU のツールを複数同時起動するというもの(いわゆるマルチスレッドレンダリング)。

で、実際のところ、どのくらい速くなるのか。数人のテスターの方に協力して頂いた結果が以下。

マルチスレッドレンダリング

表の見方だが、CPU の「コア」は物理コア数、「スレ」はスレッド数。Intel 系はハイパースレッディング(SMT)を実装していることがあり、物理コア数の 2 倍のスレッドを同時に走らせることができる。

「Temp」はテンポラリフォルダがあるデバイスの種類。ここが「HDD」なら、ハードディスク上にテンポラリフォルダがある。

測定結果の「半スレ」「全スレ」はそれぞれ、UTAU ツールを 1 つだけ起動して音声合成した場合と比べて何倍のスピードになったかを記している。「半スレ」であれば、CPU が同時に走らせられるスレッド数の半分の数だけ UTAU ツールを起動している(CPU のスレッドが 8 なら 4 個起動、小数点以下切り捨て)。「全スレ」はスレッド数と同じだけ起動(CPU のスレッドが 8 なら 8 個起動)。

結果を見ると、やはりマルチスレッドレンダリングは速い。例えば、Core i7-2670QM は最大 5 倍近い速度で合成できている。

テンポラリフォルダのアクセスによるボトルネックを心配していたが、結果を見る限り、そこはあまりボトルネックにはなっていないようだ。UTAU ツールは結果をディスクに出力するので、現在の唄詠はそれをテンポラリフォルダに出力させるようにしている。テンポラリフォルダのアクセス速度が遅いとマルチスレッドレンダリングしても効果が無いかと思ったが、遅い HDD でも効果が出ている。

ハイパースレッディングによってスレッド数を倍にしている場合、物理コアと違ってスレッドを処理する能力はあまり上がらない。なので、半コアと全コアを比較すると処理速度はさほど向上していない(逆に下がる場合もある)。デフォルト設定を半コアにするか全コアにするかは悩ましいところだ。

なお、この測定に限らないが、マルチスレッドの効果測定は、他のプロセスも多く動いている中では、不確定要素が多い。あくまでも目安となる。

それでもなるべく妥当な結果になるように、テスターの方には同じ測定を 5 回ずつ行って頂き、20% トリム平均(要は極端な上下を除き、中間 3 回の結果の平均)で結果を算出している。

ご協力頂いた皆様、ありがとうございました。

また、これからテストにご協力いただけるという方がいらっしゃいましたら、SHINTAまでご連絡下さい。

棒読みちゃんに UTAU 音源の声を追加する方法まとめ

唄詠のバージョンがだいぶ上がってきたので、改めてやり方を整理しておく。

唄詠は、棒読みちゃんなどのテキストスピーチソフトの「声」として、UTAU 音源を指定できるようにするためのツール。

これまで、UTAU 音源にしゃべらせる(HANASU)には、UTAU 上で時間をかけて調声する必要があったが、唄詠を使うと、テキストスピーチソフトに文章を入力して再生ボタンを押すだけという、簡単な方法でしゃべらせることができるようになる。

やり方は以下。

UtaYomiExe唄詠公式サイトから唄詠の zip ファイルをダウンロードし、好きなフォルダに解凍する。

UtaYomi.exe を起動し、新規登録ボタンをクリック。

音源の新規登録ウィンドウが表示されるので、しゃべらせたい音源の情報を入力していく。

音源の新規登録詳しい入力方法は唄詠のヘルプに譲るが、重要な項目は、「oto.ini の場所」「wavtool の場所」「resampler の場所」の 3 つだ。

oto.ini の場所には、しゃべらせたい UTAU 音源の oto.ini を指定する。サブフォルダにも oto.ini がある音源の場合は、音源の最上位フォルダの oto.ini を指定すると良い。サブフォルダの oto.ini も含めてすべて利用可能になる。

wavtool の場所と resampler の場所にはそれぞれ、UTAU に付属している wavtool.exe と resampler.exe を指定する。互換ツールでも OK だ。

各ファイルの指定は、参照ボタンからのダイアログで行ってもよいし、ドラッグ&ドロップで行ってもよい。

OK ボタンを押すと、UTAU 音源の情報が登録される。登録時、パソコンの管理者権限が必要なので、画面の指示に従って管理者のアカウント情報を入力する。

棒読みちゃん音源情報を登録したら、棒読みちゃんを起動する。唄詠との間で漢字を処理できる Ver 0.1.11.0 Beta 15 以降の棒読みちゃんがオススメだ。

声質を選ぶプルダウンメニューで、先ほど登録した UTAU 音源が選択できるようになっているはずなので、それを選ぶ。

後は、いつも棒読みちゃんを使っているのと同じように、読み上げさせたい文章を入力して再生ボタンを押すだけだ。

例として棒読みちゃんを挙げたが、SAPI 5 に対応したテキストスピーチソフトであれば、どんなソフトでも UTAU 音源をしゃべらせられるようになる。SofTalk やゆっくり MovieMaker なども利用可能だ。

【関連サイト】




ゆっくり MovieMaker が唄詠に対応

YMMゆっくり実況動画を手軽に作成するための支援ツール「ゆっくり MovieMaker」(以降 YMM)がバージョンアップされ、唄詠に対応して頂いた。

YMM では、ボイス(ゆっくり霊夢など)を選んでセリフを入力していくことで、タイムラインに簡単にセリフを貼り付けられる。

左下の「+」ボタンで新しいキャラクターを作成でき、声質として唄詠で登録した音源を選択できる。

今回の YMM のバージョンアップにより、漢字かな交じりのセリフも発音できるようになった。

YMM にご対応いただいたことにより、唄詠で漢字を利用できるアプリが 3 つに増えた。
  • 棒読みちゃん(Ver0.1.11.0 Beta15 以降)
  • SofTalk(Ver 1.93.5 以降)
  • ゆっくり MovieMaker(v3.4.3.0 以降)


唄詠 Ver 4.41 を公開

唄詠_Ver441自動 HANASU ツール「唄詠(うたよみ)」をバージョンアップ。

主な改良点は、
  • テキストスピーチソフトで音量や速度を変化させた際に追随するようになった。
  • 連続音音源での発声が滑らかになりました。

今回のバージョンで、ひとまず実用的に使えるレベルになったかなと思います。


ダウンロード:


唄詠 Ver 4.25 を公開

音源登録詳細UTAU 音源に自動的にしゃべらせるためのツール「唄詠」(うたよみ)をバージョンアップ。

ついに連続音音源に対応しました。連続音音源を登録すると、自動的に連続音のエイリアスを使ってしゃべります。

また、しゃべる際の音程と、resampler フラグを指定できるようになりましたので、好きな声質にしたり、g 変え音源でしゃべらせたりもできます。

ダウンロードおよび使い方は以下からどうぞ:

なお、今回のバージョンから、Windows XP 非対応です。XP の方は、Ver 3.29 β をご利用下さい。

唄詠 Ver 3.29 βを公開

テキストスピーチソフト(SofTalk や棒読みちゃんなど)の声として UTAU 音源を使えるようにするためのソフト、「唄詠」(うたよみ)をバージョンアップ。

"/" "ぁ" など一部の文字で始まる文章を読み上げたときに動作がおかしくなる現象を修正しました。

SofTalk_Prefsまた、今回は SofTalk 作者の cncc さんにご協力を頂き、SofTalk での読み上げを唄詠で行う際、漢字かな交じり文を抑揚付きで読めるようになりました。

まもなく公開される予定の SofTalk 最新版(Ver 1.93.5 以降)では、環境設定ダイアログの「声質」タブに、唄詠オプションが表示されます。

唄詠で音源を登録した後、SofTalk の声質設定で唄詠オプションにチェックを入れて下さい。自動的に平仮名と抑揚オプションもチェックが入ります。

注)旧バージョンの唄詠で登録した音源だと、唄詠オプションが有効にならない場合があります。今回のバージョンの唄詠で音源を登録してから SofTalk をご利用下さい。

その後 SofTalk のメインウィンドウで、声メニューから唄詠音源を選択し、文章を読み上げると、漢字かな交じり文も読み上げることができます。

多大なご協力を頂きました cncc さんにはこの場をお借りしてお礼申し上げます。

なお、上記以外の一部のバグ修正は、次回リリースに持ち越しとなっておりますのでご了承下さい。

唄詠リンク


唄詠 Ver 3.23 βを公開

唄詠_Ver323BetaUTAU 音源で文章を読み上げられるようにするためのソフト、唄詠(うたよみ)をバージョンアップ。

AquesTalk タグに対応し、AquesTalk 方式の発音記号を読み上げることができるようになりました。

唄詠_AquesTalk発音同じく AquesTalk タグに対応した棒読みちゃん Ver0.1.11.0 Beta15 以降と組み合わせることで、漢字かな交じり文を自動的に UTAU 音源で読み上げることができるようになります。

自動漢字読み上げ機能は、今回のバージョンの唄詠での UTAU 音源が必要なのでご注意下さい。旧バージョンの唄詠で登録した音源では漢字は読み上げられません。

漢字かな交じり文の読み上げは、棒読みちゃん作者のみちあきさんの多大なご協力により実現しました。この場を借りてお礼申し上げます。

唄詠のダウンロードは以下からどうぞ。


唄詠 Ver 3.03 β を公開

唄詠_Ver303BetaUTAU 音源で文章を読み上げるためのソフト、唄詠(うたよみ)の更新版をリリース。

前回と比べると、以下が改善されています。
  • 原音設定を解析して音声合成するようになったため、発音が滑らかになりました。前回は音が(全くまたはほとんど)出なかった音源でも、今回は出るのではと思います。
  • スペースを含むフォルダを扱えるようになりました。
  • その他、細々とした改良を行っています。


以下の点は、前回から変わっていません。

  • 単独音のみの対応です。
  • 読み上げできる文章は、ひらがなおよびカタカナのみです。
  • XML 形式での発音記号読み上げに対応しています。

下記動画およびヘルプファイルをよく読んでからご利用下さい。


対応 OS や動作確認済み UTAU 音源などもヘルプに記載してあります。


唄詠のダウンロードは以下からどうぞ。

動作した環境、動作しなかった環境を教えていただけると助かります。

唄詠 Ver 1.80 Developer Release を公開

唄詠_メインウィンドウ※新版を公開しました→こちら

UTAU 音源で文章を読み上げるためのソフト、唄詠(うたよみ)をリリース。

Ver 1.80 Developer Release。開発途上のバージョンです。読み上げがたどたどしい他、いろいろと制限があります。

必ず、下記動画およびヘルプファイルをよく読んでからご利用下さい。



対応 OS や動作確認済み UTAU 音源などもヘルプに記載してあります。

唄詠のダウンロードは以下からどうぞ。


唄詠(棒読みちゃんなどの声を UTAU 音源にする)の進捗

唄詠_設定画面新年明けましておめでとうございます。

テキストスピーチソフト(棒読みちゃんなどの、文章読み上げソフト)の声として、UTAU 音源を使えるようにするためのソフト、「唄詠」(うたよみ)を開発中。

とりあえず、UTAU 音源でごく原始的な読み上げができるところまで到達した。

唄詠は、大きく 2 つの部分から成る。

1 つ目の部分は、UTAU 音源の管理を行う設定画面。

所持している UTAU 音源をこの設定画面で登録することにより、テキストスピーチソフトで利用することが可能になる。

唄詠_新規音源登録(小春音アミ)音源登録は簡単で、上記の画面で「新規登録」ボタンをクリックすると、右の画面が開く。

音源に付属している oto.ini ファイルの場所など、必要事項を入力すれば、登録完了だ。

唄詠_TS音源選択登録が完了すると、テキストスピーチソフトの音源選択画面で、UTAU 音源が選択できるようになる。

設定画面はまだ、音源の新規登録と登録抹消の機能しか実装していないが、実装したところについては、内部もわりと真面目に作り込んである。

唄詠の 2 つ目の部分は、実際の読み上げ用の音声を合成する(HANASU)部分だ。こちらはユーザーの目には見えない、縁の下の力持ち的な部分になる。

最初に書いたとおり、ごく原始的な読み上げができるようになった段階。

ぱみゅ天月りよんで HANA せることを確認するところまで到達した。

しかしこちらはかなりの突貫工事状態なので、これから作り込んでいく必要がある。

以上が、現時点での唄詠の進捗状況。

文章だと伝わりづらい性質のソフトなので、いずれ動画を作成する予定。


カウンター


カンパのお願い
Amazon でお買い物の際は、下記で検索して頂けたら幸いです。
記事検索
最新コメント
  • ライブドアブログ