読み上げ(テキスト→音声変換) 実物サンプル一覧

本Webサイトの読み上げ機能を使って、テキストを音声に変換したサンプルを載せていますので参考にしてください。 作り方は大きく2つあります。ひとつは、単純にテキストを音声に変換する方法です。もうひとつは、音声合成マークアップ言語 (SSML:Speech Synthesis Markup Language)を使って、音声を生成する方法です。 音声ファイルは、2021年1月時点の変換結果です。今後、AI(人工知能)が進化すれば、よりリアルになることが予想されます。

単純にテキストを音声に変換した例

下記のように単純なテキストを入力するだけで、人間のような自然に聞こえる音声を合成します。 単純なテキストを読み上げる場合は、読み上げページを使用してください。

今日も、新幹線をご利用くださいまして、ありがとうございます。この電車は、のぞみ号、東京行きです。途中の停車駅は、京都、名古屋、新横浜、品川です。続いて、車内のご案内をいたします。自由席は、1号車、2号車、3号車です。この電車は、全席、禁煙となっております。お煙草を吸われるお客様は、喫煙ルームをご利用ください。普通車の喫煙ルームは、3号車、7号車、15号車、グリーン車の喫煙ルームは、10号車にあります。車掌室は、8号車です。

よりリアルな音声に変換した例

音声合成マークアップ言語 (SSML:Speech Synthesis Markup Language)を使って、文章を記述するとリアルな音声に変換できます。 テキスト全体を<speak>と</speak>タグで囲む必要があります。使い方は、下記のサンプルを参考にしてください。 SSMLを音声に変換する場合は、SSML読み上げページを使用してください。

休止したい場所に<break time="xxxx">タグを挿入します。timeで休止時間を指定します。単位は秒(s)かミリ秒(ms)を指定してください。以下は、時間の書き方の例です。
・250ms
・0.5s
・3s
・10s
・10000ms

強調したい単語を、 <emphasis level="xxxx">タグで囲みます。単語を強調すると、話す速度と音量が変わります。 強調を大きくするほど、テキストを大きくゆっくり発声します。強調を小さくするほど、小さく速く発声します。 強調のレベルは以下の3つです。
・strong (強い強調)
・moderate(やや強調)
・reduced(控えめ)

ボリュームを変更したい部分を、 <prosody volume="xxxx">タグで囲みます。 ボリュームは、以下の定義された値に変更できます。
・default(ボリュームを現在の音声のデフォルトレベルにリセット)
・silent(無音)
・x-soft(小さい)
・soft(やや小さい)
・medium(普通)
・loud(やや大きい)
・x-loud(大きい)
+ndB , -ndBで相対的にボリュームを変更することができます。+6dBで現在のボリュームの約 2 倍、-6dB で現在のボリュームの約半分になります。

スピードを変えて話したい部分を、 <prosody rate="xxxx">タグで囲みます。スピードは以下の5種類です。
・x-slow(ゆっくり)
・slow(ややゆっくり)
・medium (普通の速さ)
・fast(やや早い)
・x-fast(早い)
80%のように、話す速度を正のパーセンテージで変更することもできます。この値の範囲は 20 ~ 200% です。

音程を変えて話したい部分を、<prosody pitch="xxxx">タグで囲みます。音程は以下の5種類です。
・x-low (低い)
・low(やや低い)
・medium (普通)
・high(やや高い)
・x-high(高い)
+5% または -5%のように、相対パーセンテージを使用して音程を変えることもできます。

ささやき声にしたい部分を、 <amazon:effect name=”whispered”>タグで囲みます。

一時停止したい文章を <s>タグで囲んでください。詩などに有効なタグです。読点がある場合は、<s>タグがなくても一定時間休止します。

呼吸音を入れる場所に <amazon:breath>タグを挿入してください。長さと呼吸音のボリュームは、それぞれ5種類です。mediumは省略できます。
・x-short (短い)
・short(やや短い)
・medium (普通)
・long(やや長い)
・x-long(長い)
ボリュームは、以下の5種類です。
・x-soft (小さい)
・soft(やや小さい)
・medium (普通)
・loud(やや大きい)
・x-loud(大きい)

自動的に呼吸音を入れる場合は、その部分を <amazon:auto-breaths>タグで囲んでください。頻度は6種類です。
・default
・x-low
・low
・medium
・high
・x-high

発音(読み方)を指定する場合は、その部分を <sub>タグで囲んでください。

入力テキストを通常の音声よりも柔らかく発声する場合は、その部分を<amazon:effect phonation="soft">で囲んでください。 下記は、同じ文章を比較した例です。

ダイナミックレンジ圧縮を追加し、はっきりと聞こえやすくする場合は、その部分を<amazon:effect name="drc">で囲んでください。 下記は、同じ文章を比較した例です。

男性A、女性AでサポートしているSSMLタグについては、こちら
男性BとC、女性BとCの読み上げでサポートにしてるSSMLは、こちら
男性D、女性Dの読み上げでサポートにしてるSSMLは、こちら