ブラウザの音声合成と当サイトの音声を比較してみました

ブラウザの読み上げ

2021年2月現在、Microsoft Edge、FireFox、Chrome、Safari、iOSのSafari、Chrome for Androidであれば、ブラウザ自身に音声合成(読み上げ)機能が搭載されています。 この機能を使って読み上げサービスを提供しているサイトもありますが、生成された音声はいかにも、コンピューターで作った感じの機械的な音質で棒読みになります。 ダウンロードもできませんので、用途は限られてしまいますね。

用いた例文は新幹線のアナウンスです。ブラウザで合成した音声を再生するには、「ブラウザが合成した音声を読み上げる」ボタンを押してください。 便利な機能ではあるのですが、残念なことに全体的に文章のイントネーションが不自然です。 致命的なのは、普通車を「ふつうグルマ」、1号車を「1号グルマ」と読み上げています。訂正する手段はありません。 下記文章を書き換えると、その文章の読み上げます。ご自由にご利用ください。

本サイトの読み上げ

いっぽう、本サイトの読み上げ機能は、Amazonのサービスを使用しており、自然な発話に近い音声となります。 Amazonによると、高度なディープラーニング技術を使用しているとあり、自然に聞こえるように人間の音声を合成しているそうです。 下記の再生ボタンを押すと当サイトで合成した音声を再生できます。 SSMLという音声用の記述で作成しました。 一部イントネーションがおかしい単語がありますが、読み方は間違っておらず、ブラウザで合成した音声よりかなりマシな印象です。