Browser

Microsoft Edge(Project Spartan, Internet Explorer) 、ブラウザ周辺、Web フロントエンド開発、UI、など

Microsoft Edge まとめページ

Microsoft Edge の Speech Synthesis API

Microsoft Edge Dev Blog に Speech Synthesis API の記事が掲載されました。
blogs.windows.com

以前、この blog 記事にしたものと近しいものです。
Microsoft Edge で Web Speech API の Synthesis(音声合成)が開発中に - Browser

 

内容を抜粋

Windows 10 Anniversary Update で Speech Synthesis API を標準でサポートし、 Web ページに音声のカスタマイズ可能な音声合成による読み上げを可能にします。

また、Edge では JavaScript 制御による Speech Synthesis API だけではなく、 Speech Synthesis Markup Language (SSML) Version 1.0 もサポートします。

Test Drive サイトに音声合成デモが掲載されました。 現在 EdgeHTML 14.14316 (Windows 10 シリーズの Insider Preview Build 14316) 以降で使用可能です。

f:id:x67x6fx74x6f:20160603150234p:plain Test Drive - Speech Synthesis

 

API の概要

Javascript は使用可能な音声を制御する属性と音声テキストを設定することができます。 SpeechSynthesisUtterance インターフェイスを定義し、言語と国ごとの発音、声、ボリューム、速度および音声出力のピッチ変更します。 その他のインターフェイスは、再生コントロールと合成音声の状態を監視することができます。

Microsoft Edge は以下の SpeechSynthesis インターフェイスを実装しています。

 

SpeechSynthesis インターフェイス
名称 機能
SpeechSynthesis 音声のコントロールと状態
SpeechSynthesisUtterance 音声コンテンツ、音声、発音
SpeechSynthesisEvent 現在の発声に関する情報
SpeechSynthesisVoice 音声サービスの情報

 

API 実装は、 WinRT の Windows.Media.SpeechSynthesis Api に基づいており、W3C の Speech Synthesis インターフェイスのほとんどをサポートします。
実装していない機能については今後サポートされる予定とのことです。

名称 機能
Playback pitch 再生時に音声のピッチを変更
onmark イベント マークされているタグに達している場合呼ばれる
onboundary イベント 話されている単語や文の区切りに達している場合呼ばれる

 

SpeechSynthesis API のサンプル

gist.github.com

 

Speech Synthesis Markup Language (SSML) のサンプル

W3C 仕様の JavaScript SSML

gist.github.com

 

SSML の XML コンテンツ Test Drive のデモのテキストボックスにペーストするとこの設定で再生するようです。

gist.github.com

 

言語について

Windows 10 でのテキスト読み上げではインストールされている言語のみ再生することができ、 通常は日本語なら日本語、英語なら英語と、プライマリに設定されている言語がインストールされているはずです。

追加したい場合は設定アプリを開き、

「時刻と言語」の「地域と言語」で言語を増やしてください。

 

スポンサーリンク