Amazon Polly は、文章をリアルな音声に変換するサービスです。Polly を使用すると、会話機能を搭載したアプリケーションを作成し、音声に対応したまったく新しいカテゴリの製品を構築することが可能になります。Polly は高度な深層学習テクノロジーを使用した Amazon AI サービスの 1 つで、人間の声のような音声を合成するサービスです。Polly には 24 の言語と 47 の音声が含まれているため、用途に最適な音声を選んで、多くの国で使える音声対応のアプリケーションを簡単に構築できます。
Amazon Polly は安定して応答時間が短いため、リアルタイムの対話が実現できます。Polly の音声はキャッシュして保存できるため、オフライン再生や再配布が可能です。また、Polly は簡単に使用できます。音声に変換するテキストを Polly API に送ると、すぐに Polly からオーディオストリームがアプリケーションに返され、アプリケーションでそれを直接再生することや、MP3 などの標準オーディオファイルとして保存することが可能です。
Polly では、音声に変換した文字数のみ請求されます。Polly によって生成された音声は保存および再生できます。Polly では、文字あたりの変換コストが低く、音声出力の保存と再利用に制限がないため、"Text-to-Speech" 機能をどこでも利用できる費用対効果の高い方法にします。
近日開催予定の Tech Talk に申し込み、AWS AI について専門家に質問して学習してください。
- 3 月 6 日 – 音声やテキストチャットボットを構築するサービスである Amazon Lex の紹介
- 3 月 27 日 – テキスト読み上げサービスである Amazon Polly を最大限に活用する方法
| 言語 | 女性 | 男性 | サンプルテキスト |
| 英語 | Joanna | Joey | Hello. Do you speak a foreign language? One language is never enough. |
| デンマーク語 | Naja | Mads | Hej. Taler du et fremmed sprog? Et sprog er aldrig nok. |
| ポルトガル語 (ブラジル) | Vitória | Ricardo | Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante. |
| スペイン語 | Penélope | Miguel | Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente. |
| アイスランド語 | Dóra | Karl | Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg. |
自然な声
Amazon Polly では、47 のリアルな声を 24 の言語でサポートしています。これには、さまざまなアクセントの男性と女性の声が含まれています。Polly はテキストを複数の言語で流暢に発音するため、高品質の音声出力を配信することや、世界中のユーザー向けのアプリケーションを作成することが可能になります。
統合が簡単
Amazon Polly を使用すると、ウェブサイト、モバイルアプリケーション、デバイスに簡単に声を追加できます。Polly では、スピーチに変換する文章を書いて Polly API に送信するだけで、すぐに Polly が音声ストリームを返します。長い承認プロセスを要する他のソリューションとは異なり、Polly では、Polly の音声をアプリケーションでどのように使用するかという説明や、販売契約への署名の必要がないため、すぐに使用を開始できます。
音声の保存と再配信
ロイヤルティーや以前に生成した音声を再生するたびに課金される他のソリューションとは異なり、Amazon Polly では追加料金なしで無制限に再生できます。オフラインでの再生も無料です。オフラインで再生するために、音声ファイルを MP3 や OGG のようなさまざまな標準のファイル形式で作成し、携帯電話や IoT デバイスなどのデバイスに保存できます。
低コスト
Amazon Polly は従量課金制で、文字あたりの変換のコストが低く、無制限に再生できるため、実質的にどのアプリケーションでも音声の合成を可能にする費用対効果の高い方法です。
応答が速い
リアルな声と会話型のユーザーエクスペリエンスの配信には一貫した速い応答時間が求められます。音声対応アプリケーションでは合成された音声をすぐに再生できることが必要です。ナビゲーション向けに音声案内を提供するアプリケーションや、生徒に口頭での指示を伝える e ラーニングアプリケーション、およびリアルタイムの対話を通してユーザーと関わるアプリケーションについて考えてみてください。これらのアプリケーションは、会話の流れの中で応答が知覚遅延なく開始できるときに最も効果的です。Polly の API に送信する文章が長くても、音声をアプリケーションにストリームとして返すため、直ちに声を再生できます。これらの種類の動的な音声による応答は、ユーザーのデバイスで一般的に保存できるものよりもはるかに大量の音声オーディオへのアクセスを必要とします。Amazon Polly はクラウド上にあるため、多種多様な合成音声にアクセスすることが可能です。Polly を使用すると、お客様のアプリケーションは、リアルタイムデータを含むさらに多くの価値ある応答を提供できます。
Amazon Polly を使用すると、ビデオ、プレゼンテーション、またはオンラインのトレーニングコースに音声を簡単に追加できます。Polly では音声を 24 の言語で生成できるため、世界中の利用者が使用するアプリケーションに声を追加することも簡単です。Polly を使用すると、RSS フィード、ニュース、E メールを読んだり、合成された音声をオーディオファイルの形式で保存したりできます。
Amazon Polly を使用すると、カスタマーコンタクトセンターは自然な声で応答できます。Polly の音声出力を音声自動応答 (IVR) システムを通して再生できます。さらに、Polly の API を活用して、サービスステータス、アカウントや請求書に関する問い合わせ、住所、連絡先情報のような自動化されたリアルタイムの情報を配信できます。
Amazon Polly では、音声の IoT デバイスへの追加を簡単にまた安価にすることで、新しい IoT ユースケースを可能にします。IoT デバイスは音声を使用して自然な応答と通知を提供するため、アプリケーションにアクセスしやすくなり、ユーザーは画面に頼ることなく情報を消費できます。Polly では、オフラインで再生するために、音声ファイルを生成してデバイスに保存できます。
AWS Lambda を使用して AWS IoT ルールエンジンからイベントに基づく署名付き Polly URL を生成し、デバイスゲートウェイを使用して URL を IoT デバイスに送信することによってリアルな音声をリクエストできるようにします。
新しい言語の話し方を教えるアプリケーションの利便性を向上させるために Amazon Polly を使用できます。例えば、エンドユーザーが外国語のフレーズをアプリケーションに入力すると、ネイティブスピーカーによる音声を聞くことができます。Polly では 24 の言語がサポートされているため、教師や生徒にはたくさんの選択肢があります。
Amazon Polly を使用すると、モバイルアプリケーションとモバイルゲームに簡単に声を追加できます。Polly では、標準の音声応答をデバイスに保存できるほか、ゲーム内のキャラクターの会話、順位表のランキング、ゲームの招待などの動的でリアルタイムの応答も利用できます。
Amazon Polly では、視覚障害者向けにアクセス可能な情報を合成音声の形式で作成して配信することができます。このことは、視力を失った方々がニュースや書籍、E メールのメッセージなどのさまざまなコンテンツを消費する助けになります。



