Amazon Transcribe – это сервис автоматического распознавания речи (ASR), благодаря которому разработчики могут просто добавлять в свои приложения возможности преобразования речи в текст. API Amazon Transcribe позволяет анализировать аудиофайлы, хранящиеся в Amazon S3, и получать текстовые файлы с расшифровкой речи.
Amazon Transcribe может применяться для решения широкого круга стандартных задач, включая расшифровку телефонных обращений в службу поддержки и создание субтитров для аудио- и видеоконтента. Сервис распознает файлы в стандартных аудиоформатах (WAV, MP3 и др.) и указывает в тексте временную метку для каждого слова, что позволяет с легкостью найти нужный фрагмент в исходной аудиозаписи. При этом Amazon Transcribe постоянно обучается и развивается вместе с языком.
Основные возможности
Простой в использовании API
API Amazon Transcribe упрощает преобразование речи в текст. Для этого не нужно создавать сложные программы. Всего несколько строк кода для вызова API – и Amazon Transcribe выдаст текстовую расшифровку аудиофайлов, хранящихся в Amazon S3.
Поддержка разнообразных примеров использования
Сервис Amazon Transcribe формирует точные и автоматизированные расшифровки аудиозаписей различного качества. Он позволяет создавать субтитры для любых видео- или аудиофайлов и даже расшифровывать записи телефонных разговоров низкого качества, например телефонные обращения в службу поддержки.
Удобочитаемые расшифровки
Большинство систем распознавания речи выдает текст одной строкой без знаков препинания. Amazon Transcribe применяет технологии глубокого обучения для автоматического форматирования и расстановки знаков препинания. Итоговый текст гораздо проще читается и готов к использованию без редактирования.
Настраиваемый словарь
Amazon Transcribe позволяет дополнять и редактировать словарь для распознавания речи. В базовый словарь можно добавлять новые слова для получения максимально точных расшифровок в любых примерах использования сервиса, например названия продуктов, специальную терминологию или имена отдельных лиц.
Временные метки
Amazon Transcribe указывает в тексте временную метку для каждого слова, что позволяет с легкостью найти нужный фрагмент в исходной аудиозаписи.
Распознавание говорящих
Amazon Transcribe может распознавать смену говорящего и вносить в текст соответствующие метки. Это существенно облегчает работу по расшифровке телефонных разговоров, совещаний, телепередач и других аудиозаписей с несколькими участниками.
Примеры использования
Amazon Transcribe можно использовать для решения широкого круга задач по распознаванию речи в различных областях, включая деятельность служб поддержки клиентов, подготовку субтитров, поиск информации и обеспечение соответствия требованиям.
Повышение качества обслуживания клиентов
Возможность преобразования речи в текст позволяет создавать на основе Amazon Transcribe приложения для анализа текста с функцией поиска и анализа голосовой информации. В контактных центрах Amazon Transcribe может применяться для расшифровки телефонных разговоров с клиентами и последующего анализа этих данных с помощью других сервисов AWS, например Amazon Comprehend, для понимания смысла и цели разговора.
Рабочие процессы подготовки субтитров
Создатели и распространители мультимедийного контента могут использовать Amazon Transcribe для автоматического создания субтитров с временными метками. Показ видео с субтитрами делает материал доступнее и расширяет охват аудитории.
Каталогизация архивных аудиозаписей
Сервис позволяет создавать на основе аудио- и видеозаписей архивы с возможностью полнотекстового поиска для управления рисками и обеспечения соответствия требованиям. Клиенты могут использовать Amazon Transcribe для преобразования речи в текст, чтобы затем с помощью сервиса Amazon Elasticsearch выполнять индексирование и текстовый поиск по всей библиотеке аудио- и/или видеоматериалов.
Клиенты Amazon Transcribe
Подробнее о ценах на Amazon Transcribe