По мере развития технологии распознавания голоса, программное обеспечение для преобразования речи в текст и транскрипции стало стремительно развиваться. Оно имеет широкий спектр применений: от помощи людям с ограниченными возможностями, помощи в изучении языков до использования журналистами при длинных интервью. Здесь мы рассмотрим некоторые из лучших программ для преобразования текста.
1. Dragon Naturally Speaking
Dragon Naturally Speaking (DNS) от Nuance представляет собой программное обеспечение для распознавания речи, доступное на восьми языках. Оно с 99% точностью преобразовывает текст и признано одним из самых точных программных продуктов на рынке. DNS включает голосовые команды, которые позволяют пользователям форматировать и редактировать текст с помощью голоса. Он может быть запущен на Windows и Mac, а также на устройствах iOS и Android.
DNS объединяет свои голосовые команды и функции редактирования, чтобы гарантировать, что текст предоставляется так же, как пользователь произносит речь, с определенными пунктуацией и параметрами форматирования.
Новейшая версия программного обеспечения DNS доступна в домашней, премиальной и профессиональной версиях, причем последняя позволяет пользователям импортировать и экспортировать пользовательские списки слов, чтобы добавлять любые конкретные слова и сокращения, которые могут отсутствовать в словаре. Nuance взимает 100$ за Home Edition, 155$ за премиум, а профессиональная версия начинается с 350$.
2.Transcribe (Wreally)
Автоматический Transcribe легко конвертирует ваши записи в текстовые файлы. Однако, если качество звука нечеткое, вы также можете замедлить текст и прочитать его вслух, и программное обеспечение уловит то, что вы говорите для ряда языков. Вы можете использовать приложение для ручной расшифровки, воспроизводя звуковой файл в программном обеспечении.
Базовый пакет стоит 20 долларов в год (есть бесплатная альтернатива oTranscribe) и 6 долларов за 60 минут автоматической транскрипции.
3. IBM Speech to text
Вы можете бесплатно попробовать IBM Watson до 100 минут бесплатного ввода аудио в месяц. Полный пакет предлагает автоматическую транскрипцию в режиме реального времени на семи языках, даже для звука низкого качества с мощной технологией распознавания речи.
Это программное обеспечение разработано так, чтобы его можно было адаптировать и масштабировать для множества различных вариантов использования, от транскрипции в реальном времени с микрофона до анализа тысяч записей из колл-центра. Стандартная версия предлагает первые 1000 минут бесплатно, а после этого взимается плата от 1 до 250 000 минут по цене 0,02 доллара в минуту.
4. Amazon Transcribe
Amazon Transcribe - это сервис автоматического распознавания речи, основанный на глубоком обучении. Он лучше всего подходит для разработчиков, которые захотят добавить текст в свои приложения. Его также можно использовать для расшифровки аудио- и видеофайлов, в том числе подробных стенограмм службы поддержки клиентов.
Встроенный API прост в использовании и обеспечивает быструю передачу стенограмм из файлов, хранящихся в Amazon S3. Он также включает временную метку для каждого слова, а также возможность настроить словарь для добавления любых новых слов или аббревиатур, которые могут отсутствовать там. Amazon Transcribe предоставляет бесплатную версию до 60 минут в месяц в течение одного года, после чего цена составляет 0,0004 долларов в секунду.
5. Temi
Temi использует автоматизированное программное обеспечение для транскрипции текста. Приложение позволяет пользователям делать записи, редактировать и делиться ими. Он доступен в магазине приложений Apple и в Google Play для бесплатного скачивания. Стоимость стенограммы составляет $ 0,10 в минуту. Это включает в себя пользовательские метки времени, идентификацию ораторов и возможность экспортировать стенограммы в MS Word и другие форматы непосредственно из приложения.
6. Windows speech recognition
Распознавание речи Windows (WSR) предлагает распознавание речи для Microsoft Windows. Функция преобразования речи в текст позволяет пользователям диктовать текст в документах и сообщениях электронной почты. Он доступен на восьми языках, включая английский, испанский и китайский.
Поскольку WSR автоматически встроен в ОС Windows, дополнительная плата за доступ к программному обеспечению для распознавания речи отсутствует.
7. SoundWriter
Распознавание речи SoundWriter - это программное дополнение для голосового набора и распознавания речи для документов Google. Если у пользователей установлен микрофон, SoundWriter можно использовать для записи всех файлов Google Doc на любом языке. Он также включает в себя пользовательскую конфигурацию, которая предоставляет возможность добавлять слова в виде команд, а также любые конкретные символы и стили пунктуации.
Хотя он работает только с браузером Google Chrome, SoundWriter может быть хорошим вариантом для постоянных пользователей Документов Google. Он также имеет встроенный голосовой набор и доступен для бесплатного скачивания.
0 комментариев
Добавить комментарий