Голосовой движок svox classic tts 2.0. Экранный диктор для андроид или смартфон для незрячего
Разработчики приложения Svox Russian Katja Voice решили осуществить мечты сотен тысяч человек – создать программу, которая будет читать требуемые тексты сама и вслух. И да, безусловно, приятным голосом. Приложение Svox Russian Katja Voice работает на платформе Android и доступно для всех без исключения мобильных устройств (планшеты, смартфоны). Эта библиотека чтения текстов голосом теперь доступна на русском языке. Примечателен тот факт, что несмотря на название программы, голосов в ней целых два–мужской и женский. Работа с сервисом происходит очень просто. При запуске программы на экране можно прочесть следующее сообщение: "Привет, я Катя. Введите текст, и я прочитаю Ваш текст вслух". После непосредственного ввода требуемой информации либо загрузки необходимого документа, книги, отрывка, а также манипулирования с настройками приложение начинает "говорить". Вернее, читать вслух то, что ввел пользователь.
Особенности программы:
- высокое качество чтения текстов;
- мужской и женский голоса "Катя" и "Юрий";
- четкая и правильная дикция, приятный тембр голоса;
- настройка необходимых параметров осуществляется вручную либо автоматически;
- возможность изменения скорости воспроизведения информации и громкости, а также повышение и понижение тона;
- возможность интеграция с GPS, в результате чего ваш телефон превращается в полноценный навигатор, указывающий правильный путь с помощью голосовых команд;
- возможность использования сервиса с другими приложениями (программа способна читать вслух входящие сообщения или оповещать о входящих звонках и прочих уведомлениях);
- в последней версии программы присутствует возможность коррекции произношения;
- простой и понятный дружественный интерфейс;
- постоянное обновление и поддержка со стороны разработчиков.
С приложением Svox Russian Katja Voice процесс прослушивания любимых книг и важных документов превращается в сплошное удовольствие.
Приложения-синтезаторы речи – удобные и надежные помощники для Андроид пользователей. С их помощью можно «озвучить» приложения на самые популярные языки мира, настроить тембр голоса и другие важные параметры, а также , прослушивать звучание разных слов. Большинство TTS приложений для Android доступны бесплатно, однако за установку отдельных голосов и функций нужно доплатить. Мы подобрали для вас наиболее удобные синтезаторы речи, скачать которые можно на нашем сайте.
Синтез речи от Google
Жанр | Инструменты |
---|---|
Рейтинг | 4,1 |
Установки | 1 000 000 000–5 000 000 000 |
Разработчик | Google LLC |
Русский язык | есть |
Оценок | 1 107 289 |
Версия | 3.14.9 |
Размер apk | 14.7 MB |
Наиболее популярная и доступная TTS-утилита, совместимая со многими Андроид-девайсами. С помощью программы вы можете озвучивать текст на экране, а также выполнять ряд важных функций:
- Озвучивать книги приложения Google Play Книги.
- Переводить и озвучивать слова из .
- Включать голосовые подсказки при помощи сервиса TalkBack.
Активировать приложение Синтез речи от Google можно прямо на своем девайсе. Для этого откройте пункт меню «Настройки», где зайдите в подраздел «Язык и методы ввода», а там – «Синтез речи». Выберите систему синтеза речи от Google, после чего приложение активируется автоматически.
Программа поддерживает более 40 языков, среди которых английский, русский, французский, немецкий, японский, испанский, датский, хинди и много других. В последней версии утилиты добавлено 3 новые языка – румынский, эстонский и словацкий, а также улучшено качество голоса в целом.
Acapela TTS Voices
Жанр | Связь |
---|---|
Рейтинг | 3,5 |
Установки | 100 000–500 000 |
Разработчик | Acapela Group S.A. |
Русский язык | нет |
Оценок | 3 883 |
Версия | 6.0.0.2 |
Размер apk | 9.3 MB |
Еще один качественный синтезатор речи на Андроид, который доступен на нашем портале. Программа является условно бесплатной, при этом перед тем, как купить приложение, вы можете прослушать демо-версии мужских и женских голосов в режиме онлайн. Утилита позволяет покупать и устанавливать программы с голосом высокого качества, такие как Google TalkBack, переводчики и озвучивания новостей.
Для выбора и установки голоса в приложении войдите в меню, после чего нажмите на голос и удерживайте несколько секунд. Возле выбранного голоса появится значок желтой звезды, и он будет установлен по умолчанию. Теперь вы можете использовать эту программу с вашей любимой читалкой книг.
Приложение Acapela TTS Voices можно активировать следующими действиями.
- Загрузите сервис на нашем сайте или портале Google Play.
- После установки приложения кликните на иконку программы. Убедитесь в наличии Интернет-соединения.
- Ознакомьтесь со списком голосов, которые загружены с сервера.
- Нажмите на меню напротив каждого голоса, где можно прослушать собственный текст или сразу перейти к покупке.
- После покупки и оплаты голос будет загружен, и вы сможете пользоваться им в любое время.
Приложение Acapela TTS Voices совместимо с ОС Android 2.2 и более поздними версиями.
Vocalizer TTS Voice
Жанр | Работа |
---|---|
Рейтинг | 3,3 |
Установки | 500 000–1 000 000 |
Разработчик | Code Factory |
Русский язык | есть |
Оценок | 3 405 |
Версия | 2.0.8 |
Размер apk | 5.4 MB |
Синтезатор речи с меню на английском языке. Программа обладает интегрированным TTS-движком, поддерживающим более 50 языков. Сервис выгодно выделяется приятным и чистым звуком, тембр которого можно настраивать на свое усмотрение.
Vocalizer позволяет озвучить популярные Андроид-приложения, такие как книги, и реабилитационное программное обеспечение.
Среди других важных функций Vocalizer TTS Voice стоит отметить:
- Поддержка 50 языков и 100 видов голоса.
- Поддержка эмоцзи (а вы знали, что есть ?).
- Озвучивание слов в словарях.
- Настройки скорости чтения.
- Настройки озвучивания пунктуации.
После того, как программа будет установлена на вашем устройстве, вы можете активировать ее через меню настроек в разделе «Язык и методы ввода» – Text-To-Speech и установить Vocalizer TTS как систему по умолчанию.
Приложение совместимо с системой Android версии 4.0 и далее.
Если вам понравилось это приложение, и вы ищете похожие приложения – посмотрите обзор . А если вы в незнакомой стране, и вам не до озвучки текста, вам нужно перевести этот текст – вы можете сфотографировать его и перевести .
Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.
В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.
Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.
Для удобства разделим движки TTS на три класса:
- коммерческие;
- свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
- встроенные (средства, предоставляемые самой операционной системой).
Коммерческие движки
SVOX Mobile TTS
Цена: n/a
Языки: 26, включая русский
высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW
Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт - SVOX Mobile TTS . Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.
Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт . Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.
Отмечу, что Acapela предоставляет «облачный» синтез речи , а так-же портирование SDK под любую платформу.
Свободные движки
Flite
Цена: нетЯзыки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)
В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile , PalmOS, Android и .
Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить .
ESpeak портирован на Android . Самый простой способ его попробовать - это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.
Встроенные решения
Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).Symbian
Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть
Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.
Дополнительные языковые пакеты можно загрузить , однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.
Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти
Для незрячих и слабовидящих пользователей устройств на системе Android основным источником информации о происходящем на экране является синтезатор речи. До тех пор, пока поддержка тактильных дисплеев не будет окончательно разработана и отлажена, имеет большое значение для пользователей с особыми потребностями.
Для ОС Android выпущено много синтезаторов речи, однако поддержка русского языка обеспечена далеко не у всех. Основная проблема – многоязычные тексты, с которыми некоторым голосовым движкам трудно справиться. Рассмотрим основные TTS системы.
Acapela TTS Voices
Один из самых популярных мультиязычных синтезаторов речи от Acapela Group доступен и для Android. Для синтезированных голосов характерно высокое качество речи и хорошая стабильность работы.
Движок Acapela TTS Voices можно без проблем найти и установить из Play Market. Программа бесплатная, но после ее первого запуска будет предложено купить и установить русский голос «Alyona» стоимостью 3,99 €.
SVOX Classic TTS
На втором месте среди коммерческих движков стоит SVOX Classic TTS. Синтезированная речь неплохого качества, но программа иногда не распознает заглавные латинские буквы. Также возникают вопросы в чтении цифр.
На Play Market есть бесплатная триальная версия русского голоса, которую можно свободно загрузить и протестировать в течение 2 недель.
eSpeak
Благодаря группе Eyes-Free Project на ОС Android, начиная с версии 1.6, был портирован кроссплатформенный Open-Source синтезатор eSpeak, поддерживающий русский язык. По сравнению с коммерческими программами, скорость и качество речи не сильно велики, но вполне приемлемы.
Первоначальная настройка
Установив TTS, нужно произвести его первоначальные настройки. Идем в такой последовательности:
- «Настройки»;
- «Язык и клавиатура»;
- «Синтез речи».
Использование экранного диктора
Для Android версии 3.2 и выше разработчиками Google выпущена утилита TalkBack , по функционалу напоминающая «Экранный диктор» для Windows. Начиная с Android Jelly Bean, приложение переустанавливается в систему и активируется из «Настройки» – «Специальные возможности». Для запуска следует передвинуть ползунок в положение «On».
Функции программы TalkBack:
- Перечисление элементов на мониторе с одновременным их описанием;
- Голосовые уведомления о происходящих событиях;
- Уведомление о звонках и SMS-сообщениях;
- Аудио и вибрационный отклик от устройства.
В своей работе утилита использует интерфейс TTS, установленный в системе по умолчанию. И хотя TalkBack уже относится к системным программам, она все же имеет один недостаток – для первоначальной активации нужен визуальный контроль, поэтому позаботьтесь о присутствии друга или члена семьи при первом знакомстве с приложением!
Управление Android-устройством с помощью TalkBack
Для девайсов с Android 4.0 и старше возможно управление с помощью прослушивания элементов экрана, которые находятся непосредственно под пальцем при его движении. Для этого в настройках TalkBack следует включить опцию «Изучение касанием».
После включения запустится демонстрационный ролик в двух частях, позволяющий обучиться.