Голосовые движки – это программное обеспечение, синтезирующее человеческую речь. Их используют для прослушивания книг, любой иной текстовой информации, на их базе работают голосовые ассистенты. Синтезированной речи пока что далеко до речи человека, голосовые движки ещё не могут передавать выражение, постановку акцентов, эмоции. Тем не менее они несут в себе решение для людей с аудиальным типом восприятия информации. Технология синтеза речи давно уже присутствует в среде Windows, более того, система поставляется со своими голосовыми движками. Эту технологию мы даже можем использовать при веб-сёрфинге для прочтения веб-публикаций в окнах браузеров. Не все браузеры поддерживают такую возможность, но у современных популярных она точно есть. Что это за браузеры? И как в них реализовано воспроизведение веб-публикаций голосовыми движками?
Браузеры с функцией воспроизведения текста голосовым движком
1. Microsoft Edge
Microsoft Edge – родной браузер Windows 10 – во многом ещё далёк от уровня и потенциала Chrome и Firefox, но компания Microsoft активно совершенствует этот продукт. И в нём есть возможность воспроизведения текста синтезированной речью. Необходимо выделить блоком первое слово места, с которого нужно начать читать, и, собственно, запустить саму эту функцию.
Функция предусматривает отслеживание воспроизведения - синим блоком выделяется читаемый участок, жёлтым маркером отсвечивается конкретное воспроизводимое слово. Более эффектно отслеживание работает в режиме чтения Edge: здесь вся страница затеняется лёгкой вуалью, нетронутым остаётся только отслеживаемый блок.
Более того, в этот режим встроено иммерсивное средство чтения – специальный набор опций для обучения детей чтению, который компания Microsoft, заботясь о подрастающем поколении своих пользователей, нынче активно внедряет в свои продукты. Эти средства в комплексе с синтезированной речью можно использовать не только для обучения детей, но и для упрощения изучения взрослыми иностранных языков.
При воспроизведении текста можем переключаться на следующий/предыдущий абзац публикации кнопками «Next/Previous» или кликом мыши указывать конкретные места, с которых нужно начать читать. Речь настраивается: можем менять её скорость и выбирать голос диктора.
Минус Microsoft Edge заключается в том, что он позволяет воспроизводить текст только штатными движками Windows – мужским голосом Павла или женским Ирины. Они неплохи, но всё же далеки от идеала. Сегодняшний рынок IT-технологий может предложить более качественные решения, в том числе и в части русскоязычной синтезированной речи. Платные качественные движки, внедряемые в среду Windows, есть у компаний Acapela Group, Loquendo, Ivona. Но, увы, любые сторонние голосовые движки не поддерживаются браузером Edge. Зато их поддерживают другие веб-обозреватели.
2. Mozilla Firefox
Давно уже Mozilla Firefox хочет попасть в разряд браузеров «из коробки». Оставаясь по-прежнему дополняемым расширениями браузером, он тем не менее предусматривает ряд нативных пользовательских функций, причём реально годных функций. Одна из них – встроенный режим чтения с поддержкой воспроизведения текста. Воспроизводимая речь настраивается в части выбора скорости и голосового движка. Из таковых - встроенный в Windows диктор Ирина и установленные в систему сторонние движки. Воспроизведение можно переключать на следующий/предыдущий абзац кнопками «Next/Previous».
Воспроизводимый текст отслеживается выделением блоком читаемого абзаца и отметкой конкретного слова движимым курсором в виде нижнего начертания.
3. Google Chrome и Chromium-браузеры
В числе нативного функционала Google Chrome нет ни функции воспроизведения речи, ни даже родного режима чтения. Но всё это легко можно организовать, установив в сам Chrome и браузеры на базе Chromium-платформы, которые работают с магазином контента Chrome, специальные расширения. Что это за расширения?
Reader View
Расширение Reader View – это реализуемый в браузерах Chrome, Firefox и Opera режим чтения с поддержкой функции воспроизведения текста. В Firefox и в Опере это расширение реализует точно такие же возможности, как и штатный режим чтения Firefox – отслеживание воспроизводимого текста, выбор скорости, кнопки переключения между абзацами. Более того, расширение Reader View в части реализации самого режима чтения схоже с этим режимом, встроенным в Firefox.
Расширение также позволяет выбирать голосовые движки из числа встроенного в Windows диктора Ирины и сторонних установленных в системе голосов. А вот в реализации для браузера Chrome Reader View может предложить ещё и дополнительные движки – качественную русскоязычную речь, разработку компании Google и голоса для других языков.
Для английского языка же и вовсе дополнительно поддерживаются движки iSpeech и SpeakIt!, работающие не на уровне Windows, а внутри самого Chrome за счёт реализации другими расширениями, например, SpeakIt!. Кстати, о нём.
SpeakIt!
Расширение SpeakIt! – это не режим чтения с функцией отслеживания текста, механизм воспроизведения текста здесь достаточно примитивный. Просто выделяем блоком текст, который нужно прочитать, и стартуем функцию. Далее всё, что можем сделать с этим процессом – это приостановить или выключить его.
Расширение SpeakIt! имеет внушительный перечень поддержки движков – как системных, так и реализуемых собственными средствами. Правда, для русского языка выбор невелик: родной диктор Windows Ирина, установленные в систему сторонние голоса и фирменный движок Google.
Ранее этот перечень был шире за счёт реализации ещё двух русскоязычных дикторов в составе движка iSpeech. Сейчас они почему-то не работают, но, возможно, ситуация поправится в будущем. Благо, расширение позволяет имеющиеся голоса моделировать на свой вкус - настраивать не только их скорость, но также высоту.