Многие пользователи не только читают книги, но и слушают их аудиоверсии. Это бывает удобно в транспорте или в фоновом режиме, а для кого-то речь профессионального диктора и вовсе заменила текст. Спрос на такие версии растёт: более 80% пользователей Букмейта (книжный сервис Яндекс Плюса) хоть раз обращались к аудиоформату для знакомства с литературой.
К сожалению, далеко не для всех книг такие версии существуют, но мы придумали, как помочь пользователям. В Букмейте появился виртуальный рассказчик. Он позволяет в режиме реального времени слушать книги, у которых нет предзаписанных аудиоверсий. На данный момент рассказчик доступен для 13 000 книг.
Виртуальный рассказчик создан специально для чтения книг вслух. Он разработан на базе комплекса речевых технологий Яндекса с привлечением профессиональных дикторов. Воспроизведение текста максимально приближено к естественной речи, поэтому читателю комфортно слушать произведения на протяжении долгого времени.
Если бы требовалось просто озвучить короткий текст, то можно было взять любое из существующих внутри Яндекса готовых решений и получить неплохой результат. Но литературные произведения — это не реплика в чате, тут есть тонкости.
Текст в книгах может содержать самые необычные сокращения. Их нужно корректно раскрыть, чтобы наша модель синтеза речи сумела их прочитать. Необычные и редкие аббревиатуры, названия и термины тоже нужно уметь произносить с правильной расстановкой ударений. Для всего этого есть этап предобработки текста. И для этого этапа у нас уже была специальная модель препроцессинга, но мы обучили новую, добавив в датасет примеры, которые собрали из книг.
Другая особенность книжной подачи текста — плавные переходы между предложениями и сохранение единой интонации на
технологии
Яндекс
книги
самит
интересное